首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏前端实验室

    一款让OCR识别正确率趋近100%的库

    今天大师兄给大家分享一个开源的 OCR 识别库:Tesseract.js。 从此可以摆脱某些 OCR API 的调用次数限制问题了。 前言 Tesseract.js 一个 纯Javascript编程语言的 ocr 识别库,简单实用。 实时OCR: 安装 Tesseract.js 已经迭代了很多版本了。它可以在在 html 页面上通过 script 标签引入CDN 外链使用 <! yarn add tesseract.js # For v2 npm install tesseract.js@2 yarn add tesseract.js@2 这里要注意下环境问题:Tesseract.js import Tesseract from 'tesseract.js'; Tesseract.recognize( 'https://xxx/img/eng_bw.png', 'eng',

    4.2K30编辑于 2022-12-02
  • 来自专栏开源小分队

    我不信,这个项目 OCR 识别准确率居然能这么高!

    那么,今天大叔给大家分享一个开源的 OCR 识别库:Tesseract.js。 简介 Tesseract.js是基于Tesseract的一个纯 Javascript 编程语言的 ocr 识别库,简单实用。 这意味着,Tesseract.js同样能够继承如此牛逼的、接近100%的、超高准确率。 目前 Github 上收获28.6k+ star 效果展示 图片识别 : 视频实时识别 安装 Tesseract.js可以在浏览器和具有 Node.js 服务器上安装使用。 在浏览器中,可以直接在 html 页面上通过 script 标签引入CDN 外链使用: 在 Node.js 中则输入如下代码: 注:Tesseract.js v3 要求 Node.js 的版本在 v14

    3.4K10编辑于 2022-12-07
  • 来自专栏网络日志

    Node.js识别图片验证码

    然后记住安装路径设置一下环境变量 Windows搜索框搜索:查看高级系统设置,点击环境变量,设置名称为TESSDATA_PREFIX的环境变量值为安装后的路径下面的tessdata文件夹 image.png 程序编写 我们使用tesseract.js 图片地址:报名验证码地址 let Tesseract = require("tesseract.js") Tesseract.recognize( 'https://www1.nm.zsks.cn

    4.6K30编辑于 2022-07-06
  • 来自专栏趣谈前端

    图像OCR技术实践,让前端也能轻松上手图像识别

    Tesseract.js:Tesseract 的 JavaScript 版本,支持一百多种语言,可使用 npm 安装或在页面中直接引用 js。 首先我们需要安装tesseract.js: yarn add tesseract.js 其次来看看我写的一个业务代码: const fileData = await req.formData(); const

    1.4K10编辑于 2024-06-18
  • 来自专栏爬虫资料

    视觉分析开发范例:Puppeteer截图+计算机视觉动态定位

    项目依赖npm install puppeteer-extra puppeteer-extra-plugin-stealth tesseract.js sharp核心代码示例const puppeteer puppeteer-extra');const StealthPlugin = require('puppeteer-extra-plugin-stealth');const tesseract = require('tesseract.js

    45510编辑于 2025-05-29
  • 来自专栏White feathe 的博客

    H5 图像识别

    识别对比 ---- 1、百度识别 发现百度的图片搜索识别率不是特别,下面为测试图片跟测试后的结果: 测试图片: 下面为测试后的结果: 2、采用 tesseract.js 后结果 H5 图像识别 (采用Tesseract.js 进行识别) ---- 简单的文案之类的,识别的还算可以,但是稍微复杂点的,准确率就不是那么好了,在学习中。。。 安装 <script src='https://cdn.rawgit.com/naptha/<em>tesseract.js</em>/1.0.10/dist/<em>tesseract.js</em>'></script> 或者 npm install tesseract.js –save PS:如果使用 npm 安装异常,可以使用 cnpm 进行安装使用 使用 demo 1:then使用 var Tesseract = require ('tesseract.js') Tesseract.recognize(myImage).then(function(result){ console.log(result) }) demo

    4.3K30编辑于 2021-12-08
  • 来自专栏code秘密花园

    前端技术观察第13期 - 2019 年前端性能检查清单

    来看看如何在实践中使用 http://thecodebarbarian.com/async-generator-functions-in-javascript.html tools And codes Tesseract.js 2.0: JavaScript 编写的 OCR 工具(英) OCR是一个非常有用的技术,通过他我们往往可以带给用户极大的便利体验,Tesseract.js 2.0,一个完全使用 JavaScript

    1.1K10发布于 2020-02-12
  • 来自专栏苏生不惑

    那些你可能不知道的 ocr 图片文字识别工具

    image.png 类似的网站还有http://www.gkocr.com/web/index.html https://github.com/naptha/tesseract.js https://ocr.wdku.net

    10.6K82发布于 2019-08-17
  • 来自专栏MixLab科技+设计实验室

    WASM·技术趋势

    A Rust library for calculating perceptual hash values of images github.com/abonander/img_hash tesseract.js 著名的OCR库,通过rust实现了js版本~ Pure Javascript OCR for more than 100 Languages github.com/naptha/tesseract.js

    1.9K30发布于 2021-10-12
  • 来自专栏柒八九技术收纳盒

    Rust 赋能前端:图片OCR识别,以后可以抛弃tesseract了

    正如标题所说,我们如果要在前端执行OCR,我们一般选择tesseract[3],也就是tesseract.js[4]。 其实,刚开始呢,我们也是选用tesseract.js,但是呢在执行过程中发现,有些图片资源或者场景,它的识别度不尽人意。 catch (err) { console.error('OCR failed:', err); throw err; } }; 题外话 上面代码中我们使用了tesseract.js 也就是tesseract.js封装了tesseract的webassembly版本。 当我们翻看tesseract.js源码,也能印证上面的信息。 https://www.npmjs.com/package/f_cli_f [3] tesseract: https://tesseract-ocr.github.io/tessdoc/ [4] tesseract.js

    1.3K01编辑于 2025-01-03
  • 来自专栏python3

    node网络爬虫实例了解下?

    Headless)Chrome 工具, 通过puppeteer我们很容易的模拟用户的操作 [x] 8 图片验证码识别 这里主要注意的就是node-tesseract库和gm,由于之前一开始用的是tesseract.js

    48720发布于 2020-01-02
  • 来自专栏用户2442861的专栏

    OCR material

    GRU-RNN, CTC and referred to the works of rnnlib and clstm github: https://github.com/edward-zhu/umaru Tesseract.js homepage: http://tesseract.projectnaptha.com/ github: https://github.com/naptha/tesseract.js DeepHCCR

    14.1K41发布于 2018-09-19
  • 来自专栏不换的随想乐园

    不换的周刊 第27期

    5.tesseract.js 4.1.1 发布 相关地址:https://github.com/naptha/tesseract.js/releases/tag/v4.1.1 修复了处理使用 iOS 设备拍摄图像的关键错误

    17110编辑于 2024-04-30
  • 来自专栏专知

    【专知荟萃25】文字识别OCR知识资料全集(入门/进阶/论文/综述/代码/专家,附查看)

    GRU-RNN, CTC and referred to the works of rnnlib and clstm github: [https://github.com/edward-zhu/umaru] Tesseract.js for 62 Languages homepage: [http://tesseract.projectnaptha.com/] github: [https://github.com/naptha/tesseract.js

    4.4K93发布于 2018-04-11
  • 在工具泛滥的时代,我为什么还要做一个“不一样“的工具站

    StrLoom只做四件事:JSON格式化:支持格式化、压缩、模板合并(这是其他工具少有的功能)编码/解码:Base64、URL、Unicode、Hex,一键切换图片OCR:支持粘贴图片,本地识别文字(基于Tesseract.js

    13610编辑于 2025-12-13
  • 来自专栏AI算法与图像处理

    最全OCR相关资料整理

    GRU-RNN, CTC and referred to the works of rnnlib and clstm github: https://github.com/edward-zhu/umaru Tesseract.js OCR for 62 Languages homepage: http://tesseract.projectnaptha.com/ github: https://github.com/naptha/tesseract.js

    1.8K21发布于 2019-10-10
  • 来自专栏机器之心

    Django创造者Simon Willison分享:我如何使用LLM帮我写代码

    当我在构建我的 JavaScript OCR 应用时,我详细地写了:该应用应结合 Tesseract.js 和 PDF.js—— 这两个库我过去曾使用过,我可以在提示词中提供有效示例。

    45210编辑于 2025-03-20
领券