资料介绍
软件简介
由 TensorFlow 2 和 PyTorch 提供支持,任何人都可以无缝访问光学字符识别
获取预训练模型
使用两阶段方法在 docTR 中实现端到端 OCR:文本检测(定位单词),然后文本识别(识别单词中的所有字符)。因此,可以从可用实现列表中选择用于文本检测的架构和用于文本识别的架构。
from doctr.models import ocr_predictor model = ocr_predictor(det_arch='db_resnet50', reco_arch='crnn_vgg16_bn', pretrained=True)
读取文件
可以从 PDF 或图像解释文档:
from doctr.io import DocumentFile # PDF pdf_doc = DocumentFile.from_pdf("path/to/your/doc.pdf").as_images() # Image single_img_doc = DocumentFile.from_images("path/to/your/img.jpg") # Webpage webpage_doc = DocumentFile.from_url("https://www.yoursite.com").as_images() # Multiple page images multi_img_doc = DocumentFile.from_images(["path/to/page1.jpg", "path/to/page2.jpg"])
以默认的预训练模型为例:
from doctr.io import DocumentFile from doctr.models import ocr_predictor model = ocr_predictor(pretrained=True) # PDF doc = DocumentFile.from_pdf("path/to/your/doc.pdf").as_images() # Analyze result = model(doc)
安装
安装 docTR 需要 Python 3.6(或更高版本)和 pip。
由于使用了 weasyprint,如果没有运行在 Linux 系统之上,将需要额外的依赖项。
对于 macOS 用户,可以按如下方式安装它们:
brew install cairo pango gdk-pixbuf libffi
对于 Windows 用户,这些依赖项包含在 GTK 中。
最新版本
pip install python-doctr
- 树洞OCR文字识别跨平台的OCR小工具
- 基于LSTM的表示学习-文本分类模型 18次下载
- 基于主题分布优化的模糊文本分类方法 5次下载
- 基于残差连接的改进端到端文本识别网络结构 6次下载
- 基于LSTM的流式文档结构识别方法 7次下载
- 胶囊网络在短文本多种意图识别的应用及研究 10次下载
- 基于BP神经网络分类器的垃圾文本过滤模型 43次下载
- 基于神经网络的中文文本蕴含识别模型 7次下载
- 新型中文旅游文本命名实体识别设计方案 24次下载
- 使用数字识别和AI实现OCR的资料合集 20次下载
- OCR文字识别视觉检测系统应用程序免费下载 24次下载
- API-Shop-OCR-营业执照识别API接口Python调用示例代码说明 6次下载
- 基于文本分类计数识别平台设计(JAVA实现) 11次下载
- 串口屏威廉希尔官方网站 文档—文本限值提示如何修改为英文 14次下载
- 免费版文字识别系统 TH-OCR SDK11.0 0次下载
- 光学识别字符是自动识别威廉希尔官方网站 吗 111次阅读
- 光学识别的过程包含哪些 94次阅读
- 基于OpenVINO+OpenCV的OCR处理流程化实现 590次阅读
- 可以提取图像文本的5大Python库 2186次阅读
- Tesseract的进阶用法和最佳实践 1058次阅读
- OCR实战教程 859次阅读
- 如何将PP-OCRv3英文识别模型部署在Corstone-300虚拟硬件平台上 2214次阅读
- OCR算法能较好识别水平排布的常规文本 1248次阅读
- 如何使用Python开发截图识别OCR的小工具 3404次阅读
- 如何实现自动识别并提取图片中的文本内容 1.5w次阅读
- ocr威廉希尔官方网站 是什么?新能源充电桩应用车牌识别ocr威廉希尔官方网站 2557次阅读
- Facebook研究人员提出了一个大规模图像文本提取和识别系统——Rosetta 3255次阅读
- 如何使用EAST文本检测器在自然场景下检测文本 1.1w次阅读
- 服务器端发票识别api接口 2625次阅读
- 基于FPGA异构加速的OCR识别威廉希尔官方网站 解析 2857次阅读
下载排行
本周
- 1使用单片机实现七人表决器的程序和仿真资料免费下载
- 2.96 MB | 44次下载 | 免费
- 2Keysight B1500A 半导体器件分析仪用户手册、说明书 (中文)
- 19.00 MB | 4次下载 | 免费
- 3BT134双向可控硅手册
- 1.74 MB | 2次下载 | 1 积分
- 4一种新型高效率的服务器电源系统
- 0.85 MB | 1次下载 | 1 积分
- 5PR735,使用UCC28060的600W交错式PFC转换器
- 540.03KB | 1次下载 | 免费
- 6WTS-100(1.1) UWB 信标定位系统 彩页
- 540.48 KB | 1次下载 | 免费
- 7DV2004S1/ES1/HS1快速充电开发系统
- 2.08MB | 1次下载 | 免费
- 8MATLAB绘图合集
- 27.12 MB | 1次下载 | 5 积分
本月
- 1使用单片机实现七人表决器的程序和仿真资料免费下载
- 2.96 MB | 44次下载 | 免费
- 2UC3842/3/4/5电源管理芯片中文手册
- 1.75 MB | 15次下载 | 免费
- 3DMT0660数字万用表产品说明书
- 0.70 MB | 13次下载 | 免费
- 4ST7789V2单芯片控制器/驱动器英文手册
- 3.07 MB | 11次下载 | 1 积分
- 5TPS54202H降压转换器评估模块用户指南
- 1.02MB | 8次下载 | 免费
- 6STM32F101x8/STM32F101xB手册
- 1.69 MB | 8次下载 | 1 积分
- 7TPS92682-Q1帧定义和示例
- 891.71KB | 6次下载 | 免费
- 8HY12P65/HY12P66数字万用表芯片规格书
- 0.69 MB | 6次下载 | 免费
总榜
- 1matlab软件下载入口
- 未知 | 935119次下载 | 10 积分
- 2开源硬件-PMP21529.1-4 开关降压/升压双向直流/直流转换器 PCB layout 设计
- 1.48MB | 420061次下载 | 10 积分
- 3Altium DXP2002下载入口
- 未知 | 233084次下载 | 10 积分
- 4电路仿真软件multisim 10.0免费下载
- 340992 | 191367次下载 | 10 积分
- 5十天学会AVR单片机与C语言视频教程 下载
- 158M | 183335次下载 | 10 积分
- 6labview8.5下载
- 未知 | 81581次下载 | 10 积分
- 7Keil工具MDK-Arm免费下载
- 0.02 MB | 73807次下载 | 10 积分
- 8LabVIEW 8.6下载
- 未知 | 65987次下载 | 10 积分
评论
查看更多