type
status
date
slug
summary
tags
category
icon
password
URL
Rating
 
[中文] | [English]
 
 
Pix2Text (P2T) 利用最新的OCR技术识别图片中的数学公式和文字,把数学公式转换为Latex纯文字表示。Pix2Text (P2T) 期望成为 Mathpix免费开源 Python 替代工具,目前已经可以完成 Mathpix 的核心功能,支持识别既包含文字又包含公式的混合图片,返回效果类似于

P2T 网页版

 
所有人都可以免费使用 P2T网页版,正常使用不限次数。但请不要批量调用接口,机器资源有限,批量调用会导致其他人无法使用服务。
 

付费模型

P2T 中包含数学公式检测(MFD)数学公式识别(MFR)两种模型,细节参见 项目说明。P2T 默认会使用免费的开源模型,使用时进行自动下载。但免费模型之外,我也会持续优化模型。最新的模型需要购买才可下载使用。如果不做本地部署,建议直接使用 P2T网页版,网页版会一直使用最新的模型。
 
当前网页版模型为:
  • MFD: version-20230613
  • MFR: version-20230702
P2T网页版使用的付费模型效果比开源模型好。如果你需要自己部署P2T服务,建议你购买网页版同款模型。
 
为感谢星球会员的支持,星球会员购买所有的个人版模型一律八折。通过下面表格中的链接购买并确认收货后,加小助手为好友,小助手会把折扣金额返现。
 
购买前注意事项:
📌
请确保你用开源的模型跑通了 Pix2Text,否则你下载完付费模型可能跑不起来。详细安装和使用说明看 Pix2Text 项目文档就行。遇到问题可以在这里评论,或者加入群聊与我沟通,但请注意帮你跑通代码不在星主的服务范围之内(参考 星球说明)。
📌
个人使用请参考以下表格中的“个人购买”列;企业购买请参考以下表格中的“企业购买”列,或者 联系作者

购买数学公式检测(MFD)模型

当前可用的检测模型见下表,具体说明见:P2T YoloV7 数学公式检测模型开放购买
检测模型版本
企业购买
个人购买
对星球会员
免费可下载
YoloV7_Tiny 开源模型
✖️
✖️
✔️
✔️
version-20230208
✖️
✔️ B站工房
✔️ 免费
✖️
version-20230613
✔️ 八折
✖️
 
购买后的使用说明见 这里
 

购买数学公式识别(MFR)模型

当前可用的模型见下表,具体说明见:Pix2Text 新版公式识别模型
识别模型版本
企业购买
个人购买
对星球会员
免费可下载
Latex-OCR开源模型
✖️
✖️
✔️
✔️
version-20230702
✔️ 八折
✖️
 
购买后的使用说明见 这里
 
如果同时购买了检测和识别模型,既要设定检测模型的路径,又要设定识别模型的路径,可以使用如下方式:
 

代码库

 
模型自动下载使用的是HuggingFace的服务,但HuggingFace国内已被墙。如果没有梯子,可以从 百度云盘 手动下载文件 weights.pth 和 image_resizer.pth, 并把它们存放于~/.pix2text/formula目录中(Windows下默认路径为 C:\Users\<username>\AppData\Roaming\pix2text\formula);提取码为 p2t0。具体说明见上面的代码库文档。
 
📌
P2T 利用 CnOCR 识别图片中的文字部分,CnOCR 相关内容参考 这里
 
Breezedeus
Breezedeus
Breezedeus
公告
type
status
date
slug
summary
tags
category
icon
password
URL
Rating
🎉CnOCR V2.3 新版发布🎉
-- 新版本特性 ---
CnOCR V2.3 新版模型精度比旧版模型更高。同时加入了分场景、大小规模不同的各种模型,可商用。
 
在线 Demo,欢迎体验