P2T详细资料 | Breezedeus.com

type

Post

status

Published

date

Feb 26, 2024

slug

pix2text_cn

summary

Pix2Text: a Free Alternative to Mathpix (Pix In, Latex & Text Out). Pix2Text 识别图片中的文字和数学公式的Latex表达。

category

开源工具

icon

fas fa-umbrella-beach

password

URL

Rating

[中文] | [English]

📖 在线文档 | 🛠️ 安装 | 🖥️ 网页版 | 🛀🏻 在线Demo | 💬 交流群

Pix2Text (P2T) 期望成为 Mathpix 的免费开源 Python 替代工具，目前已经可以完成 Mathpix 的核心功能。 Pix2Text (P2T) 可以识别图片中的版面、表格、图片、文字、数学公式等内容，并整合所有内容后以 Markdown 格式输出。P2T 也可以把一整个 PDF 文件（PDF 的内容可以是扫描图片或者其他任何格式）转换为 Markdown 格式。P2T 的文字识别引擎已支持 80+ 种语言，如英文、简体中文、繁体中文、越南语等。

目录：

P2T 网页版在线 Demo 在线文档付费模型模型商店购买数学公式检测（MFD）模型购买数学公式识别（MFR）模型购买后使用说明代码库

Pix2Text 当前整合了以下模型：

版面分析模型：breezedeus/pix2text-layout （国内镜像）。

表格识别模型：breezedeus/pix2text-table-rec （国内镜像）。

文字识别引擎：支持 80+ 种语言，如英文、简体中文、繁体中文、越南语等。其中，英文和简体中文识别使用的是开源 OCR 工具 CnOCR ，其他语言的识别使用的是开源 OCR 工具 EasyOCR 。

数学公式检测模型（MFD）：breezedeus/pix2text-mfd（国内镜像）。基于 CnSTD 实现。

数学公式识别模型（MFR）：breezedeus/pix2text-mfr（国内镜像）。

其中多个模型来自其他开源作者，非常感谢他们的贡献。

具体说明请参考可用模型。

P2T 网页版

Pix2Text (P2T) - Free Mathpix Alternative

Use Pix2Text (P2T) to convert math formulas in images to text. Pix2Text is a free alternative to Mathpix that supports math formula recognition, LaTeX rendering, and export to various formats.

https://p2t.breezedeus.com/

所有人都可以免费使用 P2T网页版，每人每天可以免费识别 10000 个字符，正常使用应该够用了。请不要批量调用接口，机器资源有限，批量调用会导致其他人无法使用服务。

受限于机器资源，网页版当前只支持简体中文和英文，要尝试其他语言上的效果，请使用以下的在线 Demo。

在线 Demo

Pix2Text - a Hugging Face Space by breezedeus

Discover amazing ML apps made by the community

https://huggingface.co/spaces/breezedeus/Pix2Text-Demo

国内镜像（不用梯子，但未必长久可用）：

Pix2Text - a Hugging Face Space by breezedeus

Discover amazing ML apps made by the community

https://hf.qhduan.com/spaces/breezedeus/Pix2Text-Demo

可以使用 在线 Demo 尝试 P2T 在不同语言上的效果。但在线 Demo 使用的硬件配置较低，速度会较慢。如果是简体中文或者英文图片，建议使用 P2T网页版。

在线文档

Pix2Text

Pix2Text Online Documents

https://pix2text.readthedocs.io/

付费模型

P2T 中包含数学公式检测（MFD）和数学公式识别（MFR）两种模型，细节参见项目说明。P2T 默认会使用免费的开源模型，使用时进行自动下载。但免费模型之外，我也会持续优化模型。最新的模型需要购买才可下载使用。如果不做本地部署，建议直接使用 P2T网页版，网页版会一直使用最新的模型。

当前网页版使用了最新的模型：

MFR-Plus/MFR-Pro-1.5

MFD-Pro-1.5

P2T网页版使用的付费模型效果比开源模型好。如果你需要自己部署P2T服务，建议你购买网页版同款模型。

为感谢星球会员的支持，星球会员购买B站所有的个人版模型一律八折。通过下面表格中的链接购买并确认收货后，加小助手为好友，小助手会把折扣金额返现。注意：企业版不提供折扣。

购买前注意事项：

📌

请确保你用开源的模型跑通了 Pix2Text，否则你下载完付费模型可能跑不起来。详细安装和使用说明看 Pix2Text 项目文档就行。遇到问题可以在这里评论，或者加入群聊与我沟通，但请注意帮你跑通代码不在作者的服务范围之内（参考星球说明）。

📌

个人使用请参考以下表格中的“个人购买”列；企业购买请参考以下表格中的“企业购买”列，或者 联系作者。

模型商店

模型购买包含以下 2 个商店。

商店	说明
B站商城	仅售卖个人使用的模型。无法开具发票。
Lemon Squeezy	售卖商用和个人使用的模型。平台可以开具发票（美式发票）。

接下来给出更具体的说明。

购买数学公式检测（MFD）模型

以下是不同版本的购买链接。建议先使用 在线 Demo 验证效果后再购买。各个版本的 License 不同，请点击表格内链接查看商品明细。遇到问题可以 联系作者 。企业版同时包含 MFD 和 MFR 模型，无需重复购买。

检测模型版本	企业购买	个人购买	对星球会员	免费可下载
`MFD-Advanced-1.5`	✖️	✔️ Lemon Squeezy	✔️ 免费获取	✔️
`MFD-Pro-1.5`	✔️ 企业 Pro 版企业 Plus 版	✔️ bilibili 商城 Lemon Squeezy	✔️ 个人购买八折	✖️
`mfd-advanced`	✖️	✔️ Lemon Squeezy	✔️ 免费	✖️
`mfd-pro`	✔️ Enterprise Pro Enterprise Plus	✔️ B站 Lemon Squeezy	✔️ 个人使用 B站购买八折	✖️

📌

以上模型只兼容 Pix2Text ≥ V1.1.4。

购买后的使用说明见：

Pix2Text 新版数学公式检测和识别模型：V1.5 。

Pix2Text V1.1.1 新版发布，带来更好的数学公式检测模型。

购买数学公式识别（MFR）模型

识别模型版本	企业购买	个人购买	对星球会员	免费可下载
`MFR-Pro-1.5`	✔️ 企业 Pro 版企业 Plus 版	✔️ bilibili 商城 Lemon Squeezy	✔️ 个人购买八折	✖️
`mfr-pro`	✔️ Enterprise Pro	✔️ B站 Lemon Squeezy	✔️ 个人使用 B站购买八折	✖️
`mfr-plus`	✔️ Enterprise Plus	✖️	✖️	✖️

📌

以上模型兼容 Pix2Text V1.0、V1.1、V1.1.* 。

购买后的使用说明见：

Pix2Text 新版数学公式检测和识别模型：V1.5 。

Pix2Text V1.1.1 新版发布，带来更好的数学公式检测模型。

Pix2Text V1.0+ 包含两种企业版。它们的权益差异见下图。企业 Pro 版 是一次性购买，之后有新模型需要重新购买。企业 Pro 版 只允许企业内部使用或者对外提供免费的服务（如教育机构），不允许对外提供付费服务。企业 Plus 版 购买后一年内可以免费获取所有的新模型。企业 Plus 版 除了提供 Pro 模型外也提供 Plus 版 模型，同时提供所有模型的 PyTorch 版本，企业可以基于这些模型利用自己的数据进行模型精调，或者转换为需要的其他模型格式（如 CoreML等）。企业 Plus版 允许企业对外提供付费服务。

更详细说明请见 模型购买商店（进入商品的详情页有具体说明）。