🦙LLaMA 3 掀桌子三部曲(一):LLaMA 3 发布技术分享LLaMA 3 又来掀桌子了,发布一天后排名已经到开源模型首位了,已超过早期的 GPT4 和 Gemini Pro 🔥🔥🔥。哪些因素带来了新的精度提升?2024-4-19 LLM GPT4 Generative NLP 大语言模型 ChatGPT Meta LLaMA3
Pix2Text V1.0 新版发布,带来了最好的开源数学公式识别模型开源工具Pix2Text (P2T) V1.0 发布,其中新的公式识别模型(MFR)精度得到极大提高,是当前精度最高的开源公式识别模型。2024-2-26 数学公式识别 Math-Formula-Recognition MFR Pix2Text P2T LaTeX-OCR Math-OCR 数学公式检测 工具 版面恢复 LaTeX Nougat Texify
CnOCR V2.3 新版发布:模型更好、更多、更大开源工具CnOCR V2.3 新版发布,模型都经过了重新训练和精调,精度比旧版模型更高。同时加入了分场景、大小规模不同的各种模型,可商用。2023-12-24 模型下载 CnOCR 数字识别 OCR 文字识别 中文识别 英文识别 CnOCR V2.3
🪙更精准的硬币识别多模态模型:Coin-CLIP开源工具Coin-CLIP:硬币多模态模型,针对硬币图片具有更强的特征提取能力,可以实现更精准的以图搜图功能。2023-12-8 硬币识别 硬币检索 coin-recognition Coin-CLIP CLIP coin-retrieval usa-coins 多模态学习 Multimodal Learning 多模态模型 对比学习 模型下载 工具 coin-identification
OpenAI 如何优化 LLM 的效果技术分享本文介绍了优化 LLM 效果的三种方法:Prompt Engineering、RAG 和 Fine-tuning。详细描述了它们的使用场景、优劣势,并基于具体示例给出了它们带来的效果提升。2023-11-17 LLM GPT4 Generative NLP 大语言模型 ChatGPT Prompt 提示词 OpenAI RAG Fine-tuning 检索增强
非常有趣的一种OCR思路:EffOCR开源工具EffOCR 使用了切字+向量检索的方法来做文字识别,很不一样的思路,非常有趣。2023-11-8 模型下载 OCR EffOCR CnOCR 英文OCR 日文OCR 切字 对比学习 度量学习 文字检测 文字识别
基于大语言模型的AI Agents—Part 3技术分享介绍由 LLM 驱动的 AI Agents 的相关技术和工具。Part 3 介绍另外几个热门的 Agent 框架:agents、AutoAgents 和 ChatDev(通过agents之间的多轮交互完成任务)。2023-10-12 LLM GPT4 AI_Agent Generative NLP 大语言模型 智能体 ChatGPT Multi-Agents AutoAgents ChatDev
CnOCR 纯数字识别新模型开源工具CnOCR 中新加入了纯数字识别新模型,适合银行卡号识别、身份证号识别、硬币年份识别等应用场景。2023-10-1 星球专享 模型下载 CnOCR 数字识别 OCR Nougat 文字识别
Meta的版面恢复大模型:Nougat 开源工具详细介绍 Meta 刚刚开源的版面恢复大模型 Nougat(牛轧糖),并与我的版面恢复开源小工具 Pix2Text (P2T) 做了对比。2023-9-4 版面恢复 数学公式检测 数学公式识别 LaTeX OCR Nougat Pix2Text P2T Meta VIE Layout-Analysis Layout-Recovery
基于大语言模型的AI Agents—Part 2技术分享介绍由 LLM 驱动的 AI Agents 的相关技术和工具。Part 2 介绍3个热门的 Agent 框架:AutoGPT、GPT-Engineer 和 MetaGPT。2023-9-1 LLM GPT4 AI_Agent Generative NLP 大语言模型 智能体 ChatGPT AutoGPT GPT-Enginner MetaGPT Multi-Agents
解决超难问题的 Least-to-Most Prompt 框架技术分享介绍使用 LLM 来解决超难问题的 Least-to-Most Prompting 框架。2023-8-29 LLM GPT4 AI_Agent Generative NLP 大语言模型 ChatGPT Prompt 提示词 OpenAI
基于大语言模型的AI Agents—Part 1技术分享介绍由 LLM 驱动的 AI Agents 的相关技术和工具。Part 1 介绍 Agent 的一般框架,背景知识和斯坦福的虚拟小镇论文。2023-8-22 LLM GPT4 AI_Agent Generative NLP 大语言模型 智能体 ChatGPT Multi-Agents