基于大语言模型的AI Agents—Part 3技术分享介绍由 LLM 驱动的 AI Agents 的相关技术和工具。Part 3 介绍另外几个热门的 Agent 框架:agents、AutoAgents 和 ChatDev(通过agents之间的多轮交互完成任务)。2023-10-12 LLM GPT4 AI_Agent Generative NLP 大语言模型 智能体 ChatGPT Multi-Agents AutoAgents ChatDev
CnOCR 纯数字识别新模型开源工具CnOCR 中新加入了纯数字识别新模型,适合银行卡号识别、身份证号识别、硬币年份识别等应用场景。2023-10-1 星球专享 模型下载 CnOCR 数字识别 OCR Nougat 文字识别
Meta的版面恢复大模型:Nougat 开源工具详细介绍 Meta 刚刚开源的版面恢复大模型 Nougat(牛轧糖),并与我的版面恢复开源小工具 Pix2Text (P2T) 做了对比。2023-9-4 版面恢复 数学公式检测 数学公式识别 LaTeX OCR Nougat Pix2Text P2T Meta VIE Layout-Analysis Layout-Recovery
基于大语言模型的AI Agents—Part 2技术分享介绍由 LLM 驱动的 AI Agents 的相关技术和工具。Part 2 介绍3个热门的 Agent 框架:AutoGPT、GPT-Engineer 和 MetaGPT。2023-9-1 LLM GPT4 AI_Agent Generative NLP 大语言模型 智能体 ChatGPT AutoGPT GPT-Enginner MetaGPT Multi-Agents
解决超难问题的 Least-to-Most Prompt 框架技术分享介绍使用 LLM 来解决超难问题的 Least-to-Most Prompting 框架。2023-8-29 LLM GPT4 AI_Agent Generative NLP 大语言模型 ChatGPT Prompt 提示词 OpenAI
基于大语言模型的AI Agents—Part 1技术分享介绍由 LLM 驱动的 AI Agents 的相关技术和工具。Part 1 介绍 Agent 的一般框架,背景知识和斯坦福的虚拟小镇论文。2023-8-22 LLM GPT4 AI_Agent Generative NLP 大语言模型 智能体 ChatGPT Multi-Agents
🏛️《机器学习&自然语言处理》课程解密了技术分享《机器学习&自然语言处理》付费课程解密了。2023-7-16 Machine Learning NLP 机器学习 自然语言处理 免费课程 实战 Deep Learning
Pix2Text 新版公式识别模型开源工具今天更新了 Pix2Text (P2T) 中的公式识别模型。新模型的精度更高,尤其是对手写公式和多行公式类的图片。2023-7-2 数学公式识别 Math-Formula-Recognition MFR Pix2Text P2T 工具 模型下载
比LLM更重要的多模态学习技术分享上周线下分享的文字版,介绍了多模态学习的概念、意义、模型架构、代表模型和挑战等。2023-6-25 Multimodal Learning 多模态学习 CLIP ImageBind BLIP-2 MM-CoT VLP
标注工具Label Studio如何导入本地文件和模型预测结果开源工具介绍数据标注工具Label Studio,如何导入本地文件生成标注数据,如何导入模型预测结果,以及如何导出标注结果并转换成MFD模型训练所需格式。2023-6-21 Label Studio 数据标注 工具 CnSTD Pix2Text 数学公式检测 视频
P2T YoloV7 数学公式检测模型开放购买开源工具Pix2Text (P2T) 中的数学公式检测模型 YoloV7 开放购买了。2023-6-19 星球专享 模型下载 Pix2Text P2T 数学公式检测 MFD
本周日线下分享:《比LLM更重要的多模态学习》技术分享本周日下午在清华MEM大讲堂的线下科普类分享,会提到多模态学习的定义、作用、代表模型、挑战等。2023-6-16 Multimodal Learning 多模态学习 CLIP 线下分享