Breezedeus.com
Home
CnOCR
Pix2Text (P2T)
  •   P2T Online Web
  •   P2T详细资料
  •   P2T Detailed Infos
知识星球
More
  •   Old Blog
  •   Contact Me
  •   Buy Me Coffee
  •   Archive
  •   About Me
Breezedeus
文章
1
分类
3
标签
173
Home
CnOCR
Pix2Text (P2T)
P2T Online Web
P2T详细资料
P2T Detailed Infos
知识星球
More
Old Blog
Contact Me
Buy Me Coffee
Archive
About Me
#ByteDance

🤖UI-TARS:利用长期记忆和反思调整不断优化

技术分享
来自字节跳动的 UI-TARS 基于 Qwen2-VL 微调,通过大量 grounding 和 navigation 数据,经三阶段训练,在感知能力训练加入新任务,利用特定方法迭代优化,以远超多数工作的数据规模,实现对中文图片和指令的良好支持。
2025-1-24
AI_Agent
Multi-Agents
UI Agents
Web Agents
Compute Use
Phone Use
AutoGLM
AppAgents
Mobile Agents
VLM
LLM
智能体
规划推理
UI-TARS
ByteDance
GUI Agents
UI-TARS:利用长期记忆和反思调整不断优化
Breezedeus
Breezedeus
Breezedeus
文章
1
分类
3
标签
173
知识星球
最新发布
AI Agent 性能优化:核心策略与实战技巧
AI Agent 性能优化:核心策略与实战技巧
2025-10-20
Mobile-Agent-v3:新的 GUI Agents 开源王者
Mobile-Agent-v3:新的 GUI Agents 开源王者
2025-9-25
GUI Agents(智能体)最新论文
GUI Agents(智能体)最新论文
2025-9-6
Pix2Text 新版数学公式检测和识别模型:V1.5
Pix2Text 新版数学公式检测和识别模型:V1.5
2025-8-16
P2T Detailed Infos
P2T Detailed Infos
2025-8-6
P2T详细资料
P2T详细资料
2025-8-6
公告
🎉Pix2Text V1.1.1 新版发布🎉
-- 新版本特性 ---
V1.1.1 发布,带来全新的数学公式检测(MFD)模型
 
详见:Pix2Text V1.1.1 新版发布,带来更好的数学公式检测模型
 
2021-2025Breezedeus.

Breezedeus.com | Breezedeus

Powered byNotionNext 4.9.2.