Breezedeus.com
Home
CnOCR
Pix2Text (P2T)
  •   P2T Online Web
  •   P2T详细资料
  •   P2T Detailed Infos
知识星球
More
  •   Old Blog
  •   Contact Me
  •   Buy Me Coffee
  •   Archive
  •   About Me
Breezedeus
文章
1
分类
3
标签
169
Home
CnOCR
Pix2Text (P2T)
P2T Online Web
P2T详细资料
P2T Detailed Infos
知识星球
More
Old Blog
Contact Me
Buy Me Coffee
Archive
About Me
#Aguvis

🤖Aguvis:提升的不仅是 UI Agent 的规划推理能力

技术分享
本文介绍来自 HKU & Salesforce 的 Aguvis。Aguvis 构建了统一的 grounding 和 reasoning 大数据集,采用两阶段训练方式提升模型在 GUI 交互中的规划推理能力。
2024-12-13
AI_Agent
Multi-Agents
UI Agents
Web Agents
Compute Use
Phone Use
AutoGLM
AppAgents
Mobile Agents
VLM
LLM
智能体
Aguvis
规划推理
GUI Agents
Aguvis:提升的不仅是 UI Agent 的规划推理能力
Breezedeus
Breezedeus
Breezedeus
文章
1
分类
3
标签
169
知识星球
最新发布
MONDAY:从视频自动构建 GUI Agents 轨迹数据
MONDAY:从视频自动构建 GUI Agents 轨迹数据
2025-6-8
InfiGUI-R1:从反应式执行向推理式决策的进阶之路
InfiGUI-R1:从反应式执行向推理式决策的进阶之路
2025-6-8
P2T Detailed Infos
P2T Detailed Infos
2025-5-24
P2T详细资料
P2T详细资料
2025-5-24
CnOCR V2.3 新版发布:模型更好、更多、更大
CnOCR V2.3 新版发布:模型更好、更多、更大
2025-5-24
CnOCR
CnOCR
2025-5-24
公告
🎉Pix2Text V1.1.1 新版发布🎉
-- 新版本特性 ---
V1.1.1 发布,带来全新的数学公式检测(MFD)模型
 
详见:Pix2Text V1.1.1 新版发布,带来更好的数学公式检测模型
 
2021-2025Breezedeus.

Breezedeus.com | Breezedeus

Powered byNotionNext 4.8.4.