Breezedeus.com
Home
CnOCR
Pix2Text (P2T)
  •   P2T Online Web
  •   P2T详细资料
  •   P2T Detailed Infos
知识星球
More
  •   Old Blog
  •   Contact Me
  •   Buy Me Coffee
  •   Archive
  •   About Me
Breezedeus
文章
2
分类
3
标签
169
Home
CnOCR
Pix2Text (P2T)
P2T Online Web
P2T详细资料
P2T Detailed Infos
知识星球
More
Old Blog
Contact Me
Buy Me Coffee
Archive
About Me
#ShowUI

🤖GUI Agent 中使用 RL 提升模型泛化能力

技术分享
介绍 GUI Agent 如果利用强化学习(RL)算法训练模型,以提升模型的 OOD 泛化能力。
2025-3-3
AI_Agent
Multi-Agents
UI Agents
Web Agents
Compute Use
Phone Use
AutoGLM
Mobile Agents
VLM
LLM
智能体
ShowUI
GUI Agents
Reinfocement_Learning
Digi-Q
VEM
GUI Agent 中使用 RL 提升模型泛化能力

🤖ShowUI:当前最好的 UI Agent 开源模型?

技术分享
Show Lab 和微软推出 ShowUI,这是一个开源的 UI Agent 模型,在中文 APP 识别和导航能力上表现出色。通过创新的视觉 token 选择和独特的训练数据构建方法,该模型在有限的训练数据下实现了非常棒的性能
2024-12-5
AI_Agent
Multi-Agents
UI Agents
Web Agents
Compute Use
Phone Use
AutoGLM
SeeClick
AppAgents
Mobile Agents
VLM
LLM
智能体
ShowUI
GUI Agents
ShowUI:当前最好的 UI Agent 开源模型?
Breezedeus
Breezedeus
Breezedeus
文章
2
分类
3
标签
169
知识星球
最新发布
MONDAY:从视频自动构建 GUI Agents 轨迹数据
MONDAY:从视频自动构建 GUI Agents 轨迹数据
2025-6-8
InfiGUI-R1:从反应式执行向推理式决策的进阶之路
InfiGUI-R1:从反应式执行向推理式决策的进阶之路
2025-6-8
P2T Detailed Infos
P2T Detailed Infos
2025-5-24
P2T详细资料
P2T详细资料
2025-5-24
CnOCR V2.3 新版发布:模型更好、更多、更大
CnOCR V2.3 新版发布:模型更好、更多、更大
2025-5-24
CnOCR
CnOCR
2025-5-24
公告
🎉Pix2Text V1.1.1 新版发布🎉
-- 新版本特性 ---
V1.1.1 发布,带来全新的数学公式检测(MFD)模型
 
详见:Pix2Text V1.1.1 新版发布,带来更好的数学公式检测模型
 
2021-2025Breezedeus.

Breezedeus.com | Breezedeus

Powered byNotionNext 4.8.4.