Breezedeus.com
Home
CnOCR
Pix2Text (P2T)
  •   P2T Online Web
  •   P2T详细资料
  •   P2T Detailed Infos
知识星球
More
  •   Old Blog
  •   Contact Me
  •   Buy Me Coffee
  •   Archive
  •   About Me
Breezedeus
文章
3
分类
3
标签
168
Home
CnOCR
Pix2Text (P2T)
P2T Online Web
P2T详细资料
P2T Detailed Infos
知识星球
More
Old Blog
Contact Me
Buy Me Coffee
Archive
About Me
#CLIP

🪙更精准的硬币识别多模态模型:Coin-CLIP

开源工具
Coin-CLIP:硬币多模态模型,针对硬币图片具有更强的特征提取能力,可以实现更精准的以图搜图功能。
2023-12-8
硬币识别
硬币检索
coin-recognition
Coin-CLIP
CLIP
coin-retrieval
usa-coins
多模态学习
Multimodal Learning
多模态模型
对比学习
模型下载
工具
coin-identification
更精准的硬币识别多模态模型:Coin-CLIP

Lazy loaded image比LLM更重要的多模态学习

技术分享
上周线下分享的文字版,介绍了多模态学习的概念、意义、模型架构、代表模型和挑战等。
2023-6-25
Multimodal Learning
多模态学习
CLIP
ImageBind
BLIP-2
MM-CoT
VLP
比LLM更重要的多模态学习

Lazy loaded image本周日线下分享:《比LLM更重要的多模态学习》

技术分享
本周日下午在清华MEM大讲堂的线下科普类分享,会提到多模态学习的定义、作用、代表模型、挑战等。
2023-6-16
Multimodal Learning
多模态学习
CLIP
线下分享
本周日线下分享:《比LLM更重要的多模态学习》
Breezedeus
Breezedeus
Breezedeus
文章
3
分类
3
标签
168
知识星球
最新发布
InfiGUI-R1:从反应式执行向推理式决策的进阶之路
InfiGUI-R1:从反应式执行向推理式决策的进阶之路
2025-4-29
GUI Agents(智能体)最新论文
GUI Agents(智能体)最新论文
2025-4-29
《机器学习&自然语言处理》课程解密了
《机器学习&自然语言处理》课程解密了
2025-4-29
《控糖革命》:了解血糖影响与控糖策略
《控糖革命》:了解血糖影响与控糖策略
2025-4-10
ShowUI:当前最好的 UI Agent 开源模型?
ShowUI:当前最好的 UI Agent 开源模型?
2025-3-22
UI-TARS:利用长期记忆和反思调整不断优化
UI-TARS:利用长期记忆和反思调整不断优化
2025-3-19
公告
🎉Pix2Text V1.1.1 新版发布🎉
-- 新版本特性 ---
V1.1.1 发布,带来全新的数学公式检测(MFD)模型
 
详见:Pix2Text V1.1.1 新版发布,带来更好的数学公式检测模型
 
2021-2025Breezedeus.

Breezedeus.com | Breezedeus

Powered byNotionNext 4.8.4.