图像 Token 化:视觉数据转换的关键技术
比LLM更重要的多模态学习