快科技4月29日消息,DeepSeek正在网页端和App端灰度测试识图模式,用户可上传图片并让DeepSeek进行内容理解、描述和分析,填补了在多模态方面的空白。
该模式与快速模式、专家模式并列,作为独立的一级入口存在,说明DeepSeek正在将视觉理解作为核心能力而非辅助功能进行布局。
部分用户已可正常使用,另一些用户虽能看到入口,但会收到识图模式暂不可用,请稍后再试的提示”。
从产品界面看,用户进入识图模式后,页面显示使用识图模式开始对话,输入框旁出现图片上传按钮。
从实测情况来看,目前开放的主要是图片理解能力,即看图、读图、分析图,涵盖视觉问答、图片理解和截图分析等场景,尚未看到图像生成、视频理解或跨模态生成能力上线。
这意味着现阶段识图模式更接近视觉语言模型(VLM)的范畴,而非完整的多模态生成工具。
(举报)
