商汤科技:“日日新5o”模型实现流式多模态交互

tamoadmin 0

快讯摘要

商汤科技推出“日日新5o”模型,对标GPT-4o,实现流式多模态交互,提升实时对话和语音识别能力,增强多任务处理适应性。

快讯正文

【商汤科技推出“日日新5o”模型,对标GPT-4o实现流式多模态交互】

商汤科技于7月5日发布了名为“日日新5o”的模型,该模型在交互体验上与GPT-4o相媲美,能够实现实时的流式多模态交互。在演示中,模型能够识别并描述现场物品,如工作人员胸卡上的文字和小狗玩偶的外貌。

此外,“日日新5o”还能处理书籍页面的图文内容,不仅限于文字识别,更能提供易于理解的总结。该模型的交互模式特别适用于实时对话和语音识别,具有强大的多任务适应性,能在同一模型中处理多种任务,并根据上下文自适应调整行为和输出。

(:贺

标签: #日新

上一篇消息称壳牌等四巨头将注资阿布扎比LNG项目

下一篇当前文章已是最新一篇了