快讯摘要
商汤科技推出“日日新5o”模型,对标GPT-4o,实现流式多模态交互,提升实时对话和语音识别能力,增强多任务处理适应性。
快讯正文
【商汤科技推出“日日新5o”模型,对标GPT-4o实现流式多模态交互】
商汤科技于7月5日发布了名为“日日新5o”的模型,该模型在交互体验上与GPT-4o相媲美,能够实现实时的流式多模态交互。在演示中,模型能够识别并描述现场物品,如工作人员胸卡上的文字和小狗玩偶的外貌。
此外,“日日新5o”还能处理书籍页面的图文内容,不仅限于文字识别,更能提供易于理解的总结。该模型的交互模式特别适用于实时对话和语音识别,具有强大的多任务适应性,能在同一模型中处理多种任务,并根据上下文自适应调整行为和输出。
(:贺版权声明:
本网站数据均来自网络,若有文章、图片版权异议或其他问题请及时联系网站管理员立即处理
标签: #日新