直击WAIC2024 | 突破AI大模型应用障碍，看行业大咖前瞻性思考

tamoadmin 2024年07月06日 23:30 0

7月4日至6日，2024世界人工智能大会暨人工智能全球治理高级别会议在上海召开。期间，大模型、算力等多个领域专家发表了前瞻性思考。

商汤科技CEO徐立认为，大模型本质意义上是在做一个记忆的事情，记住世界的知识。而它仅有的一点点的智力，完全是来自于对于知识背后高阶的思维逻辑的记忆。所以说，在垂直行业里，如何构造高阶思维逻辑的合成数据，往往是制胜的关键，并且是差异化的关键。这也是中国人工智能之路的关键。

爱芯元智创始人、董事长仇肖莘则认为，大模型真正大规模落地需要云边端三级紧密结合，而边缘侧和端侧结合的关键在于AI计算与感知。

爱芯元智创始人、董事长仇肖莘。图片来源：受访者供图大模型应用落地

关于大模型应用落地，徐立表示，行业要进行变化，交互模式一定是先行的。实时的交互性能够带来一个流畅的体验，也是带来推动超级时刻以及应用变化的核心。对于GPT-4o的发布，外界感触最深的是它可以实时地来跟人进行交互，从而重新定义人机交互的界面。

另外，阻碍大模型落地的一大因素是“大模型幻觉”。

MiniMax创始人首席执行官闫俊杰强调降低错误率。其表示，从去年开始ChatGPT出来之后，然后有GPT-4的各种版本，国内很多公司也在迎头赶上，推出了很多模型。最核心的问题，目前模型的错误率还是比较高的。比如说GPT-4，它在很多测试指标上可能正确率有60%、70%，即30%到40%的错误率。国内的模型，整体上还是在60%到70%的错误率。

闫俊杰补充表示，为什么大模型的产品是对话的形式？因为对话的容错率比较高。为什么不能成为一个独立的Agent（代理人）？是因为每一步都有30%、40%的错误率。因此，最核心的问题是怎么把大模型的错误率从30%、40%，降到3%、4%、2%，降低一个数量级。这是AI从一个辅助人类的工具，到能独立完成工作，最核心的标志。

智谱AI首席执行官张鹏则认为，准确率是一个方面，一般说准确率的时候，大多数是限定在一些评测级或者任务上，就看数值性的量化评测，但有些东西其实很难量化，比如说逻辑性，抽象思考的能力。张鹏强调，这些恰恰是现在的模型，比人或者是比传统的方法更强的地方。

智谱AI首席执行官张鹏图片来源：受访者供图

张鹏认为，现在很重要的点是突破大模型的多模态。是因为真正的人在现实世界中解决问题的时候，他需要输入的信息本身就是多模态的，除了自然语言以外还有视觉、听觉、触觉，还有常识，所有这些是需要综合起来才能解决现实世界当中很多常见的问题，甚至不是复杂问题，都是常见问题。

比如说扫地、做饭、洗衣服这些任务，它所需要输入的信息是多模态的，这些方面能力的突破会带来AI的普惠。

关于工业大模型的应用，香港工业机器人及机械人研发中心（FLAIR）总裁黎少斌对每经记者表示：“当我们有更多的数据，可以训练工业用的大模型。彼时，我们可以直接去问设备，你的状态怎么样？有没有什么不妥当？设备就可以回一个答案，比如‘我发现可能某个设备有一点点问题，我应该还能坚持一个星期，你想想如何安排更换，做一个预维护’。”

其补充表示：“我们想把大模型技术与我们的一些解决方案结合起来，变成以后车间设备与人之间的沟通，会更像人与人之间的沟通。”

云侧+端侧算力配合

目前在大模型应用方面，也开始更加强调云侧与端侧算力的配合。

徐立认为，如果说所有的资源都聚焦在云端，会带来推理成本的大幅度增长，以及推理效率的下降，因为网络的拥挤，势必会带来服务的不流畅。商汤在端侧上加大了模型的优化，提升了10%的性能精度，除此之外，速度有大规模的提升，成本有大幅度下降。首包延迟下降40%，推理效率提升了15%。

商汤科技CEO徐立图片来源：主办方供图

爱芯元智创始人、董事长仇肖莘认为，智能芯片和多模态大模型已经成为人工智能时代的“黄金组合”，当大模型的应用日益广泛，更经济、更高效、更环保将会成为智能芯片的关键词，而搭载AI处理器的高效推理芯片将是大模型落地更合理的选择，这也是推进普惠AI的关键所在。

面壁智能副总裁贾超认为，凭借在成本、隐私、延时性、可靠性等方面的优势，端侧AI发展会成为全球趋势，这也意味着大模型正式进入了轻量化时代。这一背景下，“模型知识密度，平均每8个月提升1倍”将会成为大模型时代的新摩尔定律。贾超强调，企业开发端侧大模型需要从算法侧和芯片侧来做双向奔赴，把端侧模型用端侧芯片，在用户场景上高效落地，这样才能给用户带来最极致的体验。

每日经济新闻

本文地址：https://www.vwctbae.com/post/50507.html

标签： #模型