大模型“百模大战”，为何不同于十多年前“百团大战”

时间：2023-06-21 18:00:55责任编辑：付龙阅读次

360智脑4.0亮相

近日，三六零安全科技股份有限公司（以下简称“360”）召开360智脑大模型应用发布会，认知型通用大模型“360智脑4.0”亮相，360AI数字人正式发布。360集团创始人周鸿祎现场创建了自己的数字分身作为“360发言人”；发布会同时宣布360智脑在多模态等关键能力上完成迭代，将全面接入“360全家桶”。

周鸿祎表示，360在大模型上的核心创新在AI数字人，数字人是未来人工智能大模型最重要的应用入口。360将依托360智脑大模型能力，重新定义“数字人”。区别于传统数字人只能按既定脚本输出内容，360AI数字人的特点在于有记忆、有人设和有性格。

腾讯云首次公布行业大模型

6月19日，腾讯云首次公布行业大模型研发进展，并发布面向B端客户的腾讯云MaaS（模型即服务）服务解决方案，依托腾讯云TI平台打造行业大模型精选商店，为企业客户提供涵盖模型预训练、模型精调、智能应用开发等一站式行业大模型解决方案。在TI平台内置高质量行业大模型基础上，企业加入自己独有的场景数据，就可以快速生成自己的专属模型；同时，也可根据自身业务场景需求，“量体裁衣、按需定制”不同参数、不同规格的模型服务。据介绍，基于腾讯HCC高性能计算集群和大模型能力，腾讯云已经为传媒、文旅、政务、金融等10余个行业提供了超过50个大模型行业解决方案。

大模型不缺新玩家，但腾讯是华为、BAT等头部大厂中最后一个官宣入局大模型产品和服务的厂商。

美图视觉大模型发布

6 月 19 日，第二届美图影像节现场，美图公司创始人、董事长兼首席执行官吴欣鸿分享了美图视觉大模型 MiracleVision（奇想智能）的背后故事，并围绕「AI 时代的影像生产力工具」主题，回顾了近一年带领美图探索 AI 的心路历程。

吴欣鸿表示，工具价值将在 AI 时代迎来大爆发。在 AI 与影像生产力工具的紧密结合下，优质内容创作门槛不断降低，影像行业生产效率不断提升。希望更多人享受 AI 科技红利，一起用上 AI 时代的影像生产力工具。

GPT-4 正确率没有那么高

最近，麻省理工学院研究人员的一篇名为Exploring the MIT Mathematics and EECS Curriculum Using Large Language Models 的论文上了热搜。该论文整理了一个包含 4550 个问题和解决方案的综合数据集，这些问题和解决方案来自麻省理工学院所有获得学位所需的数学、电气工程和计算机科学（EECS）课程的问题集、期中考试和期末考试。论文结果表明，GPT-3.5 成功解决了麻省理工学院整个课程的三分之一，而在不包括基于图像的问题测试集上实现了完美的解决率。

但来自 MIT EECS 专业的大四学生Raunak Chowdhari、Neil Deshmukh和 David Koplow 决定调查这篇论文，但对结果感到失望。复核者发现论文上的问题不完整，GPT-4 不可能找到正确答案，复核中也确实没有找到。

他们发现，该论文的研究人员使用 GPT-4 对生成的答案进行评估和评分，他们甚至不断提示 GPT-4，直到获得正确答案。当答案没有被纠正时，完整的答案会在上传的数据集中提供给GPT-4，这样模型就可以将其作为自己的答案输出。当三位复核人员尝试在数据集上运行零样本GPT-4 时，回答正确率只有 62.5%，明显低于论文声称的 90% 正确率。

他们得出结论，最近人工智能研究领域出现了这种趋势——缩短研究时间线，寻找研究捷径，为了上头条而发布未经严格审核的文章。HackerNews对麻省理工学院论文的一位复核者表示，机器学习不再是一个科学领域，它已经变得像社会科学一样——不可证伪和不可复制的研究建立在另一个不可证伪和不可复制的研究之上。

OpenAI正计划推出大模型商店

据科技媒体The Information的报道，OpenAI正计划推出一个类似“App Store”的大模型商店，让开发者可以上架他们基于OpenAI技术搭建的产品，比如针对各种垂直领域的聊天机器人或者定制的模型等。

目前，从大量使用反馈来看，无论是识别金融欺诈，还是根据内部文件回答特定市场的问题，使用ChatGPT的企业客户通常会根据自己的特定用途定制技术。所以OpenAI才有了搭建一个“大模型商店”的想法，让此类模型的开发者或者创业公司，可以通过OpenAI的平台将它们提供给其他企业。

报道称，这个计划是OpenAI的CEO Sam Altman上个月在伦敦与开发者见面时透露的。The Information还报道说，OpenAI的两个客户Aquant和在线教育服务可汗学院Khan Academy，都有兴趣在OpenAI的“大模型商店”上提供他们基于ChatGPT开发的垂直对话机器人。

亿欧评论

过去一周，360、腾讯和美图等多家中国科技公司相继推出了各自的大模型产品或解决方案。

但大模型并没有出现当年团购时代“百团大战”的残酷，尽管各家都会讲述自己的技术优势，并公布各种测试中相对竞品的领先优势。“百模大战”，与十多年前“百团大战”还是有很大不同，毕竟后者，那可是同质化内卷，是野蛮人互砍，是一段线下铁军重要性远超技术（当然技术也很重要）的蛮荒时代。

首先，各家都呈现出进一步细化的特征，在通用之外寻找更多领域的落地。

比如腾讯提出不做非聊天式应用，而是面向企业的行业大模型。实际上，在腾讯云公布行业大模型解决方案之前，各垂直领域的行业大模型早已被多家企业先后推出。腾讯不做通用的、聊天式的大模型，也是扬长避短。不过，从腾讯的企业特点上去推测，或许很多人会觉得其做通用聊天更具优势？反而在行业大模型上，更多创业企业远比腾讯更处于细分行业一线，如推出自动驾驶、医疗、地产、安全、智能物联等行业大模型的诸多背后企业。

而美图集中于视觉创作、商业摄影、专业视频编辑、商业设计等领域，试图将美图需求从C端生活场景向B端生产力场景进阶，将AI 与影像生产力工具紧密结合。

360也认为GPT等通用大模型无法覆盖世界上太多的领域，这也正是行业大模型的机遇所在，“百模大战”最终比拼的将是各家应用场景落地能力。

其次，十多年前“百团大战”是新玩家在新赛道的野蛮竞争，双方都在起步，但起步就是贴身肉搏战，既分输赢，也决生死。当时的竞争，一度上是非理性的。而目前的“百模大战”，各大厂之间并没有你死我活的态度，而是更加理性，你玩你的我搞我的，大家唯一的对手其实就是ChatGPT。

当然，“百模大战”远不是“百团大战”，两者之间可比性本来就不多。大模型的竞争，目前看似乎既有匆忙的一面，也有气定神闲的一面，更考验企业长跑的能力。比如建设大规模分布式系统，进行分布式训练、推理的能力；比如以大模型为基础，部署商业化应用、运营商业生态的能力等等。

从PC时代到移动互联网时代，安卓ARM生态取代了Wintel生态，那么，大模型时代又将带来哪些变化，诞生哪些新霸主、新联盟？

大模型的竞争正在进入落地阶段，随着大模型竞争阵营的持续扩容，新的变化正在发生，甚至语音识别、OCR检测等传统应用领域原本的霸主，都感受到了新力量的震动与撼动。而谁能成为大模型时代新的霸主？这场“百模大战”，还远没有进入下半场。

模型腾讯

内容来源：亿欧网

特色频道

专题页面

大模型“百模大战”，为何不同于十多年前“百团大战”

最新内容