当前位置：资讯 > 正文

大模型的新战场

2023-09-08 09:22:01 定焦公众号

声明：本文来自于微信公众号定焦（dingjiaoone），作者：温故，授权站长之家转载发布。

9月5日一早，北京国贸大厦，这座北京CBD核心区曾经的最高楼，A座一层入口处挤满了人。两位保安拉出隔离绳，切开两条道，才勉强维持住秩序。

(资料图)

进门有两个签到台，左手是媒体，右手是嘉宾。临近9点活动正式开始的时间点，还有人源源不断前来。他们都是来参加一场由百度公司举行的大模型会议。

五天前，百度刚宣布文心一言向全社会全面开放，所有人都能注册使用，而不用再申请内测名额。这是国内第一个通过监管备案的大模型产品。

这场会议，吸引了来自全国各地的人。因为人数实在太多，在开场前三分钟，现场关闭了通往三层主会场的通道，然后引导参会者前往旁边的嘉里大厦分会场，那里有大屏幕可以看直播。

分会场的座位没多久也全部坐满了，中途还不停有人进来。一位从外地赶来的从业者盯着屏幕嘟囔着，这次不能在现场见到李彦宏了。

作为中国对AI投入最早的大厂之一，百度踩上了新一波AI浪潮，这让它在业内的关注度快速上升。

但竞争也无比激烈。就在会议开始前半小时，科大讯飞宣布，讯飞星火认知大模型面向全民开放。没多久，讯飞星火APP登上了苹果应用商店免费排行榜的榜首。此前，刚拿下榜首的是文心一言。

百度董事长兼CEO李彦宏说，模型本身是不直接产生价值的，基于基础大模型开发出来的应用才是模型存在的意义，对于创业者来说，“卷大模型没有意义，卷应用机会更大”。

从内测走向开放，从拼参数到拼应用，中国大模型进入新战场。

等待发令枪响

对于中国的大模型厂商而言，8月31日是很特殊的一天。这一天，北京、上海率先通过了大模型备案。

所谓大模型备案，是指大模型产品在向公众开放及商用之前，必须拿到监管部门的备案审批。没有经过备案，就只能小范围内测，大部分人无法注册使用。

百度早在3月16日就发布了文心一言，后来阿里发布通义千问，科大讯飞推出讯飞星火，这些大模型之前一直在内测阶段。即便用户下载了APP，也无法注册账号。

目前，有两条跟AI产品备案相关的政策法规，一是1月10日开始施行的《互联网信息服务深度合成管理规定》，二是8月15日开始施行的《生成式人工智能服务管理暂行办法》。

政策规定，生成式AI产品上架之前，一要进行算法备案，二要通过安全评估，业内称为“双新评估”。这可以被视为大模型应用进入市场的门槛。

一家AI创业公司的创始人对「定焦」说，几个月前，很多企业就启动了算法备案，有些企业还主动跟监管部门沟通，了解安全评估的要求，以尽早通过备案评估。

国内的AI大模型集中发布于四五月前后，《生成式人工智能管理办法》在4月11日发布征求意见稿，8月15日开始生效。这四个月的时间里，很多企业赶在生效前申请，想要率先拿到审批。

通过备案对厂商很重要。一方面这是产品推向市场的前提条件，另外，它在某种程度上代表官方认可，是一种无形的背书。目前备案以地域划分，因此各地监管部门都在加速审批，企业也在等待通知，随时准备对外宣布进展。

8月31日凌晨，0点刚过，百度通过公众号对外宣布，文心一言向全社会开放。在新闻稿中，百度特地用到了“率先”一词。

“百度是提前准备好了的，相关部门允许上线的时间应该就是8月31日。”一位AI大模型创业者说。

卡着点官宣，让百度成为备案政策生效半个月以来，第一个正式通过备案的企业。北京也跑在了其他城市的前面。

紧接着在凌晨3点，百川智能也宣布通过生成式人工智能备案，即日起开放公众服务，它也用到了“率先”一词。

清华系AI公司智谱华章也通过了第一批备案，但它直到31号下午6点多才对外宣布，上线了一款生成式AI助手“智谱清言”，APP和微信小程序都能体验。它是第一批里面唯一一个推出了小程序的公司。

另一个抢跑的城市是上海。

总部在上海的AI公司商汤，在31日中午12点半宣布，大语言模型应用“商量SenseChat”即日起开放服务;MiniMax在下午3点多，正式宣布“abab”大模型全面开放服务。

24小时之内，通过备案的企业纷纷主动官宣，刷一波存在感。

市场普遍认为，第一批通过备案的大模型公司至少有8家，其中北京5家（百度的 “文心一言”、抖音的 “云雀”、百川智能的 “百川大模型”、智谱华章的 “智谱清言”、中科院的 “紫东太初”），上海3家(商汤的 “商量 SenseChat”、MiniMax 的 “ABAB 大模型”、上海人工智能实验室的 “书生通用大模型”)，另外广东的2家和安徽的1家会陆续开放。开放的时间取决于各省市的审批进度，而且各省市的名额有差别。

安徽的那家是科大讯飞，直到9月5日才宣布通过备案，比北京和上海的几家企业晚了近一周时间。而被认为会在第一批备案名单里的阿里“通义千问”、360智脑，目前尚没有更多消息。

寻找爆款应用

监管放开备案，给大模型厂商们开辟了一个新战场。

之前，由于没法开放注册，厂商们只能在圈内刷存在感，通过霸榜一些国际测评榜单，来证明自己技术实力优秀。现在，C端用户都能使用了，竞争更加市场化，是骡子是马拉出来溜溜，优劣更容易评判了。

用户争夺战率先打响。

根据百度发布的“战报“，文心一言开放首日，APP迅速登顶手机应用商店排行榜，开放下载19小时内用户突破100万，累计回答网友3342万个问题。

讯飞星火APP开放下载当日，也登上了苹果应用商店免费排行榜的榜首。科大讯飞发布“战报”，讯飞星火上线14小时用户突破100万。这个速度超过了文心一言。

不过，这其中有多大“含金量”难以判断，热度能持续多久更是存疑。

当用户涌入之后，产品体验、运营、服务的重要性上升。但不是所有厂商都准备好了。

第一批备案名单里的商汤SenseChat，称所有用户都能注册使用。但是当你打开它的官网，会发现无法注册，页面提示“抱歉，当前注册人数过多”。

算力依然制约着大模型应用的推广。

盛景嘉成董事总经理刘迪对「定焦」分析，现在算力非常稀缺。“用来做微调和日常的B端业务处理都已经很紧，C端的量一旦上来，有些公司会支撑不住。”

百度在文心一言放开后的第12个小时发通知称，正在调集新的算力，“请大家减少调戏，为工作和学习目的的用户让路”。

这跟移动互联网早期的情况类似，高并发对服务器的要求很高，可能导致网站崩溃，而大模型对算力要求更高，为之付出的成本更加高昂。

AI生成信息的准确性也是个问题。

即便是准备最充分的百度文心一言，也还是避免不了“幻觉”现象。有人问它“2023年每个月的汽车出口数据”，它一本正经地把今年剩下四个月的数据都列出来了。

多位从业者认为，短期内出现爆款应用的概率不大。

启明创投合伙人叶冠泰对「定焦」说，监管放开是个重要时点，但不会马上出现爆款应用，因为目前大模型还是通用并且不实时，需要有一点沉淀的时间。从一个尝鲜的角度，用户量会涨很快，但不会持久。

前段时间“妙鸭相机”刷屏，成为国内第一个面向C端的、收费的、刷屏的AIGC应用，让中国的大模型厂商看到了希望。但这款产品最终昙花一现，热度只持续了一周时间。

不过对于厂商们而言，这或许不是那么重要。厂商看中的是用户数据。李彦宏说，当文心一言向数以亿计互联网用户大规模开放服务后，能够获得大量真实世界中的人工反馈，这将进一步改进基础模型，并以更快速度迭代文心一言。

在赚走一波热度后，厂商们有更大的野心。

开始养家糊口

放开C端注册之后，大模型厂商憧憬着，通过C端赚钱。

ChatGPT已经为行业打了个样。今年2月， ChatGPT 推出Plus付费项目，起价为每月20美元。这类似订阅制，Plus会员能调用GPT-4版本，享受更快的相应速度，优先获得新功能。当时ChatGPT的注册用户已超过1亿人。

当用户规模足够大，用订阅模式赚钱，是一种很成熟的商业模式。但在中国，用户的付费意识还需培养。

“C端的会员订阅在国内不太现实，互联网产品过去就没有培养起C端付费的市场。”跃盟科技创始人王冉说。

现在讲大模型在C端的产品形态，包括变现方式，似乎还有点早。厂商们对产品的定义也还没有那么清楚。

事实上，大部分大模型厂商，包括OpenAI在内，商业化主要还是通过to B的方式——出售大模型API（应用程序编程接口），按调用次数收费;输出大模型解决方案，赚开发服务的钱。

面向B端（开发者和企业）的API接口调用，一直都是OpenAI的重心。早在2020年，OpenAI就开始进行API接口邀请测试，一些搜索公司、教育公司、社交媒体公司成为OpenAI最早的客户，它们调用GPT的API，将OpenAI的软件集成到他们的产品中。

8月28日，OpenAI上线企业专用版本的ChatGPT。这个版本针对企业客户的需求，在功能上做了更深层的定制，目前没有对外公开价格。OpenAI称，接下来还将针对小型机构推出ChatGPT商务版本，并提供更多定制化选项。

从OpenAI的布局能看出来，它一直在B端市场发力。ChatGPT对OpenAI的意义，目前不是商业化变现，而是在于打响知名度，证明技术实力，并由此抬高公司估值。过去几个月，OpenAI又完成了巨额融资，员工数量扩大了好几倍。

国内厂商借鉴了这一思路。百度文心一言、讯飞星火认知大模型，先后冲榜苹果应用商店，像电商平台在“双11”发战报一样做宣传，都是为了引发外界关注。

毕竟，没有什么方式比做出一个爆款应用，更能证明公司的技术和产品实力。

即便短期打造不出爆款应用，向C端开放也能促进B端生意的增长。

一家做系统集成公司的员工对「定焦」说，百度的千帆大模型刚上线时，他们就拿到了接入的名额。这是一个面向B端的企业级大模型平台，可以调用文心一言的服务，也可以开发、部署和调用自己的大模型。

但当时文心一言在内测，他们跟客户合作开发时，拿账号要走内测的内部流程，相对麻烦。现在放开使用后，“用的人多了，客户更了解这个产品，会有一些新需求出来，更利于我们开展业务。”

一位百度智能云生态企业的员工对「定焦」说，“C端放开注册，会让更多人知道大模型，先有C端体验，然后促进B端使用。”

现在，国内的大模型厂商在对外秀肌肉时，不再强调大模型的参数和性能，而是更突出签约客户的数量、落地的行业和场景。它们变得更加务实。

摸着自己过河

通过了备案，中国大模型厂商们接下来面临的最大挑战，是这条路没有人走过，它们得摸着自己过河。

美国的OpenAI走过的路、掀起的热潮，在国内无法直接复制。

在中国放开大模型审批之前，美国以ChatGPT、Character AI为代表的产品，已经在全球多个国家开放使用，ChatGPT在两个月内狂揽1亿用户，后来者Character AI的首周下载量超过了ChatGPT。

但经历完早期几个月的流量暴涨，ChatGPT略显疲态。根据第三方机构SimilarWeb的监测数据，从4月开始，ChatGPT的环比增长开始放缓，5月几乎没有增长，7月用户数量从6月的17亿人降至15亿人，环比降幅达到12%。

这说明看热闹的人少了，普通大众对AI大模型的关注度在下降。

之前无论投资圈还是产业界，都在说要做“中国的OpenAI”，现在大家开始考虑，做出什么样的应用，能够真正解决产业问题和用户需求。

一些人说要做AI原生应用。按照李彦宏的说法，AI原生应用不是对移动互联网APP和PC软件的简单重复，而要能解决过去解决不了、或解决不好的问题。

这就像当年从PC互联网到移动互联网过渡，那些真正爆款的应用，都是押注移动互联网，在新的技术平台开发，而不是对PC产品的修修补补。典型的例子是微信的崛起。

现在大家相信，依靠大模型的能力，或许能开发出完全不一样的新应用。

一位AI创业者说，真正的AGI原生应该是用AGI的推理能力重新组织业务的关键流程，进而重构产品形态和人机交互。如果仅仅是用AGI里的AIGC功能生成内容和文本，那只是改变内容的生产效率，新酒装老瓶。

押注新技术和新平台的风险也是巨大的。跟移动互联网刚兴起的时候相比，现在最大的变化是流量红利消失了，新应用的推广成本非常高。大厂或许可以借助现有的超级APP导流，创业公司突出重围的难度增加。

英诺天使基金管理合伙人王晟对「定焦」分析，在C端市场，现在无论是打造一款用户规模很大的应用，还是一个新的生态平台，都非常困难。“系统性流量红利没有了。”

在商业化路径相对清晰的B端市场，由于OpenAI的产品没有进入中国，给中国厂商留下了一定的时间窗口。

一位做AI招聘的创业者对「定焦」说，他们的产品一开始接入了ChatGPT的接口，随着国内大模型放开，正考虑更换成国内大模型。“现在有些客户尤其是有一定政府背景的，他们还是比较在意这一块”。

王冉对「定焦」表示，接下来大模型会在垂类场景里不断优化，技术公司或产业领域的头部企业，大概率会做自己的专用模型。一些行业会形成行业模型和大模型混用的局面，私域模型占主导，公域模型做协调配合。

在这个过程里，业务数据会成为稀缺资源。“AI大模型的核心不是AI本身，跟业务结合是最难的事。随着一些大模型开源，越来越多的公司会自己做百亿参数规模的大模型，真正值钱的不是参数，而是业务数据和行业knowhow，这是所有大模型公司都在抢的东西。”王冉说。

一个新的共识是，随着大模型放开，行业会重新洗牌，有些大模型会被淘汰出局。流量逐渐向头部集中，不同梯队厂商之间的差距进一步拉大。

为你推荐