去可网 > 社会 > 正文

​大模型创业 300 天:成者 100 亿估值,80% 败者出局

2023-08-06 23:29 来源:去可网 点击:

大模型创业 300 天:成者 100 亿估值,80% 败者出局

作者:杨晓鹤,头图来自:视觉中国

2023 年,知名投资机构老虎基金募资不成的消息,悄然传遍了整个互联网。

在习惯了风口创业的过去 10 年中," 投资人寒冬 " 似乎还是第一次出现。这与新消费、直播带货、元宇宙几个风口悄然落幕,并购和中概股等退出渠道的大门半遮半掩,种种不利因素都息息相关,创投市场似乎要真正冷清下来。

创业公司融资艰难,大佬的二次创业也不好找方向。从美团退休的王慧文,研究了好一阵的 Web3 和元宇宙。被腾讯收购公司后离开的王小川,试水了 AI 医疗。但一切转变在 2022 年末,ChatGPT 3.5 发布,迅速让市场形成共识,AGI(通用人工智能)时代来了,全行业开始跑步入局大模型。

据了解,当时在低调创业的王小川,已经成立了公司做智能硬件。意图帮助有睡眠障碍的上亿人,打造一款治疗打鼾的智能枕头。当 3 月份大模型热潮兴起后,王小川用了 2 周时间做了决定,放下这个创业项目,布局大模型。

王小川找来原搜狗 CTO 杨洪涛帮忙接管医疗项目,原搜狗 COO 茹立云在这家公司的股份,也兑给了杨洪涛,追随王小川的大模型创业。王小川共拿出 5000 万美元成立 " 百川智能 ",并邀请了 Soul 的技术人才来做算法负责人,加速去做大模型。而王慧文的故事,大家就十分熟悉了,酒桌上发布英雄招募贴,成立光年之外公司做大模型。

在互联网大厂中,大模型也带来了翻天覆地的影响。有大模型的项目负责人,年前因为升职不成的问题,从而提出离职。年后 3 个月时间后,该集团 CEO 就成为大模型的总负责人,举公司之力 All in 大模型。

没有人想错过这波 AGI 时代的浪潮,大家都相信 AI 在经过三起三落的发展后,通用人工智能的奇点正在来临。毕竟在 AI 热潮下,类似 ChatGPT 和 Midjourney 等几十人规模的公司,创造 40 亿美金左右的估值,美股 " 七巨头 " 总市值一年飙至 11 万亿美元,大涨 60%。这些激动人心的爆发式增长的故事,再一次搅动了国内科技商业市场。

国内互联网大厂中,李彦宏、张勇、张一鸣、王兴等大佬都已经亲自挂帅,可以说除了拼多多,已经全部入局大模型。正如 7 月 19 日,微软和英伟达的市值增加了 1750 亿美元,马斯克在评价相关推文时惊叹:" 疯狂的时代。"

即将沉寂的科技商业市场,突然迎来了 AI 这一兴奋剂,也让互联网进入了最后一次的狂欢。

一、低谷中燃起的新曙光

李明是一家创业公司的 CEO,团队规模在 100 多人。2023 年是他最为融资发愁的一年。

最开始创业的过程十分顺利,早期拿到知名天使投资机构的天使和 A 轮融资。" 那时候工业互联网还是个热门赛道,也不像很多 AI 项目那么浮夸。" 李明告诉 AI 鲸选社,但 2023 年中,他在启动的新一轮融资中,慢慢发现了行情不对。

投资机构不仅看数据和故事,还要看营收了。此前执着产品化的李明,根本还没意识到,投资风向的变化。用梅花创投创始合伙人吴世春的话讲,就是现在投资项目 " 既要(技术),又要(数据),还要(营收)"。没办法,他开始找 FA 机构帮助融资,而且融资轮次也退步,求个 A++。

"FA 帮找了 30 多家投资机构,都不了了之了。" 融资的不顺利,让李明有些泄气。但在 6 月份,他感受到大模型的威力,于是内部上马了基于 ChatGPT 的产业化业务。" 现在也还没融到资,不过投资人会主动找来交流,对方明显感兴趣了。"

而对于袁进辉的一流科技来说,大模型也是个救命稻草。2022 年,这家做 AI 深度学习框架的公司,已经到了融资不顺,不得不裁员生存的地步。此前公司 3 次濒临资金链断裂,都是找天使投资人,也是当时快手 CEO 的宿华借钱。

" 做的事情和百度的飞桨、华为昇思差不多,最重要的是那时候市场大模型训练的业务还没起来。" 一流科技员工告诉 AI 鲸选社,公司属于有钱的时候(2021 年)没业务,有业务的时候(2023 年)没钱了。

就在袁进辉感觉前途无望的时候,2023 年公司迎来了收购的机会。2023 年 4 月份,在清华科技园的一流科技公司内,迎来了一位贵宾,他就是刚刚宣布进军大模型的美团联合创始人王慧文。

最终的收购价格还可以,一位被裁员的一流科技的员工告诉我们," 能与上一轮高瓴资本投资的估值相当,自己的期权也有着落了。"

而成为光年之外联合创始人的袁进辉,终于再也不用为融资发愁。王慧文的融资能力,在当下创投圈无出其右。根据后来的美团收购协议显示,光年之外在没有大模型产品的情况下,就融资了 20 亿元。

当然,这波行动中更早布局的投资人,已经成功狩猎到独角兽。

Minimax 是在 2021 年 11 月成立,在 2022 年 1 月获得天使轮投资,2023 年初公司估值就达到独角兽级别。最早 4 家投资机构中,还有上海游戏公司米哈游,据悉是因为两家创始高管中有家人关系。而据鲸选社了解,智谱最近也在以 100 亿人民币的估值融资。

这两家公司的成立时间都不到 2 年,却都已经成为独角兽,大模型赛道的发展速度惊人。

而 AGI 热潮,对于那些老牌 AI 公司也是一次救赎。此前,出门问问的 IoT 上市故事,已经历经几次无功而返。伴随着大模型 " 序列猴子 " 和 4 款 AIGC 产品的故事推出,尽管其大模型还小心翼翼不对外公开测评,但也让出门问问终于有了新故事可讲,目前已经提交港股上市申请。

更多的大模型和 AIGC 创业者走在了路上,甚至在一家创业营里,60% 的项目都和 AI 相关,拥有轻资产、高壁垒、天花板高的优点,AGI 彻底成为当下最火的赛道。

二、将 AGI 的梦想做到最巅峰

如果说 2023 年是大模型创业 " 元年 "。那么互联网大厂最早入局大模型的 " 源年 ",则可以追溯到 2019 年。

阿里是 2019 年 9 月开始布局大模型,2021 年 4 月发布 PLUG 大模型。而早在 ChatGPT 3.0 面世之前,国内就已经有多家万亿参数的大模型,他们分别是达摩院的 M6 和华为云的盘古大模型,以及智源的悟道 2.0。和 ChatGPT 相比,尽管模型参数超越了,但数据丰度不一样,效果还没法比较,在达摩院的张聪看来,国内大模型起大早赶晚集,最重要的是没做两件事。

第一件事是没做对齐。那时候阿里有很多大小模型,主要没有做训练结果对齐。" 你看现在 ChatGPT 能做诗会聊天,很像人的智力,实际上就是与人的价值观对齐。" 张聪讲道,这些都需要对推理结果进行人为调整,而不是用机器的逻辑去做。

第二没有去做高质量的数据集,ChatGPT 早期利用菲律宾的大学教授进行数据标注,国内是利用中专生做标注,语料的问题也十分影响结果。在张聪看来,7 月 19 日公布的 Llama 2 的精调 Chat 模型,就是在 100 万人类标记数据上训练的,训练 token 总数增加了 40%,相比 Llama 的提升是全方位的。" 所以大模型并不是大力出奇迹的发明,而是精心设计的工程创造 "。

并且反观国内 AI 产业,也会面临很多其他因素干扰。当时,达摩院主要有两个团队做大模型,一个是金榕领导的机器智能团队,司罗负责的是 AliciMind;一个是周靖人领导的自然语言实验室,其中杨红霞负责的是大模型 M6。

在 2022 年末的测评中,M6 大模型的成果稍具优势,二者最终整合成现在的通义大模型。" 实际上,达摩院大模型团队只有二三十人,主要它的预训练,都放在阿里云。" 张聪告诉 AI 鲸选社,不过现在通义是集团的重要项目,涉及到的人员有 600 多人,现在很多资源都倾斜给大模型,集团 CEO 每 2 周过问一次技术进展。

而对于百度来说,这波 AGI 热潮,可是自己从 2016 年就预言来临的 AI 时代,自然也不会错过。

今年 2 月 7 号在内部正式立项,3 月 16 号正式发布。这期间直接上升到百度集团优先级最高的项目, 李彦宏亲自督战,CTO 王海峰博士直接挂帅,那时候百度阳泉超算中心就专门为大模型训练。

百度算法工程师赵辉告诉 AI 鲸选社,百度自然语言处理部一直就在研究 NLP 等技术,首席科学家吴华也一直是领导,这个部门就有几百人。百度的 ERNIE2.0 后转成文心大模型," 以前就在做百度大脑,现在都说是大模型文心么。"

做的事情有相似,当然也有区别。赵辉提到,以前百度会做很多垂直搜索的 Rank,就是为了根据人为的点击,重新排序搜索的结果。大模型出现后,这些能力都会被沉淀在大模型的算法中,也有利于给出的回答更精准。

对于百度来说,大模型推动下一代搜索质变,已经写进了李彦宏的 OKR。不过,对于生态来说,百度的文心大模型是基于 bert 模式," 包括智源的 GLM 都是独立的技术路线,和国际的 GPT 并不一样。" 一位百度云的人员告诉 AI 鲸选社,这点其实倒也不用担心,文心千帆什么类型的模型都有,GPT2、3、4 也非常不同。

而说回从阿里离职的杨红霞, 她在去往海外后,也被字节跳动挖去做北美大模型的研发负责人。张一鸣一直在研究大模型会开源还是闭源,所以也没要求集中力量赶工。" 年底前会有真正意义上的突破。" 杨红霞对 AI 鲸选社说道。

综合来看,字节跳动应该是继百度之后,在业务上与大模型更匹配的公司。有猎头告诉我们,虽然大模型不着急,但在 AIGC 领域还是挺激进。比如 TikTok 在做广告创意业务 AIGC,总监职务给出预算 100~150W,要求是 88 后带队。

至此,互联网大厂除了拼多多,已经全部入局大模型。大厂入局的热情,甚至比当年的 O2O 和直播还有过之而无不及。

三、分水岭突然出现的那一夜

6 月份,在北京搜狐大厦,光年之外这家融资最多的大模型企业,正热火朝天地创业。

原一流科技的 Oneflow 深度学习框架还寻思继续做,但被大模型业务抽调了很多人。可就在 6 月 23 日,突然有人在社交媒体上透露王慧文病了,当时公司还有人去求证,得到的是没有这回事的消息。可是在 25 日晚,美团突然宣布联合创始人王慧文因为抑郁症住院,辞去公司董事一事,其创业的光年之外公司面临出手的新闻。

一时间,光年之外做不下去,王慧文提前跑路的新闻,成为一些人的猜测。AI 鲸选社从投资人圈得到的消息,是王慧文的病情确实很严重。最后王慧文睡在上铺的兄弟,美团创始人王兴帮助接盘了光年之外。

大模型真的不行了吗?大家萌生出此疑问。那期间,正好知名投资人朱啸虎和猎豹创始人傅盛也在朋友圈争论,大模型行业是否有泡沫。朱啸虎极度看衰市场一拥而上,做通用大模型的现状,认为绝大多数都会在年底死掉。

光年之外的主动变动,也是否印证了朱啸虎的言论?

从 AI 鲸选社获得信息看,收购了光年之外的美团,目前并没有停止大模型的脚步。不仅独家投资了智谱 AI 数亿元,当下还在招聘大模型的项目总监,给出的年薪高达 300 万元,甚至还在美国成立技术研究院。赚辛苦钱的美团,也并不想在这波科技大潮中落后,尤其在饿了么明确要接入通义大模型,有业务竞争的携程,也已经推出了大模型之后。

但对于国内市场来说,通用大模型确实已经太多。据不完全统计,短短不到 8 个月时间,已经有超过 85 家大模型发布,其中很多成了上市公司的套现概念。

Wind 数据显示,2023 年 24 家 "AIGC 概念股 " 已经合计发生 67 笔减持,大股东的离婚潮也令人惊叹。2023 年初至今,近十家 AI 板块公司大股东家庭被曝离婚。备受关注的是,A 股 AI 企业昆仑万维,最近就发生占股 11% 的李琼女士(创始人周亚辉的前妻),计划减持 3% 的股份(大概 13 亿元),然后有息借给公司。据了解内情的人向 AI 鲸选社介绍,感受到了 AGI 红利的昆仑万维,不仅做了大模型,最近还在密集组建团队,全力以赴做对标微软的 Copilot。

上市公司利用 AGI 抓紧炒概念,套现离场。大模型创业公司则在内卷到死。

一位在近期成立了 AIGC 基金的投资人张阳告诉我们,伴随着开源免费且强大的 Llama 2 袭来之际,下半年很多大模型企业势必会面临融资难的问题。

如今一切已经有端倪,在 7 月 11 日,百川智能推出了百亿级别参数的大模型 Baichuan-13B,不仅宣布开源,同样还是免费可商用。虽然 Baichuan-13B 的参数规模不大,但是基于精准的中文语料训练,在百亿规模参数的大模型中,百川经常排名头部。

Baichuan-13B 的免费策略,大大冲击了国内大模型付费行情。目前,智源 AI 就在 14 日宣布,企业登记获得授权,允许免费商业使用 ChatGLM-6B 和 ChatGLM2-6B。

越来越多的大模型开源免费后,大模型的死亡淘汰赛正式开启。一位基于大模型创业公司的 CTO 对 AI 鲸选社表示,智源的大模型从最开始的私域部署要 2000 万元,到年初的调用价格为 180 万到 30 万选包,再到现在的免费,行业变化非常之快。傅盛认为这是市场从大模型参数之争,进入生态规模之争。

互联网大厂并不愁生态建设,由于内部模型非常多,也有免费和付费之分,最主要的大模型目前还是闭源和付费形态。创业公司要建立生态就比较困难,很多初创企业做大模型已花光了力气,做生态就难免力有不逮。据了解目前 MiniMax 是创业公司中,为数不多坚持公有云,做 MaaS 模式的大模型企业。

丁香园 CTO 范凯形容这波开源免费潮,就像把自来水厂(大模型)免费接到用户家里,让每家人手一个水龙头,那些闭源的自来水厂,最好你的水无敌好喝,大家才愿意付费去你那。

四、AGI 发展进入分岔路口

分水岭出现后,当下创业竞争已经发展了三派。

一派是坚持全自研大模型,都是实力选手。这一派主要是百度、阿里、字节等互联网大厂以及智谱、MiniMAX、衔远等创业企业。但这些实力选手也被划分成两类企业。

第一类是坚持做自研的通用大模型,对标 ChatGPT,不断追赶 ChatGPT 的迭代速度。

在云启资本董事合伙人陈昱看来,通用大模型是必经之路,垂直大模型发展受限。" 因为对于通用大模型而言,垂直领域并不需要重新训练,通用大模型可以通过向量数据库做行业深化,垂直大模型却很难智能涌现。"

从目前看,有梦想的肯定还要做通用大模型,毕竟做成了可以成为下一个互联网大厂。ChatGPT 在协同办公、电商、代码生成、辅助设计等领域已经展现出了这种颠覆性潜质。

第二类是认清现实聚焦落地,坚持做垂直大模型,这一派包括最后达成观点统一的朱啸虎和傅盛,二者都认为垂直大模型将更有产业适用性。

通用大模型一般是在千亿参数以上,而垂直大模型则在百亿或者 70 亿规模左右。达观数据的大模型产品曹植,参数就都在 500 亿规模之间。

据达观数据的 CEO 陈运文告诉 AI 鲸选社," 曹植 " 大模型采用混合训练数据方案,分别是 50% 的通用混合语料 +50% 垂直专业语料。" 我们在金融、政务等领域做文本智能很多年,很多数据是独有的,客户也要求我们做私有化训练。" 陈运文告诉 AI 鲸选社," 以前四五个人用一个星期做一份报告,现在 AI 半天做好了。"

放弃成为下一个 ChatGPT 的梦想,才能在商业场景中尽早落地,这是很多垂直大模型的清醒认知。

在行业看来,通往 AGI 圣殿的第二条路线,是基于别人的模型(如 GPT),然后结合自己的行业 Know-how 去做训练。" 对于第二类能不能成功,我觉得需要时间去验证,现在还不明确。原因在于大家还不知道如何把行业 Know-how 去和大模型做融合的有效路径,如何在有护城河的同时又有可持续的商业模式,这仍是个未知数。"

" 尤其很多大模型,本身就有套壳的嫌疑," 投资人张阳告诉 AI 鲸选社,结合行业做商业化的时候,就会面临很多问题。据悉,两个知名同姓创业者的大模型,是基于 Faceboook 的开源 Llama;某游戏和防护公司用的是智源大模型的基础框架。

更强的开源大模型正在来袭,Meta 近期发布免费可商用版本 Llama 2,傅盛对此就在朋友圈表示:" 这一下不知道多少公司笑醒在深夜,多少公司哭晕在厕所 …." 朱啸虎对此也评论道:很多人要笑醒了吧,大家都可以 Take free ride(搭便车)了。

傅盛的 " 笑醒 " 所指,和朱啸虎略有不同。傅盛笑醒指的是使用开源大模型开发 AIGC 应用的企业,也能做出更好的产品,朱啸虎笑醒是指那些号称自研实则套壳的大模型企业,最近也要宣布升级了。大家所指的哭晕内容相同,都是那些号称自研的大模型企业,国外大模型最强之一 Llama 2 宣布开源免费,大家都基于相同的开源大模型,怎么在行业中做出特色能力?

AGI 的第三条路线是纯粹做应用,是将模型拿来直接使用,这种的壁垒会较低。朱啸虎也不看好这类模式,认为如果 90% 的能力是 ChatGPT 提供,那么 AIGC 应用就没有什么投资价值。

在 OpenAI 的生态中,山姆 · 奥特曼承诺尽量避免做应用层,和生态开发者竞争,因此效仿 Google 做了 ChatGPT Plugin,从目前看,国内还没有谁做出这种承诺。

文心一言和通义千问,已经有了上百个功能更新,这些功能也覆盖了一些开发者的工作。虽然文心一言也有插件,但目前就两个,一个是百度搜索,另一个是 ChatFile(长文档的分析处理能力)。百度千帆和阿里魔搭的生态发展如何协调,还是个有挑战的命题工作。

坚定看好 AGI 的朱啸虎,认为通用大模型的创业和投资窗口期已过,不绝对依赖某家大模型能力的 AIGC,才是 AGI 时代低垂的果实。比如,近期朋友圈突然蹿火的 " 妙鸭相机 ",算是国内 AIGC 第一个爆火的产品,国外也曾火过类似的产品 "lensa",月收入曾达到 800 万美元。

时代的浪潮袭来之际,投资人吴世春就曾打趣问道朱啸虎:" 投 AI 赚的钱把投 SaaS 亏的钱,弥补回来了吗?" 朱啸虎回答,还没,但是 AI 的前景无限。

目前,创投圈也都认可朱啸虎表达的道理,但很多人并不期待朱啸虎说出实话,诸如 "ChatGPT 对创业公司很不友好,未来两三年内请大家放弃融资幻想 " 这些带有寒意的话。

" 大模型就是互联网的房地产,就算有泡沫也是美丽的泡沫,"一位刚下场做 AI 职业教育培训的创业者说道,雷军曾在 2013 年互联网红利消失之际疾呼,要相信互联网的力量,今天我们也要相信 AGI,无论它有没有泡沫。

注:本文中李明、张聪、赵辉等为化名。