大模型创业 300 天：成者 100 亿估值，80% 败者出局

2023-08-06 23:29 来源：去可网点击：99

大模型创业 300 天：成者 100 亿估值，80% 败者出局

作者：杨晓鹤，头图来自：视觉中国

2023 年，知名投资机构老虎基金募资不成的消息，悄然传遍了整个互联网。

在习惯了风口创业的过去 10 年中，" 投资人寒冬 " 似乎还是第一次出现。这与新消费、直播带货、元宇宙几个风口悄然落幕，并购和中概股等退出渠道的大门半遮半掩，种种不利因素都息息相关，创投市场似乎要真正冷清下来。

创业公司融资艰难，大佬的二次创业也不好找方向。从美团退休的王慧文，研究了好一阵的 Web3 和元宇宙。被腾讯收购公司后离开的王小川，试水了 AI 医疗。但一切转变在 2022 年末，ChatGPT 3.5 发布，迅速让市场形成共识，AGI（通用人工智能）时代来了，全行业开始跑步入局大模型。

据了解，当时在低调创业的王小川，已经成立了公司做智能硬件。意图帮助有睡眠障碍的上亿人，打造一款治疗打鼾的智能枕头。当 3 月份大模型热潮兴起后，王小川用了 2 周时间做了决定，放下这个创业项目，布局大模型。

王小川找来原搜狗 CTO 杨洪涛帮忙接管医疗项目，原搜狗 COO 茹立云在这家公司的股份，也兑给了杨洪涛，追随王小川的大模型创业。王小川共拿出 5000 万美元成立 " 百川智能 "，并邀请了 Soul 的技术人才来做算法负责人，加速去做大模型。而王慧文的故事，大家就十分熟悉了，酒桌上发布英雄招募贴，成立光年之外公司做大模型。

在互联网大厂中，大模型也带来了翻天覆地的影响。有大模型的项目负责人，年前因为升职不成的问题，从而提出离职。年后 3 个月时间后，该集团 CEO 就成为大模型的总负责人，举公司之力 All in 大模型。

没有人想错过这波 AGI 时代的浪潮，大家都相信 AI 在经过三起三落的发展后，通用人工智能的奇点正在来临。毕竟在 AI 热潮下，类似 ChatGPT 和 Midjourney 等几十人规模的公司，创造 40 亿美金左右的估值，美股 " 七巨头 " 总市值一年飙至 11 万亿美元，大涨 60%。这些激动人心的爆发式增长的故事，再一次搅动了国内科技商业市场。

国内互联网大厂中，李彦宏、张勇、张一鸣、王兴等大佬都已经亲自挂帅，可以说除了拼多多，已经全部入局大模型。正如 7 月 19 日，微软和英伟达的市值增加了 1750 亿美元，马斯克在评价相关推文时惊叹：" 疯狂的时代。"

即将沉寂的科技商业市场，突然迎来了 AI 这一兴奋剂，也让互联网进入了最后一次的狂欢。

一、低谷中燃起的新曙光

李明是一家创业公司的 CEO，团队规模在 100 多人。2023 年是他最为融资发愁的一年。

最开始创业的过程十分顺利，早期拿到知名天使投资机构的天使和 A 轮融资。" 那时候工业互联网还是个热门赛道，也不像很多 AI 项目那么浮夸。" 李明告诉 AI 鲸选社，但 2023 年中，他在启动的新一轮融资中，慢慢发现了行情不对。

投资机构不仅看数据和故事，还要看营收了。此前执着产品化的李明，根本还没意识到，投资风向的变化。用梅花创投创始合伙人吴世春的话讲，就是现在投资项目 " 既要（技术），又要（数据），还要（营收）"。没办法，他开始找 FA 机构帮助融资，而且融资轮次也退步，求个 A++。

"FA 帮找了 30 多家投资机构，都不了了之了。" 融资的不顺利，让李明有些泄气。但在 6 月份，他感受到大模型的威力，于是内部上马了基于 ChatGPT 的产业化业务。" 现在也还没融到资，不过投资人会主动找来交流，对方明显感兴趣了。"

而对于袁进辉的一流科技来说，大模型也是个救命稻草。2022 年，这家做 AI 深度学习框架的公司，已经到了融资不顺，不得不裁员生存的地步。此前公司 3 次濒临资金链断裂，都是找天使投资人，也是当时快手 CEO 的宿华借钱。

" 做的事情和百度的飞桨、华为昇思差不多，最重要的是那时候市场大模型训练的业务还没起来。" 一流科技员工告诉 AI 鲸选社，公司属于有钱的时候（2021 年）没业务，有业务的时候（2023 年）没钱了。

就在袁进辉感觉前途无望的时候，2023 年公司迎来了收购的机会。2023 年 4 月份，在清华科技园的一流科技公司内，迎来了一位贵宾，他就是刚刚宣布进军大模型的美团联合创始人王慧文。

最终的收购价格还可以，一位被裁员的一流科技的员工告诉我们，" 能与上一轮高瓴资本投资的估值相当，自己的期权也有着落了。"

而成为光年之外联合创始人的袁进辉，终于再也不用为融资发愁。王慧文的融资能力，在当下创投圈无出其右。根据后来的美团收购协议显示，光年之外在没有大模型产品的情况下，就融资了 20 亿元。

当然，这波行动中更早布局的投资人，已经成功狩猎到独角兽。

Minimax 是在 2021 年 11 月成立，在 2022 年 1 月获得天使轮投资，2023 年初公司估值就达到独角兽级别。最早 4 家投资机构中，还有上海游戏公司米哈游，据悉是因为两家创始高管中有家人关系。而据鲸选社了解，智谱最近也在以 100 亿人民币的估值融资。

这两家公司的成立时间都不到 2 年，却都已经成为独角兽，大模型赛道的发展速度惊人。

而 AGI 热潮，对于那些老牌 AI 公司也是一次救赎。此前，出门问问的 IoT 上市故事，已经历经几次无功而返。伴随着大模型 " 序列猴子 " 和 4 款 AIGC 产品的故事推出，尽管其大模型还小心翼翼不对外公开测评，但也让出门问问终于有了新故事可讲，目前已经提交港股上市申请。

更多的大模型和 AIGC 创业者走在了路上，甚至在一家创业营里，60% 的项目都和 AI 相关，拥有轻资产、高壁垒、天花板高的优点，AGI 彻底成为当下最火的赛道。

二、将 AGI 的梦想做到最巅峰

如果说 2023 年是大模型创业 " 元年 "。那么互联网大厂最早入局大模型的 " 源年 "，则可以追溯到 2019 年。

阿里是 2019 年 9 月开始布局大模型，2021 年 4 月发布 PLUG 大模型。而早在 ChatGPT 3.0 面世之前，国内就已经有多家万亿参数的大模型，他们分别是达摩院的 M6 和华为云的盘古大模型，以及智源的悟道 2.0。和 ChatGPT 相比，尽管模型参数超越了，但数据丰度不一样，效果还没法比较，在达摩院的张聪看来，国内大模型起大早赶晚集，最重要的是没做两件事。

第一件事是没做对齐。那时候阿里有很多大小模型，主要没有做训练结果对齐。" 你看现在 ChatGPT 能做诗会聊天，很像人的智力，实际上就是与人的价值观对齐。" 张聪讲道，这些都需要对推理结果进行人为调整，而不是用机器的逻辑去做。

第二没有去做高质量的数据集，ChatGPT 早期利用菲律宾的大学教授进行数据标注，国内是利用中专生做标注，语料的问题也十分影响结果。在张聪看来，7 月 19 日公布的 Llama 2 的精调 Chat 模型，就是在 100 万人类标记数据上训练的，训练 token 总数增加了 40%，相比 Llama 的提升是全方位的。" 所以大模型并不是大力出奇迹的发明，而是精心设计的工程创造 "。

并且反观国内 AI 产业，也会面临很多其他因素干扰。当时，达摩院主要有两个团队做大模型，一个是金榕领导的机器智能团队，司罗负责的是 AliciMind；一个是周靖人领导的自然语言实验室，其中杨红霞负责的是大模型 M6。

在 2022 年末的测评中，M6 大模型的成果稍具优势，二者最终整合成现在的通义大模型。" 实际上，达摩院大模型团队只有二三十人，主要它的预训练，都放在阿里云。" 张聪告诉 AI 鲸选社，不过现在通义是集团的重要项目，涉及到的人员有 600 多人，现在很多资源都倾斜给大模型，集团 CEO 每 2 周过问一次技术进展。

而对于百度来说，这波 AGI 热潮，可是自己从 2016 年就预言来临的 AI 时代，自然也不会错过。

今年 2 月 7 号在内部正式立项，3 月 16 号正式发布。这期间直接上升到百度集团优先级最高的项目，李彦宏亲自督战，CTO 王海峰博士直接挂帅，那时候百度阳泉超算中心就专门为大模型训练。

百度算法工程师赵辉告诉 AI 鲸选社，百度自然语言处理部一直就在研究 NLP 等技术，首席科学家吴华也一直是领导，这个部门就有几百人。百度的 ERNIE2.0 后转成文心大模型，" 以前就在做百度大脑，现在都说是大模型文心么。"

做的事情有相似，当然也有区别。赵辉提到，以前百度会做很多垂直搜索的 Rank，就是为了根据人为的点击，重新排序搜索的结果。大模型出现后，这些能力都会被沉淀在大模型的算法中，也有利于给出的回答更精准。

对于百度来说，大模型推动下一代搜索质变，已经写进了李彦宏的 OKR。不过，对于生态来说，百度的文心大模型是基于 bert 模式，" 包括智源的 GLM 都是独立的技术路线，和国际的 GPT 并不一样。" 一位百度云的人员告诉 AI 鲸选社，这点其实倒也不用担心，文心千帆什么类型的模型都有，GPT2、3、4 也非常不同。

而说回从阿里离职的杨红霞，她在去往海外后，也被字节跳动挖去做北美大模型的研发负责人。张一鸣一直在研究大模型会开源还是闭源，所以也没要求集中力量赶工。" 年底前会有真正意义上的突破。" 杨红霞对 AI 鲸选社说道。

综合来看，字节跳动应该是继百度之后，在业务上与大模型更匹配的公司。有猎头告诉我们，虽然大模型不着急，但在 AIGC 领域还是挺激进。比如 TikTok 在做广告创意业务 AIGC，总监职务给出预算 100~150W，要求是 88 后带队。

至此，互联网大厂除了拼多多，已经全部入局大模型。大厂入局的热情，甚至比当年的 O2O 和直播还有过之而无不及。

三、分水岭突然出现的那一夜

6 月份，在北京搜狐大厦，光年之外这家融资最多的大模型企业，正热火朝天地创业。

原一流科技的 Oneflow 深度学习框架还寻思继续做，但被大模型业务抽调了很多人。可就在 6 月 23 日，突然有人在社交媒体上透露王慧文病了，当时公司还有人去求证，得到的是没有这回事的消息。可是在 25 日晚，美团突然宣布联合创始人王慧文因为抑郁症住院，辞去公司董事一事，其创业的光年之外公司面临出手的新闻。

一时间，光年之外做不下去，王慧文提前跑路的新闻，成为一些人的猜测。AI 鲸选社从投资人圈得到的消息，是王慧文的病情确实很严重。最后王慧文睡在上铺的兄弟，美团创始人王兴帮助接盘了光年之外。

大模型真的不行了吗？大家萌生出此疑问。那期间，正好知名投资人朱啸虎和猎豹创始人傅盛也在朋友圈争论，大模型行业是否有泡沫。朱啸虎极度看衰市场一拥而上，做通用大模型的现状，认为绝大多数都会在年底死掉。

光年之外的主动变动，也是否印证了朱啸虎的言论？

从 AI 鲸选社获得信息看，收购了光年之外的美团，目前并没有停止大模型的脚步。不仅独家投资了智谱 AI 数亿元，当下还在招聘大模型的项目总监，给出的年薪高达 300 万元，甚至还在美国成立技术研究院。赚辛苦钱的美团，也并不想在这波科技大潮中落后，尤其在饿了么明确要接入通义大模型，有业务竞争的携程，也已经推出了大模型之后。

但对于国内市场来说，通用大模型确实已经太多。据不完全统计，短短不到 8 个月时间，已经有超过 85 家大模型发布，其中很多成了上市公司的套现概念。

Wind 数据显示，2023 年 24 家 "AIGC 概念股 " 已经合计发生 67 笔减持，大股东的离婚潮也令人惊叹。2023 年初至今，近十家 AI 板块公司大股东家庭被曝离婚。备受关注的是，A 股 AI 企业昆仑万维，最近就发生占股 11% 的李琼女士（创始人周亚辉的前妻），计划减持 3% 的股份（大概 13 亿元），然后有息借给公司。据了解内情的人向 AI 鲸选社介绍，感受到了 AGI 红利的昆仑万维，不仅做了大模型，最近还在密集组建团队，全力以赴做对标微软的 Copilot。

上市公司利用 AGI 抓紧炒概念，套现离场。大模型创业公司则在内卷到死。

一位在近期成立了 AIGC 基金的投资人张阳告诉我们，伴随着开源免费且强大的 Llama 2 袭来之际，下半年很多大模型企业势必会面临融资难的问题。

如今一切已经有端倪，在 7 月 11 日，百川智能推出了百亿级别参数的大模型 Baichuan-13B，不仅宣布开源，同样还是免费可商用。虽然 Baichuan-13B 的参数规模不大，但是基于精准的中文语料训练，在百亿规模参数的大模型中，百川经常排名头部。

Baichuan-13B 的免费策略，大大冲击了国内大模型付费行情。目前，智源 AI 就在 14 日宣布，企业登记获得授权，允许免费商业使用 ChatGLM-6B 和 ChatGLM2-6B。

越来越多的大模型开源免费后，大模型的死亡淘汰赛正式开启。一位基于大模型创业公司的 CTO 对 AI 鲸选社表示，智源的大模型从最开始的私域部署要 2000 万元，到年初的调用价格为 180 万到 30 万选包，再到现在的免费，行业变化非常之快。傅盛认为这是市场从大模型参数之争，进入生态规模之争。

互联网大厂并不愁生态建设，由于内部模型非常多，也有免费和付费之分，最主要的大模型目前还是闭源和付费形态。创业公司要建立生态就比较困难，很多初创企业做大模型已花光了力气，做生态就难免力有不逮。据了解目前 MiniMax 是创业公司中，为数不多坚持公有云，做 MaaS 模式的大模型企业。

丁香园 CTO 范凯形容这波开源免费潮，就像把自来水厂（大模型）免费接到用户家里，让每家人手一个水龙头，那些闭源的自来水厂，最好你的水无敌好喝，大家才愿意付费去你那。

四、AGI 发展进入分岔路口

分水岭出现后，当下创业竞争已经发展了三派。

一派是坚持全自研大模型，都是实力选手。这一派主要是百度、阿里、字节等互联网大厂以及智谱、MiniMAX、衔远等创业企业。但这些实力选手也被划分成两类企业。

第一类是坚持做自研的通用大模型，对标 ChatGPT，不断追赶 ChatGPT 的迭代速度。

在云启资本董事合伙人陈昱看来，通用大模型是必经之路，垂直大模型发展受限。" 因为对于通用大模型而言，垂直领域并不需要重新训练，通用大模型可以通过向量数据库做行业深化，垂直大模型却很难智能涌现。"

从目前看，有梦想的肯定还要做通用大模型，毕竟做成了可以成为下一个互联网大厂。ChatGPT 在协同办公、电商、代码生成、辅助设计等领域已经展现出了这种颠覆性潜质。

第二类是认清现实聚焦落地，坚持做垂直大模型，这一派包括最后达成观点统一的朱啸虎和傅盛，二者都认为垂直大模型将更有产业适用性。

通用大模型一般是在千亿参数以上，而垂直大模型则在百亿或者 70 亿规模左右。达观数据的大模型产品曹植，参数就都在 500 亿规模之间。

据达观数据的 CEO 陈运文告诉 AI 鲸选社，" 曹植 " 大模型采用混合训练数据方案，分别是 50% 的通用混合语料 +50% 垂直专业语料。" 我们在金融、政务等领域做文本智能很多年，很多数据是独有的，客户也要求我们做私有化训练。" 陈运文告诉 AI 鲸选社，" 以前四五个人用一个星期做一份报告，现在 AI 半天做好了。"

放弃成为下一个 ChatGPT 的梦想，才能在商业场景中尽早落地，这是很多垂直大模型的清醒认知。

在行业看来，通往 AGI 圣殿的第二条路线，是基于别人的模型（如 GPT），然后结合自己的行业 Know-how 去做训练。" 对于第二类能不能成功，我觉得需要时间去验证，现在还不明确。原因在于大家还不知道如何把行业 Know-how 去和大模型做融合的有效路径，如何在有护城河的同时又有可持续的商业模式，这仍是个未知数。"

" 尤其很多大模型，本身就有套壳的嫌疑，" 投资人张阳告诉 AI 鲸选社，结合行业做商业化的时候，就会面临很多问题。据悉，两个知名同姓创业者的大模型，是基于 Faceboook 的开源 Llama；某游戏和防护公司用的是智源大模型的基础框架。

更强的开源大模型正在来袭，Meta 近期发布免费可商用版本 Llama 2，傅盛对此就在朋友圈表示：" 这一下不知道多少公司笑醒在深夜，多少公司哭晕在厕所 …." 朱啸虎对此也评论道：很多人要笑醒了吧，大家都可以 Take free ride（搭便车）了。

傅盛的 " 笑醒 " 所指，和朱啸虎略有不同。傅盛笑醒指的是使用开源大模型开发 AIGC 应用的企业，也能做出更好的产品，朱啸虎笑醒是指那些号称自研实则套壳的大模型企业，最近也要宣布升级了。大家所指的哭晕内容相同，都是那些号称自研的大模型企业，国外大模型最强之一 Llama 2 宣布开源免费，大家都基于相同的开源大模型，怎么在行业中做出特色能力？

AGI 的第三条路线是纯粹做应用，是将模型拿来直接使用，这种的壁垒会较低。朱啸虎也不看好这类模式，认为如果 90% 的能力是 ChatGPT 提供，那么 AIGC 应用就没有什么投资价值。

在 OpenAI 的生态中，山姆 · 奥特曼承诺尽量避免做应用层，和生态开发者竞争，因此效仿 Google 做了 ChatGPT Plugin，从目前看，国内还没有谁做出这种承诺。

文心一言和通义千问，已经有了上百个功能更新，这些功能也覆盖了一些开发者的工作。虽然文心一言也有插件，但目前就两个，一个是百度搜索，另一个是 ChatFile（长文档的分析处理能力）。百度千帆和阿里魔搭的生态发展如何协调，还是个有挑战的命题工作。

坚定看好 AGI 的朱啸虎，认为通用大模型的创业和投资窗口期已过，不绝对依赖某家大模型能力的 AIGC，才是 AGI 时代低垂的果实。比如，近期朋友圈突然蹿火的 " 妙鸭相机 "，算是国内 AIGC 第一个爆火的产品，国外也曾火过类似的产品 "lensa"，月收入曾达到 800 万美元。

时代的浪潮袭来之际，投资人吴世春就曾打趣问道朱啸虎：" 投 AI 赚的钱把投 SaaS 亏的钱，弥补回来了吗？" 朱啸虎回答，还没，但是 AI 的前景无限。

目前，创投圈也都认可朱啸虎表达的道理，但很多人并不期待朱啸虎说出实话，诸如 "ChatGPT 对创业公司很不友好，未来两三年内请大家放弃融资幻想 " 这些带有寒意的话。

" 大模型就是互联网的房地产，就算有泡沫也是美丽的泡沫，"一位刚下场做 AI 职业教育培训的创业者说道，雷军曾在 2013 年互联网红利消失之际疾呼，要相信互联网的力量，今天我们也要相信 AGI，无论它有没有泡沫。

注：本文中李明、张聪、赵辉等为化名。

​大模型创业 300 天：成者 100 亿估值，80% 败者出局

大模型创业 300 天：成者 100 亿估值，80% 败者出局