世界消息！投资人，看不懂大模型

去年下半年至今，中国人民大学高瓴人工智能学院教授卢志武和他的学生高一钊见了150多家VC。以ChatGPT走红为分界点，他明显感觉到投资人对大模型创业的态度变得积极甚至是着急，但卢志武依然没拿到VC的投资。

卢志武的多模态大模型项目源起智源，最开始由智源研究院注资3000万元。2021年，他团队研发的多模态大模型项目雏形已现，急于寻找一笔融资支持大模型的深入研发。他曾对风险投资寄望很大，期待获得微软之于OpenAI那样的支持。

(相关资料图)

在ChatGPT走红之前，卢志武需要反复跟投资人科普大模型是什么以及价值在哪，其中不乏朱啸虎这样的大佬级投资人，但没有人听得懂——他们不理解大模型百亿级别参数意味着什么，更难理解提前几年研发所带来的竞争优势。

“VC永远问我怎么盈利，怎么竞争得过大厂。”卢志武说，头部VC他几乎都见了，主投TMT的硬科技VC也见了，但感觉VC们做的功课很少。

在ChatGPT走红之后，他终于不用向投资人科普大模型，但新的问题又来了：如果多模态大模型这么重要，那为什么ChatGPT是单模态的？

卢志武不知道怎么回答。

北京大学信息科学技术学院副教授、智能编程助手aiXcoder创始人李戈对此也感同身受。很多投资人在评估项目时都会向他质疑：既然ChatGPT已经有了程序生成功能，国内团队再做，有什么意义？

很多投资人都会使用最简单的python实现贪吃蛇游戏作为测试用例，但在李戈看来，程序生成是很难的事情，涉及上下文环境，投资人总是把它过于简单化，他们的目光都盯在nl2code上，输入个自然语言输出个代码，然后在那儿比来比去。“这个东西能比得出来谁好谁坏么？”

兜兜转转见了上百个投资人，卢志武终于意识到，VC们把大模型项目当成互联网项目去类比，围绕着商业模式和团队构建打转，“大模型有自己的特殊性，他们不理解，但却很早就达成了某种共识。”

这种共识主要指投资人之间的小圈子文化。卢志武认为，投资人们喜欢交换看法，虽然很多看法大多是错误的，但这些投资人的态度却出奇地一致。

“基金跨周期很难，找benchmark是投资人的天性和习惯，所以在上个周期形成的共识范式往往会成为新周期绊脚石。在大模型这样晦涩难懂的前沿领域，当底层范式发生转变，简单地和过去类比没有意义，老一代范式的知识体系和判断标准会变成包袱，投资前沿科技需要开阔思路和技术信仰。”前沿科技基金Capital O的创始合伙人刘大卫这么解释这个现象。

谈了几个月之后，卢志武不再想拿VC的投资，因为他们并不懂大模型。

但还有很多大模型相关的创业者寄希望于通过VC的助力把项目继续下去。界面新闻了解到，红杉中国旗下的创业加速器YUE2月28日开启报名之后，2000个报名项目中有400个是AIGC主题，创下了历史。6月3日，在奇迹创坛2023春季创业营路演上，60家参与公司中有41家为人工智能主题，比去年翻番，其中有39家为大模型相关。

记录屡屡刷新，但大模型创业者们首先需要面对的是投资人比以往都大的认知鸿沟。

犹豫的投资人

一种stereotype，一种倚老卖老。

很多投资人听完大模型创业的项目之后，不是不想下手，而是不敢下手。

今年春节前后，卢志武和高一钊见投资人的频率明显提升。他们感受到ChatGPT走红之后投资人急迫的心情，但也感受到了他们的犹豫。“很多投资人愿意听我们讲，但不给明确答复。我们催他们回复，他们一般只说在考虑中，或者说等下一轮再看看。”

投资人犹豫的原因是，他们不知道用什么标准去评判眼前的大模型项目是否值得投资。实际上，在移动互联网时代，面对很多新应用和新商业模式，很多投资人也未必听得懂，但他们拥有一个重要决策逻辑——投人。

风险投资就是投人，这个理念由美国风险投资家威廉·德雷帕最早提出，在移动互联网大潮十年黄金期中被屡屡印证。真格基金创始人徐小平的一句名言是：投人，投人，投人。而不是投事、投模式、投方向。

投人背后的逻辑是，早期创业一定需要经过无数试错和调整，只要创始人强大、团队战斗力强，就能走过暴风骤雨，抵达胜利的彼岸。

从移动互联网到硬科技时代，很多早期投资人仍坚持投人。真格基金联合创始人王强在一次媒体交流活动中表示，自己不怎么用ChatGPT，也不用stability.ai，但仍想赶上这波前所未有的时代变局，用自己过往投人的方式。

实际上，投人的逻辑在国内仍处于概念化阶段。过去三十年间，国内天使投资的失败比例高达90%，风险投资失败比例达70-80%，投资人缺乏真正具体的标准，这个逻辑就是风险本身。

无论从个人经历还是团队背景来看，卢志武的项目都可圈可点，但和移动互联网项目不同的是，大模型项目前期需要的资金多很多，很多基金要么投不起，要么非常谨慎。而且，大模型创业是一个10年甚至20年才能看到结果的事情，现在的判断都过于简单。

“投人逻辑在VC行业很常见，它的正面是对创业者画像与素质的深度理解，在行业里浸泡了10年以上的投资人基本都有他们看人的一套方法论，但是各有千秋。反面折射的则可能是投研的惰性，一种stereotype。当很多项目说不出个所以然的时候，投人逻辑也是一种自我安慰。从行业数据来看，后者似乎愈演愈烈，特别是跨周期时期。”一位头部基金年轻合伙人对滥用投人逻辑表示排斥。

“相比于当年打车和社区团购这种大规模的投资热潮，如今大模型浪潮中的投资人更冷静。可以只投人的基金规模往往不大，规模较大的中后期基金又不能在只投人的阶段介入，双边一挤压，交集就变小，也一定程度上限制了资金的投入速度。但无疑，AI/大模型是今年机构都无法绕开的主题。”光源资本创始人郑烜乐在谈到大模型创投现状时表示。

卢志武在见了很多投资人之后也意识到，风投未必适合大模型项目。“基金的钱是LP的，老在那儿犹豫也可以理解。”

消费互联网时代的经验不够用了

“今年的AI新浪潮很像2019年的半导体热潮，但比2019年要更大，其实按照AI目前的逻辑，很贴切过往TMT逻辑的。”一位硬科技投资合伙人持类似观点。

“真正往里面放的大方钱很少。”

投行一直是投资圈对信息和风向最敏感的群体，据悉，光源资本看过的大模型相关概念初创项目超过百家，但在其创始人郑烜乐看来，大模型创业是“很偏venture的领域”，VC目前还是在做尝试性投资。

因为大模型的创业项目对人才密度、资金密度要求极高，跑模型的时候就需要花费千万美金级别的算力投入，而且经历数月。团队要求则是长期在机器学习上有很强的工程创新和实践经验，这类人稀少且昂贵。按照技术难度壁垒，真正有能力做底层技术创业的公司并不多。

“如果高性能算力芯片的供需关系无法改善，可能仍只能供少数公司充分训练，加上大厂布局，独立大模型创业公司资金需求量大、风险始终处在高位。”Capital O创始合伙人刘大卫认为。

实际上，在ChatGPT走红之后，很多从业者也在反思中国为什么没有诞生和OpenAI类似的公司，投资人不懂技术和太擅长投资而更擅长“投机”，被认为是其中一个重要原因。

搜狗创始人王小川在朋友圈表示，OpenAI的胜利，是技术理想主义的胜利。创业者回归技术信仰，投资人方面则有了呼吁技术为先的苗头。同日，刘大卫的朋友圈也在感慨“光是ChatGPT带来的关注度和对前沿技术的信心就很有意义”。

品玩创始人骆轶航在《谁拖了中国ChatGPT的后腿》一文中写到，沈向洋、李笛、马维英、王小川和李志飞，他们出来做大模型的创业项目都挺靠谱，但问题是得换一批背后支持他们的投资机构和投资人，有一些太擅长“做局”和投机，在加密货币等赛道上浸淫太深的投资机构混杂在其中，是应该被拉进黑名单的。

投资人擅长投机只是一个表象，其背后更深层次的原因是，国内的VC们并没有形成一套完整的投资方法论，他们在投资决策中过分依赖于过往的成功经验。这些成功经验大多来自消费互联网领域，投资决策过程判断所处赛道的市场规模、项目在赛道所处的竞争位次，以及能否通过烧钱获取足够市场份额再提价赚钱——本身就是一个投机的过程。

在郑烜乐看来，互联网时代，投资人可以从用户角度去理解产品。但大模型时代不一样，投资人需要理解大模型里面的技术环节、数据获取和清洗过程等细节，理解怎样形成有效数据集，如何评估一个团队训练和迭代模型的能力，乃至于如何对一个模型进行评价，这确实需要一定的技术背景。

Capital O创始合伙人刘大卫告诉记者，国内目前头部大模型项目创始人大都属于共识性强人，导致投资成本不低，所以会出现一些VC扎堆投资，这也是正常现象，“真正履行技术信仰投资的投资人毕竟是少数，进行前瞻性布局的科技投资注定是孤独的，所以VC跟风投资存在，是常见且可以理解的。”

目前，市场上活跃的大部分VC机构都是在移动互联网时期发展壮大，大部分投资人以商科背景为主，在硬科技时代，确实已存在较多长期聚集科技赛道的投资人具备很强的计算机背景，但从整体数量看，目前拥有技术背景的投资人占比仍然较小。

“主要落差是因为这波起势太快，大多数人的知识储备不够，还都在同步建立和迭代。”郑烜乐表示，各行业的投资本质规律其实都是一样的，投资人们最早看半导体等硬科技领域时也有很高的进入门槛，大模型的难度其实没有更高。

综合来看，AI 2.0时代，投资人所具备的能力组合一定是非标的，能用高效的方法快速梳理行业图谱是必备技能，工科背景会是一个加分项。

ChatGPT爆火之后，很多投资机构已经在高薪招聘具有工科背景的投资人。据界面新闻了解，猎头公司开始密集收到机构招聘AI方向投资人的需求，这些职位动辄可以给到接近百万年薪的待遇。而在任职要求上，除了STEM专业出身，很多招聘需求还把代码能力提上台面。

关于怎样的投资人才能看懂大模型，润土投资合伙人刘苡松告诉记者，此前一级市场经历过以CNN为主的AI项目浪潮，所以看过那波的投资人是能看懂大模型技术逻辑的。他进一步解释称，这次大模型用到的transformer，跟CNN、RNN、MLP都属于神经网络模型的各种类型，投资人群体有人能看懂技术细节，但关乎大模型，更大部分需要看懂的只是技术演进思路和商业化场景，“投资人能看懂这些就够了”。

他认为，投资人要分类来看大模型的初创项目。做底层技术的，跟以往项目确实不太一样，但国内大部分关于大模型的创业项目集中于应用层和连接层。这块创业团队需要的更多是产业经验，能够在现有产业上建立自己独特的垂直模型，再结合大模型的能力把现有产业做升级，或是基于大模型的特点开发新的应用场景，所以更具体化的“投人投技术投场景创新”逻辑用在应用层并无问题。

优秀投资人比以往更被需要

学院派创业者对在社会面上怎么赚钱有时可能缺乏了解，这个时间节点上，能给到建议的投资人，与急于获得支持的创业者降低沟通成本显得更重要。

今年4月，卢志武和高一钊团队的多模态大模型项目“智子引擎”终于拿到了千万元天使轮融资。卢志武真的没要VC的钱，他选择了与软通动力建立深度合作。

和见VC大佬们不同，卢志武见到软通动力董事长刘天文的第一感觉就是，终于有人懂他们了。卢志武发现，刘天文在见他之前还偷偷试用了他们的产品，甚至已经在谋划其公司业务场景和“智子引擎”大模型产品的结合。

软通的业务场景也是卢志武最看重的。这半年寻求融资的经历让他意识到，单纯做大模型也是有问题。在去年寻求融资屡次碰壁之后，卢志武团队已经开发了面向C端的应用级多模态ChatGPT产品“元乘象ChatImg”以及面向B端的视频搜索解决方案等产品。

作为学院派创业者，卢志武过去的关注点主要集中在技术——虽然GPT-2已经开源，但却没有人告诉你上亿规模的数据如何处理，规模量巨大的机器如何高效利用，一切都要从零开始摸索。

但在商业世界中，如何赚钱才是根本。虽然不喜欢总是因为这个问题被投资人纠缠，但卢志武也不得不面对——这也是很多学院派创业者缺乏了解或者比较少去关注的事。

和移动互联网项目不同，AI公司很多是科学家主导，没有非常好的商业模式呈现。电商AI SaaS领域的独角兽乐言科技创始人兼CEO沈李斌博士认为，学院派创业者有时确实对怎么赚钱缺乏了解。“不需要市场都认可，找到对的两三个投资人就够了。”他给出了学院派创业者建议。

但由于行业局势并不明晰且投资人对行业的洞察能力参差不齐，投资人对大模型和AIGC领域创业者的支持都显得有点“廉价”，愿意输出系统性观点的AI投资人也不多。但在短期内，大模型创业者确实需要尽快把投资人的担心消除，如何利用先发优势，后续跟大厂如何比拼迭代和服务，这些都需要对商业化更敏锐的投资人去带动思考。

在沈李斌博士的感受里，现在的AI投资环境已比数年前好了很多，2015年前后大部分投资人根本不懂深度学习为何物，来到2018年前后，绝大部分投资人对AI已经有了一定理解，有的还非常深刻。

记者从投资数据观察发现，相比之下，投资机构还是很愿意支持明星创业者的创业项目。

Capital O刘大卫解释了原因：“虽然市场中存在一些声音并不看好明星创业者的专业性，但项目的成功是多方面综合构成的。在大模型发展的阶段中，明星创业者能够吸引更多的资源支持和资金注入是有意义的，这可能是很多技术背景的创始人不具备的。”

与此同时，跨界人才主导大模型公司走向可能正在成为趋势，近期受到广泛关注的ChatGPT新任产品负责人Peter Deng，就没有技术背景，而是出身符号学与传媒专业，却是领导了Ins Messenger、 Oculus产品研发的传奇人物。

于是，大模型底层创业一个矛盾逐渐展露，围绕大模型技术创业处于相当早期，因技术储备缺失，加上各自对技术路线和工程路线的理解差异极大，投资人们无法作出研判，但大模型相关技术已经发展数年，纯技术向领头人似乎不能完全把持住类似春秋战国的百模大战局面。

“国内现在看是还缺少好用的底层大模型，应用层都是虚的，总不能所有应用层都用国外的底层模型吧，所以大家现阶段应该集中解决这个问题。”刘苡松点出了问题核心。在当前这种环境下，国内各行业的大模型呈几何数量爆发，但无论是大厂还是初创，做出的东西都差一口气。

郑烜乐也因此非常理解卢志武等学院派企业家的诉求，他认为，只要能做出大模型，所有的后续选择就都在，至于To B和To C只是一种实现路径，都有巨大的场景机会。

“投资人对很多事还是理解得不够深刻，但他们自己可以去想清楚的。”一位经历了TMT落幕时代的投资经理这样看。

光源资本的AI团队已经花费了半年时间研究大模型领域知识体系，甚至专门招募了做过AI大模型的工程师加入团队，“大模型和AI整个赛道长坡厚雪，到现在我们还是觉得学海无涯，每天都有新的输入和思考。”

郑烜乐觉得，这波浪潮初创一定有机会，尤其是从大厂核心AI部门走出的创业者。“大厂这次跟初创企业的竞争跟以往赛道都不同，很难讲谁能做得更大。”也因此，在今年上半年，光源资本参与孵化了前字节跳动视觉AI负责人王长虎的创业项目爱诗科技。

多位从业者比较一致的判断是，未来六个月至少能跑出一款相对不错的大模型产品，但不好说是语言层面还是多模态层面，不指望能赶上ChatGPT，但某些能力能够PK了。

X 关闭