世界消息!投资人,看不懂大模型
去年下半年至今,中国人民大学高瓴人工智能学院教授卢志武和他的学生高一钊见了150多家VC。以ChatGPT走红为分界点,他明显感觉到投资人对大模型创业的态度变得积极甚至是着急,但卢志武依然没拿到VC的投资。
卢志武的多模态大模型项目源起智源,最开始由智源研究院注资3000万元。2021年,他团队研发的多模态大模型项目雏形已现,急于寻找一笔融资支持大模型的深入研发。他曾对风险投资寄望很大,期待获得微软之于OpenAI那样的支持。
(相关资料图)
在ChatGPT走红之前,卢志武需要反复跟投资人科普大模型是什么以及价值在哪,其中不乏朱啸虎这样的大佬级投资人,但没有人听得懂——他们不理解大模型百亿级别参数意味着什么,更难理解提前几年研发所带来的竞争优势。
“VC永远问我怎么盈利,怎么竞争得过大厂。”卢志武说,头部VC他几乎都见了,主投TMT的硬科技VC也见了,但感觉VC们做的功课很少。
在ChatGPT走红之后,他终于不用向投资人科普大模型,但新的问题又来了:如果多模态大模型这么重要,那为什么ChatGPT是单模态的?
卢志武不知道怎么回答。
北京大学信息科学技术学院副教授、智能编程助手aiXcoder创始人李戈对此也感同身受。很多投资人在评估项目时都会向他质疑:既然ChatGPT已经有了程序生成功能,国内团队再做,有什么意义?
很多投资人都会使用最简单的python实现贪吃蛇游戏作为测试用例,但在李戈看来,程序生成是很难的事情,涉及上下文环境,投资人总是把它过于简单化,他们的目光都盯在nl2code上,输入个自然语言输出个代码,然后在那儿比来比去。“这个东西能比得出来谁好谁坏么?”
兜兜转转见了上百个投资人,卢志武终于意识到,VC们把大模型项目当成互联网项目去类比,围绕着商业模式和团队构建打转,“大模型有自己的特殊性,他们不理解,但却很早就达成了某种共识。”
这种共识主要指投资人之间的小圈子文化。卢志武认为,投资人们喜欢交换看法,虽然很多看法大多是错误的,但这些投资人的态度却出奇地一致。
“基金跨周期很难,找benchmark是投资人的天性和习惯,所以在上个周期形成的共识范式往往会成为新周期绊脚石。在大模型这样晦涩难懂的前沿领域,当底层范式发生转变,简单地和过去类比没有意义,老一代范式的知识体系和判断标准会变成包袱,投资前沿科技需要开阔思路和技术信仰。”前沿科技基金Capital O的创始合伙人刘大卫这么解释这个现象。
谈了几个月之后,卢志武不再想拿VC的投资,因为他们并不懂大模型。
但还有很多大模型相关的创业者寄希望于通过VC的助力把项目继续下去。界面新闻了解到,红杉中国旗下的创业加速器YUE2月28日开启报名之后,2000个报名项目中有400个是AIGC主题,创下了历史。6月3日,在奇迹创坛2023春季创业营路演上,60家参与公司中有41家为人工智能主题,比去年翻番,其中有39家为大模型相关。
记录屡屡刷新,但大模型创业者们首先需要面对的是投资人比以往都大的认知鸿沟。
犹豫的投资人
一种stereotype,一种倚老卖老。
很多投资人听完大模型创业的项目之后,不是不想下手,而是不敢下手。
今年春节前后,卢志武和高一钊见投资人的频率明显提升。他们感受到ChatGPT走红之后投资人急迫的心情,但也感受到了他们的犹豫。“很多投资人愿意听我们讲,但不给明确答复。我们催他们回复,他们一般只说在考虑中,或者说等下一轮再看看。”
投资人犹豫的原因是,他们不知道用什么标准去评判眼前的大模型项目是否值得投资。实际上,在移动互联网时代,面对很多新应用和新商业模式,很多投资人也未必听得懂,但他们拥有一个重要决策逻辑——投人。
风险投资就是投人,这个理念由美国风险投资家威廉·德雷帕最早提出,在移动互联网大潮十年黄金期中被屡屡印证。真格基金创始人徐小平的一句名言是:投人,投人,投人。而不是投事、投模式、投方向。
投人背后的逻辑是,早期创业一定需要经过无数试错和调整,只要创始人强大、团队战斗力强,就能走过暴风骤雨,抵达胜利的彼岸。
从移动互联网到硬科技时代,很多早期投资人仍坚持投人。真格基金联合创始人王强在一次媒体交流活动中表示,自己不怎么用ChatGPT, 也不用stability.ai,但仍想赶上这波前所未有的时代变局,用自己过往投人的方式。
实际上,投人的逻辑在国内仍处于概念化阶段。过去三十年间,国内天使投资的失败比例高达90%,风险投资失败比例达70-80%,投资人缺乏真正具体的标准,这个逻辑就是风险本身。
无论从个人经历还是团队背景来看,卢志武的项目都可圈可点,但和移动互联网项目不同的是,大模型项目前期需要的资金多很多,很多基金要么投不起,要么非常谨慎。而且,大模型创业是一个10年甚至20年才能看到结果的事情,现在的判断都过于简单。
“投人逻辑在VC行业很常见,它的正面是对创业者画像与素质的深度理解,在行业里浸泡了10年以上的投资人基本都有他们看人的一套方法论,但是各有千秋。反面折射的则可能是投研的惰性,一种stereotype。当很多项目说不出个所以然的时候,投人逻辑也是一种自我安慰。从行业数据来看,后者似乎愈演愈烈,特别是跨周期时期。”一位头部基金年轻合伙人对滥用投人逻辑表示排斥。
“相比于当年打车和社区团购这种大规模的投资热潮,如今大模型浪潮中的投资人更冷静。可以只投人的基金规模往往不大,规模较大的中后期基金又不能在只投人的阶段介入,双边一挤压,交集就变小,也一定程度上限制了资金的投入速度。但无疑,AI/大模型是今年机构都无法绕开的主题。”光源资本创始人郑烜乐在谈到大模型创投现状时表示。
卢志武在见了很多投资人之后也意识到,风投未必适合大模型项目。“基金的钱是LP的,老在那儿犹豫也可以理解。”
消费互联网时代的经验不够用了
“今年的AI新浪潮很像2019年的半导体热潮,但比2019年要更大,其实按照AI目前的逻辑,很贴切过往TMT逻辑的。”一位硬科技投资合伙人持类似观点。
“真正往里面放的大方钱很少。”
投行一直是投资圈对信息和风向最敏感的群体,据悉,光源资本看过的大模型相关概念初创项目超过百家,但在其创始人郑烜乐看来,大模型创业是“很偏venture的领域”,VC目前还是在做尝试性投资。
因为大模型的创业项目对人才密度、资金密度要求极高,跑模型的时候就需要花费千万美金级别的算力投入,而且经历数月。团队要求则是长期在机器学习上有很强的工程创新和实践经验,这类人稀少且昂贵。按照技术难度壁垒,真正有能力做底层技术创业的公司并不多。
“如果高性能算力芯片的供需关系无法改善,可能仍只能供少数公司充分训练,加上大厂布局,独立大模型创业公司资金需求量大、风险始终处在高位。”Capital O创始合伙人刘大卫认为。
实际上,在ChatGPT走红之后,很多从业者也在反思中国为什么没有诞生和OpenAI类似的公司,投资人不懂技术和太擅长投资而更擅长“投机”,被认为是其中一个重要原因。
搜狗创始人王小川在朋友圈表示,OpenAI的胜利,是技术理想主义的胜利。创业者回归技术信仰,投资人方面则有了呼吁技术为先的苗头。同日,刘大卫的朋友圈也在感慨“光是ChatGPT带来的关注度和对前沿技术的信心就很有意义”。
品玩创始人骆轶航在《谁拖了中国ChatGPT的后腿》一文中写到,沈向洋、李笛、马维英、王小川和李志飞,他们出来做大模型的创业项目都挺靠谱,但问题是得换一批背后支持他们的投资机构和投资人,有一些太擅长“做局”和投机,在加密货币等赛道上浸淫太深的投资机构混杂在其中,是应该被拉进黑名单的。
投资人擅长投机只是一个表象,其背后更深层次的原因是,国内的VC们并没有形成一套完整的投资方法论,他们在投资决策中过分依赖于过往的成功经验。这些成功经验大多来自消费互联网领域,投资决策过程判断所处赛道的市场规模、项目在赛道所处的竞争位次,以及能否通过烧钱获取足够市场份额再提价赚钱——本身就是一个投机的过程。
在郑烜乐看来,互联网时代,投资人可以从用户角度去理解产品。但大模型时代不一样,投资人需要理解大模型里面的技术环节、数据获取和清洗过程等细节,理解怎样形成有效数据集,如何评估一个团队训练和迭代模型的能力,乃至于如何对一个模型进行评价,这确实需要一定的技术背景。
Capital O创始合伙人刘大卫告诉记者,国内目前头部大模型项目创始人大都属于共识性强人,导致投资成本不低,所以会出现一些VC扎堆投资,这也是正常现象,“真正履行技术信仰投资的投资人毕竟是少数,进行前瞻性布局的科技投资注定是孤独的,所以VC跟风投资存在,是常见且可以理解的。”
目前,市场上活跃的大部分VC机构都是在移动互联网时期发展壮大,大部分投资人以商科背景为主,在硬科技时代,确实已存在较多长期聚集科技赛道的投资人具备很强的计算机背景,但从整体数量看,目前拥有技术背景的投资人占比仍然较小。
“主要落差是因为这波起势太快,大多数人的知识储备不够,还都在同步建立和迭代。”郑烜乐表示,各行业的投资本质规律其实都是一样的,投资人们最早看半导体等硬科技领域时也有很高的进入门槛,大模型的难度其实没有更高。
综合来看,AI 2.0时代,投资人所具备的能力组合一定是非标的,能用高效的方法快速梳理行业图谱是必备技能,工科背景会是一个加分项。
ChatGPT爆火之后,很多投资机构已经在高薪招聘具有工科背景的投资人。据界面新闻了解,猎头公司开始密集收到机构招聘AI方向投资人的需求,这些职位动辄可以给到接近百万年薪的待遇。而在任职要求上,除了STEM专业出身,很多招聘需求还把代码能力提上台面。
关于怎样的投资人才能看懂大模型,润土投资合伙人刘苡松告诉记者,此前一级市场经历过以CNN为主的AI项目浪潮,所以看过那波的投资人是能看懂大模型技术逻辑的。他进一步解释称,这次大模型用到的transformer,跟CNN、RNN、MLP都属于神经网络模型的各种类型,投资人群体有人能看懂技术细节,但关乎大模型,更大部分需要看懂的只是技术演进思路和商业化场景,“投资人能看懂这些就够了”。
他认为,投资人要分类来看大模型的初创项目。做底层技术的,跟以往项目确实不太一样,但国内大部分关于大模型的创业项目集中于应用层和连接层。这块创业团队需要的更多是产业经验,能够在现有产业上建立自己独特的垂直模型,再结合大模型的能力把现有产业做升级,或是基于大模型的特点开发新的应用场景,所以更具体化的“投人投技术投场景创新”逻辑用在应用层并无问题。
优秀投资人比以往更被需要
学院派创业者对在社会面上怎么赚钱有时可能缺乏了解,这个时间节点上,能给到建议的投资人,与急于获得支持的创业者降低沟通成本显得更重要。
今年4月,卢志武和高一钊团队的多模态大模型项目“智子引擎”终于拿到了千万元天使轮融资。卢志武真的没要VC的钱,他选择了与软通动力建立深度合作。
和见VC大佬们不同,卢志武见到软通动力董事长刘天文的第一感觉就是,终于有人懂他们了。卢志武发现,刘天文在见他之前还偷偷试用了他们的产品,甚至已经在谋划其公司业务场景和“智子引擎”大模型产品的结合。
软通的业务场景也是卢志武最看重的。这半年寻求融资的经历让他意识到,单纯做大模型也是有问题。在去年寻求融资屡次碰壁之后,卢志武团队已经开发了面向C端的应用级多模态ChatGPT产品“元乘象ChatImg”以及面向B端的视频搜索解决方案等产品。
作为学院派创业者,卢志武过去的关注点主要集中在技术——虽然GPT-2已经开源,但却没有人告诉你上亿规模的数据如何处理,规模量巨大的机器如何高效利用,一切都要从零开始摸索。
但在商业世界中,如何赚钱才是根本。虽然不喜欢总是因为这个问题被投资人纠缠,但卢志武也不得不面对——这也是很多学院派创业者缺乏了解或者比较少去关注的事。
和移动互联网项目不同,AI公司很多是科学家主导,没有非常好的商业模式呈现。电商AI SaaS领域的独角兽乐言科技创始人兼CEO沈李斌博士认为,学院派创业者有时确实对怎么赚钱缺乏了解。“不需要市场都认可,找到对的两三个投资人就够了。”他给出了学院派创业者建议。
但由于行业局势并不明晰且投资人对行业的洞察能力参差不齐,投资人对大模型和AIGC领域创业者的支持都显得有点“廉价”,愿意输出系统性观点的AI投资人也不多。但在短期内,大模型创业者确实需要尽快把投资人的担心消除,如何利用先发优势,后续跟大厂如何比拼迭代和服务,这些都需要对商业化更敏锐的投资人去带动思考。
在沈李斌博士的感受里,现在的AI投资环境已比数年前好了很多,2015年前后大部分投资人根本不懂深度学习为何物,来到2018年前后,绝大部分投资人对AI已经有了一定理解,有的还非常深刻。
记者从投资数据观察发现,相比之下,投资机构还是很愿意支持明星创业者的创业项目。
Capital O刘大卫解释了原因:“虽然市场中存在一些声音并不看好明星创业者的专业性,但项目的成功是多方面综合构成的。在大模型发展的阶段中,明星创业者能够吸引更多的资源支持和资金注入是有意义的,这可能是很多技术背景的创始人不具备的。”
与此同时,跨界人才主导大模型公司走向可能正在成为趋势,近期受到广泛关注的ChatGPT新任产品负责人Peter Deng,就没有技术背景,而是出身符号学与传媒专业,却是领导了Ins Messenger、 Oculus产品研发的传奇人物。
于是,大模型底层创业一个矛盾逐渐展露,围绕大模型技术创业处于相当早期,因技术储备缺失,加上各自对技术路线和工程路线的理解差异极大,投资人们无法作出研判,但大模型相关技术已经发展数年,纯技术向领头人似乎不能完全把持住类似春秋战国的百模大战局面。
“国内现在看是还缺少好用的底层大模型,应用层都是虚的,总不能所有应用层都用国外的底层模型吧,所以大家现阶段应该集中解决这个问题。”刘苡松点出了问题核心。在当前这种环境下,国内各行业的大模型呈几何数量爆发,但无论是大厂还是初创,做出的东西都差一口气。
郑烜乐也因此非常理解卢志武等学院派企业家的诉求,他认为,只要能做出大模型,所有的后续选择就都在,至于To B和To C只是一种实现路径,都有巨大的场景机会。
“投资人对很多事还是理解得不够深刻,但他们自己可以去想清楚的。”一位经历了TMT落幕时代的投资经理这样看。
光源资本的AI团队已经花费了半年时间研究大模型领域知识体系,甚至专门招募了做过AI大模型的工程师加入团队,“大模型和AI整个赛道长坡厚雪,到现在我们还是觉得学海无涯,每天都有新的输入和思考。”
郑烜乐觉得,这波浪潮初创一定有机会,尤其是从大厂核心AI部门走出的创业者。“大厂这次跟初创企业的竞争跟以往赛道都不同,很难讲谁能做得更大。”也因此,在今年上半年,光源资本参与孵化了前字节跳动视觉AI负责人王长虎的创业项目爱诗科技。
多位从业者比较一致的判断是,未来六个月至少能跑出一款相对不错的大模型产品,但不好说是语言层面还是多模态层面,不指望能赶上ChatGPT, 但某些能力能够PK了。