国产AI,逃过一劫
去年今日,也就是2023年2月7日,ChatGPT横空出世,出道即巅峰。
一整年过去,觉醒与狂飙、躁动与退场在时刻上演。这股由ChatGPT掀起的国内大模型创业潮已经走过了一个周期:
从刚开始的爆火,到中期的冷淡,再到如今突破瓶颈逐渐落地。
进入2023年下半年,许多大模型开始从技术走向商业化,各家纷纷抢占数据、算力、场景、应用高地,以争夺大模型市场话语权。
其中,无数创业者沦为这个周期的背景板,美团联合创始人王慧文曾一度是赛道内最为高光的创业者,但也在这一年里几经波折,虽然在近期重返AI赛道,但也已经退居二线,不敢贸然下场操盘。
1月10日,北京硅动科技(硅基流动)官宣完成5000万元天使轮融资,其中创新工场领投,耀途资本、奇绩创坛以及王慧文等科技界知名人士跟投,华兴资本担任独家财务顾问。
硅动科技为一流科技创始人袁进辉携光年之外核心团队在大模型领域的再度创业,也是王慧文重返大模型赛道的第一站。在去年6月一手创办的光年之外被美团收购后,王慧文如今不仅是硅动科技的投资人,也是其创始股东,在公司战略、管理、组织、商业、高管招聘等方面给予指导。
似乎,在历经一轮周期洗礼的王慧文并不想轻易放弃AI这个赛道,但又深知其中的虚火,退居二线保持观望更为理性。
01 高调入局“求组队”
ChatGPT一经爆火,王慧文就紧跟热点,高调宣布入局AI赛道。
去年2月7日,有关ChatGPT的多个话题登上热搜,引网友热议。
在一个星期后的2月13和14日,王慧文的两则“AI英雄榜”宣告其正式进军AI创业赛道:设立北京光年之外科技有限公司,个人出资5000万美元占股25%、75%的股份用以邀请顶级研发人才,“争取OpenAI这样的伟大突破,也能在中国率先发生!”
图源:即刻
王慧文无疑是兴奋的,而此时距离ChatGPT问世仅仅过去两个半月。
2022年11月30日,OpenAI公布了一个通过由GPT-3.5系列大型语音模型微调而成的全新对话式AI模型ChatGPT,它不仅能进行自然的多轮对话、高效的精准问答,还能生成编程代码、电子邮件、论文、小说等各类文本。
随后,ChatGPT快速席卷全球,甚至因访问需求激增几次崩溃,一年时间里,ChatGPT从一个网页变成了每周有 1 亿人使用的产品,OpenAI 也从一个研究机构变成了估值 900 亿美元的超级创业公司,聚拢了 200 万开发者用它的技术开发各种应用。
最接近ChatGPT的互联网大厂闻风而动。短短几天,百度官宣要做文心一言;阿里内测中的达摩院版ChatGPT提前曝光;京东宣布推出产业版ChatGPTChatJD;字节、快手均已开展大规模语言模型研究;网易有道宣布或将推出围绕在线教育场景的ChatGPT同源技术产品;360公司计划尽快推出类ChatGPT技术的demo版产品.......
李彦宏、周鸿祎、王慧文、丁磊、林凡等大佬争先恐后,一时间所有人都在抢滩“中国版ChatGPT”,甚至酝酿出了大模型的“创业派别”,比如巨头派、大佬派、海归/大厂高管派、小创业公司转型派。
狂飙突进之下,截至2023年10月,国内大模型数量已经达到238个,“百模大战”已然展开。
其中,王慧文的AI创业路径除了发布“求贤令”之外,为打造“中国版OpenAI”,王慧文也在为光年之外寻觅建制成熟且价格合理的标的,并最终找到了袁进辉与一流科技:袁进辉是业界知名的AI架构大牛,其创办的一流科技主导研发开源深度学习系统。
2023年4月,光年之外完成收购一流科技(OneFlow),持有约46.52%股权。
在这一阶段,国内大模型的发展还以追赶ChatGPT为主。2023年10月,百度的文心大模型 4.0 宣称追上了openAI 当年3月发布的GPT-4,并称其实现了基础模型的全面升级,在理解、生成、逻辑和记忆能力上都有显著提升,综合能力“与GPT-4相比毫不逊色”;同月,阿里方面也在云栖大会上发布千亿级参数大模型通义千问2.0,并称其在10个权威测评中综合性能超过GPT-3.5和Llama 2等;科大讯飞的星火大模型3.0则对标GPT-3.5。
对于新入局的“大佬派”王慧文,一些一级市场投资人踊跃支持,而另一些技术人员、科技行业分析师则不以为意。
海通证券科技行业首席分析师郑宏达直言:“5000万美元够干什么的?大模型训练一次就花500万美元,训练10次?”
据了解,ChatGPT硬件方面要3万张顶级GPU,加上CPU、内存、硬盘、网络和数据中心的电源与建筑,接近100亿元,训练一次要几个月,巨大的物料、电力成本之外,还有软件开发的费用。
OpenAI就是先例。资料显示,OpenAI在七年多的时间中共收到了约40亿美元的投资,直到2022年还亏损了约5亿美元。
02 “英雄榜”散场
就在王慧文成为VC圈最炙手可热的创业者时,一切戛然而止。2023年6月,王慧文抑郁症发作,退出美团董事会,尚且稚嫩的光年之外也随之折戟,投身美团。
巧合的是,就在王慧文隐退之际,ChatGPT的创业热潮正从狂热转向理智,在一定程度上避免了被行业洗牌的尴尬。
数据显示,2023年6月,ChatGPT的网站与移动客户端的全球流量(PV)环比下降了9.7%。同时,ChatGPT独立访客数量(UV)下降了5.7%,访客在网站上花费的时间也下降了8.5%。
与此同时,国内创业者也在冷静思考国产大模型的未来。面对“百模大战”疑似“重复造轮子”的现状,李彦宏喊话:“我们需要100万量级的AI原生应用,但是不需要100个所谓的大模型。”
OpenAI创始人山姆·奥特曼也曾发出警示:“我对所有试图培训自己大模型的创业公司,持怀疑态度。”
业内人士指出,ChatGPT本身基于成熟的公开算法,硬件和数据才是王道,纯自然语言数据都是网上公开,没有什么门槛。但ChatGPT的先发优势在于,通过抢先公测,收集了大量的用户数据,随着雪球越滚越大,后来者也越来越难追上。
实际上,受困于高昂的成本,只有充足的算力、财力的大公司与资本支持的雄心勃勃的创业公司,才会涉足基座模型。“百模大战”中的国产大模型数量虽然多,但只有大约10% 的模型是基座模型,90% 的模型是在开源模型基础上加入特定数据集做微调的行业模型、垂直模型。
此外,随着首批大模型在2023年8月通过“生成式人工智能备案”,产品可直接面向社会公众提供服务,围绕新用户和客户的拉新、增长与产品的更激进投入也正式开启。参与者们将面临更激烈、综合的竞争。其中一个重大考验就是:怎么找到真正赚钱、可持续的大模型商业模式。
而后来袁进辉的再创业方向,也是在考量成本投入和应用空间之后的另辟蹊径。2023年8月,袁进辉在朋友圈称OneFlow团队会重新创业,率队OneFlow部分成员成立了硅基流动,计划第一个推出的产品是大模型推理和部署系统,解决AIGC(生成式人工智能)和LLM(大语言模型)行业推理部署成本太高的痛点。
在他看来,随着ChatGPT的爆火,AIGC快速发展,全球算力需求随之爆发式增长,由此导致算力供给严重不足,高昂的算力成本和应用开发门槛成为生成式AI发展的主要瓶颈。而硅基流动致力于提供服务大模型的应用,打造大模型时代的AI基础设施(AI Infra),降低大模型应用成本和开发门槛,加速AGI普惠人类。
对于创业公司来说,成为AGI普及道路上的“卖铲人”总好过在基座模型赛道卷生卷死。
03 江湖已变
王慧文虽然重出江湖,但AI大模型的江湖早已不是当初的格局。
目前,各路大模型发布会的强调重点也悄然转变为赋能产业、场景结合、行业垂直,“落地”成为了此次AI创业浪潮的最大目标。
比如,阅文集团的作家助手妙笔版定位为“行业首个网文大模型”,提供辅助创造、内容诊断、答疑解惑等功能;百度从训大模型、用大模型和做应用三个层次服务客户,探索政务、金融、交通等领域的大模型落地;华为云以“5+N+X”的思路构建华为盘古大模型,形成了政务、金融、矿山、智能驾驶等行业解决方案,并放出了“不作诗只做事”的豪言。
截至2023年8月底,百度、字节、商汤、中科院旗下紫东太初、百川智能、智谱华章等8家企业/机构的大模型,已首批正式上线开始面向公众提供服务。
AI大模型的应用领域涉及自然语言处理、计算机视觉、制造业、文化产业、金融、医疗、教育、零售等,建筑、家电、半导体等领域的AI大模型也相继面世。
哪怕是帮助王慧文兜底的美团,也在强调应用场景的落地。在2023年一季度财报时,美团创始人王兴就曾表示,美团已组建内部团队进行大模型和应用层面的研发,并对外部技术合作机会和投资机会持开放态度。2023年6月,美团完成光年之外境内外主体100%股权的收购,收购价约为20.65亿元人民币。
国联证券分析师认为,AI大模型与美团业务应用场景契合,有望增强美团在C端外卖、到店酒旅场景对用户的兴趣理解、智能推荐与智能交互,以及助力美团在B端对生态商家端用户智能服务、智能营销、经营智能预测等服务效能提升,从而赋能本地业务。
更为可怕的是,
就在国产大模型的产业化落地有条不紊地进行时,OpenAI再度进化拉开身位。
2023年11月,OpenAI再次取得突破性成就。北京时间11月7日凌晨,OpenAI在开发者大会上公布了最新成果GPT-4 Turbo,不仅更快、有更长的上下文、更好的控制,API 的价格也下调至原来的1/3,降到了 1000 输入/美分。
同时,OpenAI 推出了GPTs,每一个 GPT 像是 ChatGPT 的一个为了特殊目的而做出的定制版本,用户可以用自然语言构建定制化 GPT,然后上传到GPT Store。
从推出GPTs与GPT Store以及布局AI硬件等举措可以看出,OpenAI显然拥有更远大的目标和野心,即将自身打造成一个独立于现有应用商店和分发方式的平台,乃至“苹果化”的自主软硬件生态。
回归国内,“百模大战”打了一年,不少玩家已经偃旗息鼓,像王慧文这样重新杀回来的人物并不多见,是飞蛾扑火般地重蹈覆辙,还是重整旗鼓后的自省出发,还有待时间的检验。
参考资料:
晚点latePost《ChatGPT元年:野心,战略,以及绕不开的困难》
晚点latePost《首批大模型通过备案,更激进的投入开始了》
新眸《王慧文无心与李彦宏「斗法」》
智能涌现《对话王慧文:AGI这么伟大的事情,谁做成了我都会鼓掌》
投资界《王慧文,刚投一位老友》
华尔街见闻《李开复:大模型即将“洗牌”,估计活下来的不多》
北京商报《大模型,从“封神”到落地》
一整年过去,觉醒与狂飙、躁动与退场在时刻上演。这股由ChatGPT掀起的国内大模型创业潮已经走过了一个周期:
从刚开始的爆火,到中期的冷淡,再到如今突破瓶颈逐渐落地。
进入2023年下半年,许多大模型开始从技术走向商业化,各家纷纷抢占数据、算力、场景、应用高地,以争夺大模型市场话语权。
其中,无数创业者沦为这个周期的背景板,美团联合创始人王慧文曾一度是赛道内最为高光的创业者,但也在这一年里几经波折,虽然在近期重返AI赛道,但也已经退居二线,不敢贸然下场操盘。
1月10日,北京硅动科技(硅基流动)官宣完成5000万元天使轮融资,其中创新工场领投,耀途资本、奇绩创坛以及王慧文等科技界知名人士跟投,华兴资本担任独家财务顾问。
硅动科技为一流科技创始人袁进辉携光年之外核心团队在大模型领域的再度创业,也是王慧文重返大模型赛道的第一站。在去年6月一手创办的光年之外被美团收购后,王慧文如今不仅是硅动科技的投资人,也是其创始股东,在公司战略、管理、组织、商业、高管招聘等方面给予指导。
似乎,在历经一轮周期洗礼的王慧文并不想轻易放弃AI这个赛道,但又深知其中的虚火,退居二线保持观望更为理性。
01 高调入局“求组队”
ChatGPT一经爆火,王慧文就紧跟热点,高调宣布入局AI赛道。
去年2月7日,有关ChatGPT的多个话题登上热搜,引网友热议。
在一个星期后的2月13和14日,王慧文的两则“AI英雄榜”宣告其正式进军AI创业赛道:设立北京光年之外科技有限公司,个人出资5000万美元占股25%、75%的股份用以邀请顶级研发人才,“争取OpenAI这样的伟大突破,也能在中国率先发生!”
图源:即刻
王慧文无疑是兴奋的,而此时距离ChatGPT问世仅仅过去两个半月。
2022年11月30日,OpenAI公布了一个通过由GPT-3.5系列大型语音模型微调而成的全新对话式AI模型ChatGPT,它不仅能进行自然的多轮对话、高效的精准问答,还能生成编程代码、电子邮件、论文、小说等各类文本。
随后,ChatGPT快速席卷全球,甚至因访问需求激增几次崩溃,一年时间里,ChatGPT从一个网页变成了每周有 1 亿人使用的产品,OpenAI 也从一个研究机构变成了估值 900 亿美元的超级创业公司,聚拢了 200 万开发者用它的技术开发各种应用。
最接近ChatGPT的互联网大厂闻风而动。短短几天,百度官宣要做文心一言;阿里内测中的达摩院版ChatGPT提前曝光;京东宣布推出产业版ChatGPTChatJD;字节、快手均已开展大规模语言模型研究;网易有道宣布或将推出围绕在线教育场景的ChatGPT同源技术产品;360公司计划尽快推出类ChatGPT技术的demo版产品.......
李彦宏、周鸿祎、王慧文、丁磊、林凡等大佬争先恐后,一时间所有人都在抢滩“中国版ChatGPT”,甚至酝酿出了大模型的“创业派别”,比如巨头派、大佬派、海归/大厂高管派、小创业公司转型派。
狂飙突进之下,截至2023年10月,国内大模型数量已经达到238个,“百模大战”已然展开。
其中,王慧文的AI创业路径除了发布“求贤令”之外,为打造“中国版OpenAI”,王慧文也在为光年之外寻觅建制成熟且价格合理的标的,并最终找到了袁进辉与一流科技:袁进辉是业界知名的AI架构大牛,其创办的一流科技主导研发开源深度学习系统。
2023年4月,光年之外完成收购一流科技(OneFlow),持有约46.52%股权。
在这一阶段,国内大模型的发展还以追赶ChatGPT为主。2023年10月,百度的文心大模型 4.0 宣称追上了openAI 当年3月发布的GPT-4,并称其实现了基础模型的全面升级,在理解、生成、逻辑和记忆能力上都有显著提升,综合能力“与GPT-4相比毫不逊色”;同月,阿里方面也在云栖大会上发布千亿级参数大模型通义千问2.0,并称其在10个权威测评中综合性能超过GPT-3.5和Llama 2等;科大讯飞的星火大模型3.0则对标GPT-3.5。
对于新入局的“大佬派”王慧文,一些一级市场投资人踊跃支持,而另一些技术人员、科技行业分析师则不以为意。
海通证券科技行业首席分析师郑宏达直言:“5000万美元够干什么的?大模型训练一次就花500万美元,训练10次?”
据了解,ChatGPT硬件方面要3万张顶级GPU,加上CPU、内存、硬盘、网络和数据中心的电源与建筑,接近100亿元,训练一次要几个月,巨大的物料、电力成本之外,还有软件开发的费用。
OpenAI就是先例。资料显示,OpenAI在七年多的时间中共收到了约40亿美元的投资,直到2022年还亏损了约5亿美元。
02 “英雄榜”散场
就在王慧文成为VC圈最炙手可热的创业者时,一切戛然而止。2023年6月,王慧文抑郁症发作,退出美团董事会,尚且稚嫩的光年之外也随之折戟,投身美团。
巧合的是,就在王慧文隐退之际,ChatGPT的创业热潮正从狂热转向理智,在一定程度上避免了被行业洗牌的尴尬。
数据显示,2023年6月,ChatGPT的网站与移动客户端的全球流量(PV)环比下降了9.7%。同时,ChatGPT独立访客数量(UV)下降了5.7%,访客在网站上花费的时间也下降了8.5%。
与此同时,国内创业者也在冷静思考国产大模型的未来。面对“百模大战”疑似“重复造轮子”的现状,李彦宏喊话:“我们需要100万量级的AI原生应用,但是不需要100个所谓的大模型。”
OpenAI创始人山姆·奥特曼也曾发出警示:“我对所有试图培训自己大模型的创业公司,持怀疑态度。”
业内人士指出,ChatGPT本身基于成熟的公开算法,硬件和数据才是王道,纯自然语言数据都是网上公开,没有什么门槛。但ChatGPT的先发优势在于,通过抢先公测,收集了大量的用户数据,随着雪球越滚越大,后来者也越来越难追上。
实际上,受困于高昂的成本,只有充足的算力、财力的大公司与资本支持的雄心勃勃的创业公司,才会涉足基座模型。“百模大战”中的国产大模型数量虽然多,但只有大约10% 的模型是基座模型,90% 的模型是在开源模型基础上加入特定数据集做微调的行业模型、垂直模型。
此外,随着首批大模型在2023年8月通过“生成式人工智能备案”,产品可直接面向社会公众提供服务,围绕新用户和客户的拉新、增长与产品的更激进投入也正式开启。参与者们将面临更激烈、综合的竞争。其中一个重大考验就是:怎么找到真正赚钱、可持续的大模型商业模式。
而后来袁进辉的再创业方向,也是在考量成本投入和应用空间之后的另辟蹊径。2023年8月,袁进辉在朋友圈称OneFlow团队会重新创业,率队OneFlow部分成员成立了硅基流动,计划第一个推出的产品是大模型推理和部署系统,解决AIGC(生成式人工智能)和LLM(大语言模型)行业推理部署成本太高的痛点。
在他看来,随着ChatGPT的爆火,AIGC快速发展,全球算力需求随之爆发式增长,由此导致算力供给严重不足,高昂的算力成本和应用开发门槛成为生成式AI发展的主要瓶颈。而硅基流动致力于提供服务大模型的应用,打造大模型时代的AI基础设施(AI Infra),降低大模型应用成本和开发门槛,加速AGI普惠人类。
对于创业公司来说,成为AGI普及道路上的“卖铲人”总好过在基座模型赛道卷生卷死。
03 江湖已变
王慧文虽然重出江湖,但AI大模型的江湖早已不是当初的格局。
目前,各路大模型发布会的强调重点也悄然转变为赋能产业、场景结合、行业垂直,“落地”成为了此次AI创业浪潮的最大目标。
比如,阅文集团的作家助手妙笔版定位为“行业首个网文大模型”,提供辅助创造、内容诊断、答疑解惑等功能;百度从训大模型、用大模型和做应用三个层次服务客户,探索政务、金融、交通等领域的大模型落地;华为云以“5+N+X”的思路构建华为盘古大模型,形成了政务、金融、矿山、智能驾驶等行业解决方案,并放出了“不作诗只做事”的豪言。
截至2023年8月底,百度、字节、商汤、中科院旗下紫东太初、百川智能、智谱华章等8家企业/机构的大模型,已首批正式上线开始面向公众提供服务。
AI大模型的应用领域涉及自然语言处理、计算机视觉、制造业、文化产业、金融、医疗、教育、零售等,建筑、家电、半导体等领域的AI大模型也相继面世。
哪怕是帮助王慧文兜底的美团,也在强调应用场景的落地。在2023年一季度财报时,美团创始人王兴就曾表示,美团已组建内部团队进行大模型和应用层面的研发,并对外部技术合作机会和投资机会持开放态度。2023年6月,美团完成光年之外境内外主体100%股权的收购,收购价约为20.65亿元人民币。
国联证券分析师认为,AI大模型与美团业务应用场景契合,有望增强美团在C端外卖、到店酒旅场景对用户的兴趣理解、智能推荐与智能交互,以及助力美团在B端对生态商家端用户智能服务、智能营销、经营智能预测等服务效能提升,从而赋能本地业务。
更为可怕的是,
就在国产大模型的产业化落地有条不紊地进行时,OpenAI再度进化拉开身位。
2023年11月,OpenAI再次取得突破性成就。北京时间11月7日凌晨,OpenAI在开发者大会上公布了最新成果GPT-4 Turbo,不仅更快、有更长的上下文、更好的控制,API 的价格也下调至原来的1/3,降到了 1000 输入/美分。
同时,OpenAI 推出了GPTs,每一个 GPT 像是 ChatGPT 的一个为了特殊目的而做出的定制版本,用户可以用自然语言构建定制化 GPT,然后上传到GPT Store。
从推出GPTs与GPT Store以及布局AI硬件等举措可以看出,OpenAI显然拥有更远大的目标和野心,即将自身打造成一个独立于现有应用商店和分发方式的平台,乃至“苹果化”的自主软硬件生态。
回归国内,“百模大战”打了一年,不少玩家已经偃旗息鼓,像王慧文这样重新杀回来的人物并不多见,是飞蛾扑火般地重蹈覆辙,还是重整旗鼓后的自省出发,还有待时间的检验。
参考资料:
晚点latePost《ChatGPT元年:野心,战略,以及绕不开的困难》
晚点latePost《首批大模型通过备案,更激进的投入开始了》
新眸《王慧文无心与李彦宏「斗法」》
智能涌现《对话王慧文:AGI这么伟大的事情,谁做成了我都会鼓掌》
投资界《王慧文,刚投一位老友》
华尔街见闻《李开复:大模型即将“洗牌”,估计活下来的不多》
北京商报《大模型,从“封神”到落地》
版权声明
本文收集整理自网络,如有侵权,请联系删除。