截至2023年5月底,国内10亿级参数规模以上基础大模型至少已经公布了79个,此时距离ChatGPT在国内“破圈”尚不足3个月。时间来到8月,这股势头依然不减。15日,科大讯飞发布星火认知大模型V2.0版本,在代码及多模态能力方面进行了重大升级;在14日的年度演讲上,小米董事长雷军宣布小爱同学已升级大模型,并开始邀请测试;3日,“神秘”的腾讯混元大模型也浮出水面,目前已进入公司内应用测试阶段……“百模大战”一触即发,国内通用类、垂直类大模型呈现井喷之势发展。IDC预测,2026年中国AI大模型市场规模将达到211亿美元,人工智能将进入大规模落地应用关键期。放眼全球,据统计今年上半年全球新发布的大模型已超过400个。麦肯锡的报告《生成式人工智能的经济潜力》中提到,在其研究的63种应用中使用生成式AI,将为全球经济带来每年2.6万亿~4.4万亿美元的增长。同时,由于通用大模型成本与技术门槛相对较高,国内较多大模型选择围绕垂直行业进行开发,模型参数量虽然不大,但是因为有一些行业的核心数据和业务系统的生产数据参与,所以在相应行业解决问题更为高效、直接,特别是在金融、教育、医疗等领域,已经有不少公司发布了相应产品。整体生态呈现出“通用+垂直”的模型互相融通的态势。今年6月,ChatGPT访问量环比下滑9.7%,为其推出以来首次下滑。从全球范围看,尽管不断有企业发布或更新大模型,但媒体和公众似乎不再像几个月前那般“上头”。当大模型回归理性,市场必然要经历一场大浪淘沙。关乎技术,更关乎商业模式。目前几乎所有的大模型预训练都基于Transformer架构,虽是“百模大战”,但各家大模型之间同质化严重,实质性的创新相对较少。同时,训练大模型所耗费的计算资源非常庞大,需要超级算力的支撑,很多公司没有过往的研究履历,发布的产品多是“套壳”或者接入其他研发机构的模型,投机现象泛滥。当下的大模型竞争早已超过了技术的范畴,更多是一种生态层面的比拼,具体表现在有多少应用、有多少插件、有多少开发者以及用户等。如果没有良好的可循环生态,那么无论在模型的持续迭代,抑或变现摊薄巨额研发成本方面,都会面临可预见的重大困境,对于创业型公司来说更是如此。今年获得世界人工智能大会最高奖项SAIL奖(卓越人工智能引领者奖)的论文《机器学习结合阻抗谱技术预测锂电池老化》,文章作者、中山大学物理学院副教授张云蔚说,她只采集了2万个电化学阻抗谱,就实现了AI精准建模。比起海量数据,更重要的是思路。就是这样一个小模型,将过去需要花费几天才能实现的电池寿命预测缩短到了15分钟,且检测精度是原来的10倍。越是面对如大模型落地这种复杂的问题,就越是要回归更本质的层面去思考,考验的不仅是技术力,更重要的还是要落实在“服务”二字上,更高效、更便捷、更人性化将会是未来可持续探索的重要方向。1、受关注度或注意力这一综合性指标所反映的也是最综合性的或整体性的。2、真正的答案往往要向内去寻找,这是更为根本的解决之道。3、发展迅猛,未来的中国大模型100强即将出现,敬请期待。