4月29日,阿里巴巴开源新一代通义千问模型Qwen3。据介绍,Qwen3是国内首个“混合推理模型”,性能全面超越R1、OpenAI-o1等全球顶尖模型,登顶全球最强开源模型。
次日,零一万物CEO、创新工场董事长李开复博士在接受采访时称:阿里通义千问Qwen、DeepSeek等中国自研顶尖开源模型给全世界带来了巨大震撼:
第一、开源模型性能足以匹敌闭源模型,虽然目前OpenAI、Anthropic的顶尖闭源模型在性能上仍然保持一定领先,但是与Qwen3、DeepSeek-R1等优秀开源模型相比,领先幅度有限。
第二、中国大模型公司用“多快好省”的模型训练路径不仅极大节省了算力,而且强化学习的技术路径更直接让模型训练方式从传统的人工训练AI迭代到了AI训练AI,直接挑战了OpenAI领衔的“巨量投入才获增长”的“暴力美学”,展示了中国AI探索出了模型训练自主创新的“第二路径”。
他还直言Qwen3的发布再次强调了开源模型的竞争力的同时,也为坚持只走闭源路线的硅谷巨头敲响警钟,“花费巨量的资源训出的闭源模型性能仅仅比开源模型略好一点,这样的商业模式是不可持续的。而开源模型进一步让大模型价格接近普惠点,促进了AI平权。”
此前,李开复还判断,中国大模型未来大概率只剩下DeepSeek、阿里和字节跳动三家主要公司。