阿里云Qwen3发布：中国首个开源混合推理大模型 - ListenHub

阿里云Qwen3发布：中国首个开源混合推理大模型

ListenHub

1

4-30

Fromqq

阿里云发布 Qwen3：中国首个混合推理开源大模型

重磅发布： 阿里云发布通义千问 Qwen3，并开源 8 个版本。
技术突破： Qwen3 是中国首个、全球首个开源的混合推理模型，融合了 “推理” 和 “非推理” 模式，能像人一样根据问题选择 “快、慢思考”。
性能提升：
- 旗舰模型 Qwen3-235B-A22B 在多项测评指标上超越 DeepSeek-R1 满血版 (参数更少，效果更好)。
- 更小的 MoE 模型 Qwen3-30B-A3B 使用时的激活参数更少，但效果更优，降低了部署和使用成本。
开源策略：
- Qwen 系列大模型已被累计下载 3 亿次，衍生模型数量超 10 万个，全球第一。
- 阿里大模型研发负责人周靖人认为，从技术发展规律看，不开源风险更大。
市场影响：
- 苹果据传选择 Qwen 成为中国的大模型合作伙伴。
- 李飞飞团队用 Qwen 训练超低成本推理模型。
- 通用 Agent 产品 Manus 调用 Qwen 做决策规划。
阿里云的 AGI 路径：
- 大模型发展和云体系的支撑不可分割。
- 探索让模型更像人那样思考，具备自我反思、自我纠错等能力。
- 多模态是通向 AGI 的重要途径。
- 探索新的学习机制，包括在线学习、持续学习和自学习。
混合推理模型的优势： 更好平衡性能和成本，通过推理和非推理的混合训练实现。
阿里对大模型的认知变化： 模型是新时代重要的生产元素，开源更利于普及，是重要的创新驱动力。
周靖人金句：
- “我们无法预知别人的发布节奏。研发这件事，想临时调节奏也调不过来，不符合研发规律。”
- “从技术发展规律看，不开源反而风险更大，因为开源至少会追上闭源，甚至发展得更好。”
- “其实 o1 谈不上定义了新范式。让模型学会思考，它不是一个范式，而是一种能力。”
- “今天外界听到吴泳铭宣布了什么，感觉阿里好像突然有个大转变，其实不是。从技术发展规律来说，没有前期积累不可能一蹴而就。”
- “某一天的流量其实没那么重要。更前瞻性地思考，更笃定地坚持自己的技术路径和节奏。”
- “科技研发没有捷径。

Outline

阿里云发布 Qwen3：中国首个混合推理开源大模型

重磅发布： 阿里云发布通义千问 Qwen3，并开源 8 个版本。
技术突破： Qwen3 是中国首个、全球首个开源的混合推理模型，融合了 “推理” 和 “非推理” 模式，能像人一样根据问题选择 “快、慢思考”。
性能提升：
- 旗舰模型 Qwen3-235B-A22B 在多项测评指标上超越 DeepSeek-R1 满血版 (参数更少，效果更好)。
- 更小的 MoE 模型 Qwen3-30B-A3B 使用时的激活参数更少，但效果更优，降低了部署和使用成本。
开源策略：
- Qwen 系列大模型已被累计下载 3 亿次，衍生模型数量超 10 万个，全球第一。
- 阿里大模型研发负责人周靖人认为，从技术发展规律看，不开源风险更大。
市场影响：
- 苹果据传选择 Qwen 成为中国的大模型合作伙伴。
- 李飞飞团队用 Qwen 训练超低成本推理模型。
- 通用 Agent 产品 Manus 调用 Qwen 做决策规划。
阿里云的 AGI 路径：
- 大模型发展和云体系的支撑不可分割。
- 探索让模型更像人那样思考，具备自我反思、自我纠错等能力。
- 多模态是通向 AGI 的重要途径。
- 探索新的学习机制，包括在线学习、持续学习和自学习。
混合推理模型的优势： 更好平衡性能和成本，通过推理和非推理的混合训练实现。
阿里对大模型的认知变化： 模型是新时代重要的生产元素，开源更利于普及，是重要的创新驱动力。
周靖人金句：
- “我们无法预知别人的发布节奏。研发这件事，想临时调节奏也调不过来，不符合研发规律。”
- “从技术发展规律看，不开源反而风险更大，因为开源至少会追上闭源，甚至发展得更好。”
- “其实 o1 谈不上定义了新范式。让模型学会思考，它不是一个范式，而是一种能力。”
- “今天外界听到吴泳铭宣布了什么，感觉阿里好像突然有个大转变，其实不是。从技术发展规律来说，没有前期积累不可能一蹴而就。”
- “某一天的流量其实没那么重要。更前瞻性地思考，更笃定地坚持自己的技术路径和节奏。”
- “科技研发没有捷径。

Script

晓曼: 哎，今天咱得聊聊阿里云那个Qwen3，说是国内首个开源的“混合推理”大模型，这“混合推理”听着挺玄乎，到底是个啥玩意儿？比咱们平时说的大模型厉害在哪儿啊？

原野: 嗯，Qwen3这次确实有点东西。这个“混合推理”啊，你可以把它理解成人脑的两种模式，就是快思考和慢思考。简单来说，就像你查个天气预报，嗖一下就出来了，但你要写篇复杂的论文，那大脑不得好好琢磨琢磨？Qwen3就有点这意思，遇到简单任务用“快思考”，复杂任务就切换到“慢思考”。

晓曼: 哎呦，这比喻挺形象！那这Qwen3开源了几个版本啊？听说开源版本多用起来也方便。

原野: 这次一口气开源了八个版本，从几十亿参数到最大的235B都有。而且旗舰版Qwen3-235B-A22B，听说在很多指标上都超过了DeepSeek-R1，更牛的是，它参数还更少！还有个MoE版本，Qwen3-30B-A3B，这个更厉害，激活的参数更少，成本更低，但是效果更好。

晓曼: 那这MoE版本，是不是就像以前要十个人干的活，现在三两个人就能搞定？

原野: 你这理解很到位！你可以把它想象成一个团队，每个人都是专家，擅长不同的领域。比如，数学问题交给“数学专家”，写作交给“写作专家”，不用所有人一起上，效率就高了。

晓曼: 厉害厉害！那它为啥要开源呢？听说Qwen系列下载量都破3亿了，衍生模型十万多个？这数据也太夸张了吧？

原野: 可不是嘛！阿里云的大模型负责人周靖人说了句大实话：“不开源风险反而更大！”你想啊，开源了大家一起研究，才能更快进步，甚至超越那些闭源的。

晓曼: 哇，原来开源是为了更快进步啊！那现在市场反应咋样？有没有人真正在用？

原野: 那可多了！据说苹果都选它当中国的大模型合作伙伴了，还有李飞飞团队，拿它来训练低成本的推理模型。一些做智能Agent的公司，比如Manus，用Qwen3做决策规划，直接就上线了。

晓曼: 看来真挺火啊！那阿里云在AGI这条路上，下一步准备怎么走？

原野: 阿里云想把大模型和云计算绑在一起，目标是让模型能“自我反思”、“自我纠错”，还能多模态感知和在线学习。就像给大脑插个USB接口，随时更新知识，永不停机。

晓曼: 哎呦，听你这么一说，感觉科幻电影里的“人工智能”离我们越来越近了！

原野: 是啊，但周靖人也说了，搞科技研发没啥捷径可走，得有前瞻性，还得坚持自己的节奏。今天看到这些成果，其实都是一步一个脚印走出来的。

晓曼: 总结一下，Qwen3打破了国内开源“大模型”的空白，引入了“快慢思维”的混合推理，参数更优、成本更低，还加上阿里云的强大云生态和开源策略，连苹果、学术界都来合作，这盘棋下的挺大！

原野: 没错，开源+混合推理+生态联动，这才是真正的“创新加速度”！

晓曼: 感谢你今天给咱讲得这么明白！

原野: 不客气，下期再聊！