阿里巴巴正式开源千问3 仅需4张H20即可部署满血版

快科技4月29日消息,今天凌晨,阿里巴巴开源新一代通义千问模型Qwen3(简称千问3,参数量为DeepSeek-R1的1/3,成本大幅下降。

千问3是“混合推理模型”,“快思考”与“慢思考”集成进同一个模型,对简单需求可低算力“秒回”答案,对复杂问题可多步骤“深度思考”,节省算力消耗。

阿里巴巴正式开源千问3 仅需4张H20即可部署满血版

作为Qwen系列全新一代的混合推理模型,Qwen3 在 GPQA、AIME24/25、LiveCodeBench 等多个权威评测中表现出极具竞争力的结果。

在相同计算资源下,Qwen3 模型以更小的规模实现了对更大体量上一代模型的超越,真正做到了“小而强大”。

千问3总参数量235B,刷新了开源模型的智能水平新高,阿里称仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。

千问3模型版本包含2款30B、235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型。

免责声明:本文为本网站出于传播商业信息之目的进行转载发布,不代表本网站的观点及立场。本文所涉文、图、音视频等资料之一切权力和法律责任归材料提供方所有和承担。本网站对此咨询文字、图片等所有信息的真实性不作任何保证或承诺,亦不构成任何购买、投资等建议,据此操作者风险自担。

上一篇 2025年4月28日 19:58
下一篇 2025年4月29日 09:03

相关推荐