阿里巴巴的升级版 Qwen3 在性能上超过了 OpenAI 和 DeepSeek

阿里巴巴集团推出了其 Qwen3 大型语言模型的升级版，在关键基准测试中超越了 OpenAI 和 DeepSeek。新模型 Qwen3-235B-A22B-Instruct-2507-FP8 在遵循指令和编码方面显示出显著的改进，输入容量增加至 256,000 个标记。此外，阿里巴巴的 30 亿参数 Qwen 模型将为惠普在中国的智能助手提供支持。英伟达首席执行官在最近访问中国时赞扬了 Qwen 系列，强调其先进的能力。阿里巴巴的股票今年上涨超过 42%，表现优于纽约证券交易所综合指数

阿里巴巴集团 BABA 推出了其第三代 Qwen3 大型语言模型（LLMs）的升级版本，增强了其在数学和编码方面的 AI 能力，以在关键基准测试中超越 OpenAI 和 DeepSeek 的顶级模型。

新的开源模型 Qwen3-235B-A22B-Instruct-2507-FP8 在指令跟随、逻辑推理、编码、科学和工具使用方面显著提升，正如《南华早报》周二在 HuggingFace 和阿里巴巴的 ModelScope 平台上的更新中所指出的。

虽然升级后的 Qwen 模型目前以非思考模式运行，直接输出而不显示推理步骤，但它现在支持最多 256,000 个标记的输入。这是一个八倍的增长，使得模型能够在单次对话中处理更长的文本序列。

另请阅读：阿里巴巴和华为主导中国日益增长的云市场

除了核心 LLM 的进展，阿里巴巴还宣布其 30 亿参数的 Qwen 模型将为 HP 在中国的 “智能助手小微会” 提供支持。这一整合旨在帮助用户更高效地撰写文档和总结会议。

公司发布的性能数据表明，Qwen3-Coder 在关键编码基准测试中超越了国内竞争对手，如 DeepSeek 和 Moonshot AI 的 K2。阿里巴巴还表示，该模型在某些能力上与美国顶级产品，包括 OpenAI 的 GPT-4 和 Anthropic 的 Claude 相媲美。

热门投资机会

在最近一次访问中国时，Nvidia NVDA 首席执行官 黄仁勋 称赞 Qwen 系列，以及 DeepSeek 和 Moonshot 的 Kimi 模型，认为它们是全球最先进的开放推理 AI 系统之一，强调了中国在全球 AI 竞赛中的快速进展。

黄仁勋在美国批准该公司 H20 GPU 的出口许可证申请后不久访问中国，这些 GPU 旨在符合美国出口法规。尽管美国机构尚未最终确定文件，但黄仁勋表示，政府向 Nvidia 保证将授予许可证。

阿里巴巴的股票今年以来大幅上涨，年初至今上涨超过 42%，表现超过了纽约证券交易所综合指数的 8% 的涨幅。

价格动态： 截至周三最后检查，BABA 股价在盘前交易中上涨 2.15%，至 123.31 美元。

阿里巴巴因交付价格战损失数十亿，市值蒸发 1000 亿美元

照片由 Mamun_Sheikh 提供，来源于 Shutterstock