
Alibaba's Upgraded Qwen3 Outperforms OpenAI, DeepSeek

阿里巴巴集团推出了其 Qwen3 大型语言模型的升级版,在关键基准测试中超越了 OpenAI 和 DeepSeek。新模型 Qwen3-235B-A22B-Instruct-2507-FP8 在遵循指令和编码方面显示出显著的改进,输入容量增加至 256,000 个标记。此外,阿里巴巴的 30 亿参数 Qwen 模型将为惠普在中国的智能助手提供支持。英伟达首席执行官在最近访问中国时赞扬了 Qwen 系列,强调其先进的能力。阿里巴巴的股票今年上涨超过 42%,表现优于纽约证券交易所综合指数
阿里巴巴集团 BABA 推出了其第三代 Qwen3 大型语言模型(LLMs)的升级版本,增强了其在数学和编码方面的 AI 能力,以在关键基准测试中超越 OpenAI 和 DeepSeek 的顶级模型。
新的开源模型 Qwen3-235B-A22B-Instruct-2507-FP8 在指令跟随、逻辑推理、编码、科学和工具使用方面显著提升,正如《南华早报》周二在 HuggingFace 和阿里巴巴的 ModelScope 平台上的更新中所指出的。
虽然升级后的 Qwen 模型目前以非思考模式运行,直接输出而不显示推理步骤,但它现在支持最多 256,000 个标记的输入。这是一个八倍的增长,使得模型能够在单次对话中处理更长的文本序列。
另请阅读:阿里巴巴和华为主导中国日益增长的云市场
除了核心 LLM 的进展,阿里巴巴还宣布其 30 亿参数的 Qwen 模型将为 HP 在中国的 “智能助手小微会” 提供支持。这一整合旨在帮助用户更高效地撰写文档和总结会议。
公司发布的性能数据表明,Qwen3-Coder 在关键编码基准测试中超越了国内竞争对手,如 DeepSeek 和 Moonshot AI 的 K2。阿里巴巴还表示,该模型在某些能力上与美国顶级产品,包括 OpenAI 的 GPT-4 和 Anthropic 的 Claude 相媲美。
热门投资机会
在最近一次访问中国时,Nvidia NVDA 首席执行官 黄仁勋 称赞 Qwen 系列,以及 DeepSeek 和 Moonshot 的 Kimi 模型,认为它们是全球最先进的开放推理 AI 系统之一,强调了中国在全球 AI 竞赛中的快速进展。
黄仁勋在美国批准该公司 H20 GPU 的出口许可证申请后不久访问中国,这些 GPU 旨在符合美国出口法规。尽管美国机构尚未最终确定文件,但黄仁勋表示,政府向 Nvidia 保证将授予许可证。
阿里巴巴的股票今年以来大幅上涨,年初至今上涨超过 42%,表现超过了纽约证券交易所综合指数的 8% 的涨幅。
价格动态: 截至周三最后检查,BABA 股价在盘前交易中上涨 2.15%,至 123.31 美元。
- 阿里巴巴因交付价格战损失数十亿,市值蒸发 1000 亿美元
照片由 Mamun_Sheikh 提供,来源于 Shutterstock
