海报记者新闻San GY于9月24日在Yunqi 2025会议上报道说,阿里巴巴云CTO Zhou Jingren推出了七个大型技术产品。七种技术产品涵盖了语言,语音,愿景,多模式,代码和成就等领域,作为模型的智能水平,呼吁代理工具,编码功能,深层和多模式推断。世界。 Qwen3-Max包括两个主要版本:指令和思想。它的预览版本占聊天机器人砂等级的第三名,预计官方版本的性能将实现另一个进步。 Qwen3-Max是Tongyi Qianwen家族的最大,最强大的基本模型。先前训练的数据量达到36T,总参数超过10亿,并提供了非常强大的编码和代理编程功能。在禁令验证测试员SWE中,使用编码来解决大型模型的真实问题,定向版本Ained 69.6分,首先在世界上进行分类。在TAU2银行测试中,重点介绍了代理工具的呼叫功能,QWEN3-MAX获得了74.8分的前进,超过了Claude Opus4和DeepSeek-V3.1。 QWEN3-MAX推断模型也显示出卓越的性能。结合工具调用和并行推理技术,它们的推理能力在AIME 25和HMMT测试中达到了新的最大值,而HMMT测试的重点是数学推断,两者在中国获得了第一个完整的分数。下一代基本模型架构QWEN3-NEXT和串行模型已正式启动。总计80b模型参数仅3B,并且性能与Qianwen3的235b版本模型相当,在模型的模型效率中取得了巨大的进步。 Qwen3-next与大型模型的上下文相吻合,以扩展仪表参数的未来趋势。我们创新地使用了中央技术,例如混合动力护理机制,高安全性MOE结构和多个预测机制(MTP)。与密集型QWEN3-32B相比,该模型的培训成本降低了90%以上,长期推断的性能增加了10倍以上,建立了新的培训标准和未来大型模型的推理效率。至于特殊模型,Qianwen Qwen3-Coder编程模型已大大更新。新的QWEN3-CODER与QWEN代码和Claude Code系统进行了培训,从而改善了应用程序的有效性,更快的推理速度和明显的代码安全安全性。 Qwen3-Coder已受到开发人员和公司为其强大的代码和完成能力的广泛赞扬,这使其能够完成项目的完整实施以及单点点击问题的修复。开源后,在已知的API。 OpenRouter平台的投篮命中率为1474%,占世界第二名。在多模式模型中,备受期待的视觉理解模型QWEN3-VL创建了主要的开源,在视觉感知和多模式推理方面取得了巨大的进步,克服了Gemini2.5-Pro和GPR5,中央竞争评估为32。QWEN3-VL具有非常强大的视觉代理和视觉效果。它不仅了解摄影,还可以执行与人类类似的电话和移动计算机,从而完成许多自动每日任务。输入照片后,QWEN3-VL可以调用代理商的工具来扩展图像详细信息,并使用更仔细的观察和分析来推断更好的答案。如果显示了设计图,则qwen3-vl可以生成drawing.io/html/css/js,并生成“您所看到的”的完整视觉编程。此外,QWEN3-VL已更新了其3D(3D检测)地面连接功能,以奠定坚实的基础并入智能。数以百万计的扩展是为了支持令牌的背景,视频理解时间已延长了2个多小时。完整的模式型Qwen3-Omni感到惊讶,并以32个开源最佳性能SOTA宣布。用户还可以配置自定义角色,调整对话样式并创建独家个人IP。像人类的婴儿一样,他们在出生时就会在各个方面都感知到世界,Qwen3-Oumni从一开始就增加了多模式混合动力训练。在前后过程中,QWEN3-AMNI使用跨模式混合数据。以前,在混合了模型后,它们甚至降低了智力,例如彼此限制的几个特征,从而提高了音频理解并减少对文本的理解。但是,QWEN3-OMNI获得了强大的音频,音频和视频功能,但是单个文本性能和模态图像保持稳定。这是行业第一个实现这一目标的下雨效应。 Tongyi Wanxiang是Tongyi Big Model家族的基本视觉模型。这次,将启动WAN2.5-Previa系列系列,其中涵盖了四个主要型号:Wansheng视频,摄影,Wensheng照片和图像编辑。 Tongyi Wanxiang 2.5视频生成模型生成了摄影作战声音,声音效果和音乐背景音乐,从而第一次实现了Theaudio和视频同步视频的视频生成功能,从而进一步降低了电影级别的视频创建阈值。视频Tongyi Wanxian 2.5的发电时间已从5秒增加到10秒,这支持了从1080p到24张图片的高分辨率视频的产生,从而进一步提高了遵循模型说明的能力。现在,Tongyi Wanxiang 2.5已完全更新了其图像生成功能,以生成中文和英文文字和图形,录取图像编辑功能,并允许您输入句子以组合图片P。在此Yunqi会议上,Tongyi Mockup家族将推出新成员,即语音模式Tongyi Bailing也受到欢迎。救援已发布了Fun-ASR语音识别模型和Fun-Cosyvouize语音合成模型。娱乐:ASR接受了数十亿个真实音频数据的培训,并具有强大的上下文理解和适应性的培训。 Fun-Cosyvoice可以提供数百种预制音调,用于客户服务,销售,现场电子商务,电器,有声读物,儿童娱乐和其他场景。 Tongyi Big Model Family从0.5B到10亿元人民币均包含“全尺寸”,其中包括针对LLM,编程,图像,音频,视频等的“完整模式”,并且可以满足从智能终端到云的多种情况的需求。自2023年第一个开源模型以来,Tongyi Big Model拥有超过6亿个全球下载量,其中超过170,000个派生模型,这些模型已成为世界上第一个开源模型。除了使IA开发商受益外,Tongyi派生的模型开发局还涵盖了名为Apple,Nvidia,Microsoft,Deepseek,Bytedonce的国家和外国公司。如今,汤蒂(Tongyi)大型模特参加了超过1000多个customer。根据沙利文(Sullivan)的一份报告,在2025年上半年,汤伊(Tongyi)在中国的业务水平上首次被分类。