Популярные криптовалюты

BTC $124,330.67 +0.23%
ETH $4,697.08 +2.98%
XPL $0.9882 +13.22%
BNB $1,294.14 +6.26%
SOL $231.06 -0.63%
DOGE $0.26153 +1.37%
XRP $2.977 -0.48%

Alibaba представил «гибридные» ИИ-модели Qwen3

WEN $0.0000343 -0.04%

Alibaba выпустил новое семейство ИИ-моделей Qwen3, которые «способны сравниться или превзойти в некоторых случаях» лучшие решения от Google и OpenAI.

Китайский техгигант Alibaba выпустил новое семейство ИИ-моделей Qwen3, которые «способны сравниться или превзойти в некоторых случаях» лучшие решения от Google и OpenAI.

Introducing Qwen3! We release and open-weight Qwen3, our latest large language models, including 2 MoE models and 6 dense models, ranging from 0.6B to 235B. Our flagship model, Qwen3-235B-A22B, achieves competitive results in benchmark evaluations of coding, math, general… pic.twitter.com/JWZkJeHWhC

— Qwen (@Alibaba_Qwen) April 28, 2025

Их размер варьируется от 600 млн до 235 млрд параметров. Модели являются «гибридными» — они способны как затрачивать больше времени для рассуждений, так и предоставлять быстрые ответы. 

«Мы органично объединили режимы мышления и немышления, предоставив пользователям гибкость […]. Такая конструкция позволяет с большей легкостью настраивать бюджеты для конкретных задач», — отметила команда в блоге. 

Qwen3 поддерживает 119 языков и обучена на наборе данных, содержащем более 36 трлн токенов. 

На платформе по оценке навыков программирования Qwen-3-235B-A22B обошла o3-mini и Gemini 2.5 Pro. o3-mini она опередила в последней версии математического теста AIME и BFCL — оценивает способность «рассуждать» о проблемах.

Qwen-3-235B-A22B пока нет в публичном доступе. Qwen3-32B является крупнейшей среди открытых. Она превосходит o1 в нескольких тестах, включая бенчмарк программирования LiveCodeBench.

Напомним, в марте Alibaba представила ориентированную на рассуждения ИИ-модель QwQ-32.

RSS 29.04.2025 1 173
Источник: https://forklog.com/news/ai/alibaba-predstavil-gibridnye-ii-modeli-qwen3