Популярные криптовалюты

BTC $112105 +2.46%
ETH $4,126.01 +3.26%
XPL $1.294 -12.77%
SOL $208.59 +3.67%
XRP $2.8735 +3.38%
BNB $1,005.3 +4.26%
MNT $1.8823 +0.11%

Alibaba представил «гибридные» ИИ-модели Qwen3

WEN $0.0000332 +0.04%

Alibaba выпустил новое семейство ИИ-моделей Qwen3, которые «способны сравниться или превзойти в некоторых случаях» лучшие решения от Google и OpenAI.

Китайский техгигант Alibaba выпустил новое семейство ИИ-моделей Qwen3, которые «способны сравниться или превзойти в некоторых случаях» лучшие решения от Google и OpenAI.

Introducing Qwen3! We release and open-weight Qwen3, our latest large language models, including 2 MoE models and 6 dense models, ranging from 0.6B to 235B. Our flagship model, Qwen3-235B-A22B, achieves competitive results in benchmark evaluations of coding, math, general… pic.twitter.com/JWZkJeHWhC

— Qwen (@Alibaba_Qwen) April 28, 2025

Их размер варьируется от 600 млн до 235 млрд параметров. Модели являются «гибридными» — они способны как затрачивать больше времени для рассуждений, так и предоставлять быстрые ответы. 

«Мы органично объединили режимы мышления и немышления, предоставив пользователям гибкость […]. Такая конструкция позволяет с большей легкостью настраивать бюджеты для конкретных задач», — отметила команда в блоге. 

Qwen3 поддерживает 119 языков и обучена на наборе данных, содержащем более 36 трлн токенов. 

На платформе по оценке навыков программирования Qwen-3-235B-A22B обошла o3-mini и Gemini 2.5 Pro. o3-mini она опередила в последней версии математического теста AIME и BFCL — оценивает способность «рассуждать» о проблемах.

Qwen-3-235B-A22B пока нет в публичном доступе. Qwen3-32B является крупнейшей среди открытых. Она превосходит o1 в нескольких тестах, включая бенчмарк программирования LiveCodeBench.

Напомним, в марте Alibaba представила ориентированную на рассуждения ИИ-модель QwQ-32.

RSS 29.04.2025 1 171
Источник: https://forklog.com/news/ai/alibaba-predstavil-gibridnye-ii-modeli-qwen3