Новая ИИ-модель Alibaba QwQ-32B: меньше параметров, но больше эффективности

В мире искусственного интеллекта давно действует неписаное правило: чем больше параметров у модели, тем она мощнее, умнее и ценнее. Компании вроде OpenAI и Google годами гнались за этим числом, раздувая свои модели до абсурда. Но недавно на рынке появился очередной ИИ, который ломает все укоренившиеся шаблоны. Новый компактный ИИ QwQ-32B с его 32,5 миллиардами параметров […]

В мире искусственного интеллекта давно действует неписаное правило: чем больше параметров у модели, тем она мощнее, умнее и ценнее. Компании вроде OpenAI и Google годами гнались за этим числом, раздувая свои модели до абсурда. Но недавно на рынке появился очередной ИИ, который ломает все укоренившиеся шаблоны.

Новый компактный ИИ QwQ-32B с его 32,5 миллиардами параметров демонстрирует, что число загруженных данных не решает всё. Он уже тяготеет к уровню DeepSeek R1, который имеет 671 миллиард параметров, и уверенно обходит OpenAI o1-mini. Китайцы явно не намерены играть вторым номером, а значит, нас ждёт очередная встряска индустрии.

Теперь перед ИИ разработчиками стоит серьезная задача, конкурировать с новой китайской моделью, которая демонстрирует новые правила игры.

Эта модель — не просто очередной ИИ-эксперимент с красивыми презентациями. QwQ-32B реально работает и показывает хорошие результаты в ключевых задачах.

Компания уже опубликовала внутренние тестами, и цифры впечатляют:

GPQA (экзамен по научному мышлению) — 65,2%
AIME (математический тест высокого уровня) — 50%
MATH-500 (сложные математические задачи) — 90,6%

Всё это достигнуто без сотен миллиардов параметров и без необходимости выжигать дата-центры в процессе обучения.

Реакция сообщества? Как обычно не заставила себя ждать, вызвав волну новых споров и обсуждений. Разработчики ИИ пишут треды в X (Twitter), аналитики нервно обновляют отчёты, а Reddit уже взрывается мемами про то, как китайцы опять переиграли западные корпорации.

«Чёрт, это реально работает!» — типичный комментарий в ИИ-сообществе.

Но самое интересное — это даже не технические показатели. Alibaba открыли модель в свободный доступ, и теперь любой разработчик может попробовать её, интегрировать в свои проекты и посмотреть, что она умеет.

Для сравнения: OpenAI продолжает прятать свои разработки за платными подписками и API, а Alibaba выбрала путь «берите и пользуйтесь». И это сильно меняет расстановку сил на рынке.

Конечно, QwQ-32B не идеальная модель, и у неё есть свои слабые места:

Иногда залипает на цикличных рассуждениях, будто теряется в собственных мыслях.
Не всегда корректно смешивает языки, так что на выходе можно получить очень экзотичный ответ.
Как и большинство китайских ИИ-моделей, фильтрует политически чувствительные темы в рамках местного законодательства.

Ну и, конечно, 32K токенов контекстного окна — это не предел мечтаний, но пока этого достаточно для нормальной работы.

Тем не менее даже с этими ограничениями, модель демонстрирует невероятный уровень эффективности и подрывает старую догму, что только огромные ИИ-системы могут быть полезны.

Традиционный подход к ИИ выглядит так: «чем больше, тем лучше». Раздуваем параметры, ставим больше серверов, заливаем безумные бюджеты. Alibaba показывает, что это далеко не единственный путь.

QwQ-32B — это намёк индустрии, что вместо того, чтобы штамповать многотонных монстров, можно просто оптимизировать процесс, используя более умные методы обучения.

Это не просто любопытный эксперимент, а реальный сдвиг в подходах к ИИ. И если другие компании начнут двигаться в этом направлении, мы можем увидеть новую эру более компактных и эффективных ИИ-моделей.

Китайцы снова переиграли всех? Похоже, что да.

RSS 07.03.2025 1 108

Источник: https://coinspot.io/world/alibaba-unveils-qwq-32b-ai-model-challenges-deepseek-r1/