OpenAI выпустила рассуждающие ИИ-модели с открытым исходным кодом. Они демонстрируют высокие показатели в ряде бенчмарков и доступны на Hugging Face.
Компания OpenAI выпустила рассуждающие ИИ-модели с открытым исходным кодом. Они демонстрируют высокие показатели в ряде бенчмарков и доступны для загрузки на Hugging Face.
We released two open-weight reasoning models—gpt-oss-120b and gpt-oss-20b—under an Apache 2.0 license.Developed with open-source community feedback, these models deliver meaningful advancements in both reasoning capabilities & safety.https://t.co/PdKHqDqCPf
— OpenAI (@OpenAI) August 5, 2025Представлено две версии:
Релиз знаменует собой выпуск первых языковых моделей OpenAI с открытым исходным кодом с момента релиза GPT-2, которую представили более пяти лет назад — в 2019 году.
Компания отметила, что ее открытые модели могут обращаться к более мощным закрытым LLM, если не справляются с задачей самостоятельно.
В начале своей работы OpenAI публиковала исходный код нейросетей, но позже перешла к закрытому формату разработки. Это позволило компании создать крупный бизнес, продавая доступ к продуктам через API.
В январе Сэм Альтман признал, что компания оказалась «не на той стороне истории» в вопросе открытого исходного кода. Сегодня она сталкивается с растущим давлением со стороны китайских лабораторий вроде DeepSeek, Alibaba и Moonshot AI, которые разработали несколько способных и открытых моделей.
В июле администрация Трампа призвала американских разработчиков искусственного интеллекта активнее раскрывать технологии для содействия их глобальному внедрению с опорой на американские ценности.
В тесте по программированию Codeforces gpt-oss-120b и gpt-oss-20b набрали 2622 и 2516 баллов соответственно. Они опередили R1 от DeepSeek, но не дотянули до o3 и o4-mini.
В Humanity Last Exam — сложном испытании с разными вопросами по различным предметам — модели набрали 19% и 17,3% соответственно. Аналогично предыдущему тесту, они уступили o3, но обошли ведущие открытые модели DeepSeek и Qwen.
В математическом соревновании AIME открытые модели набрали 96,6 и 96 баллов соответственно, что сопоставимо с показателями других ИИ компании.
Открытые нейросети галлюцинируют значительно чаще по сравнению с o3 и o4-mini. OpenAI отметила, что это «ожидаемо, так как маленькие модели имеют меньше знаний о мире».
Gpt-oss-120b и gpt-oss-20b галлюцинировали в ответ на 49% и 53% вопросов PersonQA — внутреннего эталона для измерения точности знаний ИИ о людях. O1 имеет показатель 16%, o4-mini — 36%.
Галлюцинации остались основной проблемой ИИOpenAI обучала новые открытые модели по тем же технологиям, что и закрытые. они Они основаны на архитектуре mixture-of-experts, позволяющей задействовать лишь часть параметров для каждого запроса. Так, gpt-oss-120, имеющая 117 млрд общих параметров, применяет 5,1 млрд на токен.
Нейросети обучались с использованием высокопроизводительного обучения с подкреплением — этапа посттренинга, в рамках которого модели осваивают поведенческие шаблоны в симулированной среде. Для этого применялись крупные кластеры графических процессоров Nvidia.
Этот процесс также использовался для обучения серии o. Открытые модели имеют схожую структуру цепочки размышлений, в которой требуется дополнительное время и вычислительные ресурсы для проработки ответов.
OpenAI заявляет, что открытые модели хорошо подходят для ИИ-агентов: они могут вызывать инструменты вроде веб-поиска или выполнять код на Python в ходе рассуждений. Однако они работают только с текстом, то есть не могут обрабатывать или генерировать изображения и аудио.
OpenAI выпустила gpt-oss-120b и gpt-oss-20b под лицензией Apache 2.0, которая позволяет предприятиям монетизировать открытые модели OpenAI без необходимости платить или получать разрешение от компании.
Однако фирма не опубликовала обучающие данные, которые использовались для создания нейросетей. Решение неудивительно, учитывая несколько судебных процессов против ИИ-разработчиков за «неправомерное» использование информации для настройки искусственного интеллекта.
OpenAI несколько раз откладывала выпуск открытых ИИ-моделей из соображений безопасности. Компания исследовала в том числе возможность использования gpt-oss для кибератак и создания оружия.
Компания провела тестирования и заявила, что модель способна незначительно увеличить биологические возможности.
С выходом открытых ИИ-моделей от OpenAI Amazon заявила, что они станут доступны на Amazon Web Services. Это первый случай, когда нейросети стартапа представлены на площадке.
Microsoft также предлагает версии двух новых ИИ, оптимизированные для устройств на Windows.
Стартап OpenAI ведет переговоры с инвесторами о продаже акций. Предполагаемая оценка — $500 млрд. Это позволит ей обойти SpaceX Илона Маска и стать самой дорогой частной технологической компанией в мире, пишет Financial Times.
На данный момент фирма находится на этапе закрытия последнего раунда финансирования с оценкой в $300 млрд. О нем стало известно в конце марта.
СМИ: OpenAI привлекла $8,3 млрд при оценке в $300 млрдОднако параллельно уже ведутся переговоры с Thrive Capital и другими инвесторами касательно нового раунда. Если он будет закрыт, OpenAI обойдет SpaceX, недавно оцененную в $400 млрд.
По информации издания, OpenAI изучает возможность вторичной продажи акций, которая позволит нынешним и бывшим сотрудникам продать ценные бумаги. Цена размещения пока не определена. Объем продажи будет зависеть от спроса инвесторов.
Напомним, в июле OpenAI представила специальный режим обучения для студентов в ChatGPT, который помогает прорабатывать задачи поэтапно, а не просто получать готовый ответ.