По распространившимся сообщениям, Anthropic выпустила модель Claude Mythos 5 для доверенных организаций, а также ее публичную, ограниченную в плане безопасности версию — Claude Fable 5. Ее нельзя использовать для подготовки кибератак. Опубликованная вместе с этим таблица бенчмарков показывает заметный отрыв новых моделей от Claude Opus 4.8, а также от GPT 5.5 и Gemini 3.1 Pro. The post Claude Mythos 5 и Fable 5: Anthropic выпустила новые ИИ-модели appeared first on BeInCrypto.
По распространившимся сообщениям, Anthropic выпустила модель Claude Mythos 5 для доверенных организаций, а также ее публичную, ограниченную в плане безопасности версию — Claude Fable 5. Ее нельзя использовать для подготовки кибератак. Опубликованная вместе с этим таблица бенчмарков показывает заметный отрыв новых моделей от Claude Opus 4.8, а также от GPT 5.5 и Gemini 3.1 Pro.
Согласно методологии в таблице, результаты Mythos 5 и Fable 5 различаются в пределах нескольких процентных пунктов, и в ней приводится более высокий из двух показателей.
Хотите еще эксклюзивных новостей и аналитики? Подписывайтесь на наш телеграм-канал, обсуждайте новости и делитесь мнениями о последних событиях рынка в чате!
В агентном программировании — то есть в способности самостоятельно решать задачи разработки — новая модель заметно опередила конкурентов. На тесте SWE-Bench Pro, который проверяет умение исправлять баги и дописывать код в реальных проектах, она набрала 80,3% против 69,2% у Claude Opus 4.8, 58,6% у GPT 5.5 и 54,2% у Gemini 3.1 Pro. На Terminal-Bench 2.1, оценивающем работу через командную строку, результат составил 88,0% против 82,7% у Opus 4.8.
Сильный отрыв виден и в других категориях. В работе со знаниями (GDPval-AA, тест на качество интеллектуальных рабочих задач уровня специалиста) модель набрала 1932 балла против 1890 у Opus 4.8.
В междисциплинарном экзамене Humanity’s Last Exam, охватывающем десятки областей знания, она показала 64,5% — с доступом к вспомогательным инструментам вроде поиска и кода.
На биологическом тесте BioMysteryBench результат достиг 83,9%, что соответствует уровню эксперта-человека, а в кибербезопасности (ExploitBench, поиск и использование уязвимостей) — 78,0% против 40,0% у Opus 4.8.
Любопытно, что в отдельной категории отличилась именно версия Mythos Preview: в управлении компьютером (OSWorld-Verified, тест на самостоятельные действия в операционной системе) она показала наивысший результат — 85,4%, опередив даже Fable/Mythos 5 с их 85,0%.
По ряду биологических и кибербезопасных тестов, отмеченных звездочкой, более высокие результаты публичной версии Fable 5 объясняются срабатыванием защитных механизмов и резервных сценариев.
Если приведенные данные подтвердятся, новые модели Anthropic закрепят отрыв в агентном программировании и работе со знаниями, где разрыв с конкурентами измеряется уже не единицами, а десятками процентных пунктов. Особенно показателен результат в кибербезопасности, где Fable 5 почти вдвое опережает Opus 4.8.
При этом сама структура релиза отражает осторожный подход компании: мощная версия Mythos 5 достается лишь доверенным организациям, а широкой публике предлагается ограниченная Fable 5 с защитными барьерами.
Хотите получить доступ к экспертным инсайдам? Подписывайтесь на наш новостной телеграм-канал, а также вступайте в сообщество BeInCrypto! Читайте последние новости и свежую аналитику криптовалют, ИИ и фондовых рынков. Будьте на шаг впереди толпы каждый день!
The post Claude Mythos 5 и Fable 5: Anthropic выпустила новые ИИ-модели appeared first on BeInCrypto.