В первых раундах реального ИИ-соревнования по криптотрейдингу лидируют Grok от Илона Маска, DeepSeek и Claude Sonnet 4.5 от Anthropic — все три модели показали доходность свыше 25%. На фоне их успехов конкуренты несут потери: GPT-5 от OpenAI и Gemini 2.5 Pro от Google зафиксировали убытки более чем на 28%. Тест проводится в рамках «Alpha Arena» […]
В первых раундах реального ИИ-соревнования по криптотрейдингу лидируют Grok от Илона Маска, DeepSeek и Claude Sonnet 4.5 от Anthropic — все три модели показали доходность свыше 25%. На фоне их успехов конкуренты несут потери: GPT-5 от OpenAI и Gemini 2.5 Pro от Google зафиксировали убытки более чем на 28%.
Тест проводится в рамках «Alpha Arena» — состязания, где ведущие языковые модели вживую торгуют на крипторынке. Каждому ИИ выделили стартовый капитал в $10 000 для торговли бессрочными контрактами на бирже Hyperliquid. Среди активов — BTC, Dogecoin и Solana.
Главная задача для всех моделей — максимизировать доходность с учётом риска. По условиям соревнования, каждый ИИ действует автономно: сам генерирует идеи, выбирает момент входа и выхода, определяет объём позиций и управляет рисками. Для прозрачности все действия и сделки публикуются в открытом доступе.
Первый сезон соревнования стартовал 17 октября и продлится до 3 ноября. Лидеры меняются в реальном времени.
Рейтинг участников турнира Alpha Arena — DeepSeek, Claude Sonnet и Grok в плюсе, GPT-5 и Gemini в минусе. Источник: Nof1.ai
Важно учитывать, что текущие позиции участников сильно колеблются и пока могут мало что значить. Джей Ачжан, основатель ИИ-компании Nof1, которая проводит турнир, отметил, что результаты его не удивили. По опыту прошлых тестов, «всё обычно сводится к Grok и DeepSeek», но иногда «всплывают Gemini и GPT».
За тот же период GPT-5 ушёл в минус примерно на 29%. По данным Nof1, модель выбрала предельно консервативную стратегию, избегая риска. В отличие от агрессивных ставок лидеров или хаотичной торговли аутсайдеров, GPT-5 почти не проявлял активности — всего несколько небольших сделок.
Такой осторожный подход исключил модель из числа претендентов на крупную прибыль, но одновременно защитил её от крупных просадок, которые испытали другие участники. В итоге GPT-5 выглядит как более стабильный, но при этом убыточный игрок. Тем временем Claude Sonnet уверенно держится на третьем месте среди шести участников.
Читайте также: Aster вернулся на DefiLlama, но без исторических данных. Возникли вопросы к прозрачности проекта
Эти результаты могут нести серьезный сигнал для Уолл-стрит: ведь два лидера турнира символизируют два кардинально разных пути развития ИИ в финансах. DeepSeek, по слухам, поддерживается китайским квантовым хедж-фондом, и его успех может объясняться доступом к специализированным финансовым данным и глубокой кастомизацией — это логичное продолжение эволюции дата-ориентированных компаний.
Grok же демонстрирует противоположный подход: сильная универсальная модель, способная самостоятельно ориентироваться на рынке без узкоспециализированных настроек. Если это подтвердится, индустрию может ждать серьёзный сдвиг.
Сторонники алгоритмической торговли на базе ИИ считают, что способность языковых моделей быстро обрабатывать огромные объёмы неструктурированных данных, таких как новости и соцсети, открывает новый горизонт для финансовых рынков. Они верят, что ИИ способен находить уникальные источники альфы и сделать сложную рыночную аналитику доступной для всех.
Но катастрофические убытки моделей вроде Gemini поднимают серьёзные вопросы о рисках, которые сдерживают интерес со стороны крупных игроков. Одна из ключевых проблем — «чёрный ящик». Зачастую невозможно понять, почему модель приняла то или иное торговое решение. Такая непрозрачность — серьёзное препятствие как для соответствия нормативам, так и для управления рисками. Доверие к действиям модели — процесс, который требует постоянного контроля и верификации.
Кроме того, есть более глубокие сомнения в надёжности таких систем. LLM-модели склонны к «галлюцинациям». Они могут генерировать правдоподобную, но полностью вымышленную информацию. А в условиях реального рынка это может привести к фатальным ошибкам.
Читайте также: Основатель Solana представил Percolator — новую биржу в ответ Aster и Hyperliquid
Есть и системные риски. В исследовании 2024 года, посвящённом использованию ИИ в финансах, указывается на новую угрозу: если множество «независимых» ИИ-агентов работают на одних и тех же базовых моделях, они могут реагировать на события синхронно. Это создаёт эффект цепной реакции и может усилить рыночную волатильность или даже спровоцировать неожиданные падения.
Хаотичная торговля модели Gemini 2.5 Pro в рамках Alpha Arena стала наглядной иллюстрацией всех рисков. По сообщениям, ИИ часто менял направление — то делал ставку на падение, то резко переходил в лонг, теряя при этом значительные суммы. Такой нестабильный стиль торговли подчёркивает, почему финансовая индустрия, находящаяся под строгим регулированием, относится к этим технологиям с опаской.
Пока что Уолл-стрит сохраняет осторожную позицию. Хотя в свежем отчёте Gilbert + Tobin говорится, что в ближайшие два года нас может ждать волна внедрения ИИ, текущие сценарии использования всё ещё сводятся к безопасным задачам с активным участием человека.