Как разработчики ИИ-агентов превращают мировую экономику в тренажер для своих моделей.
Ведущие разработчики искусственного интеллекта вроде OpenAI и Anthropic вступили в гонку по созданию автономных ИИ-агентов для офисной работы, пишет The Information. На фоне заявлений Дженсена Хуанга о трансформации IT-департаментов в «HR для нейросетей» это направление становится ключевым трендом индустрии.
ForkLog разобрался, как технологии больших языковых моделей (LLM) адаптируют для выполнения задач корпоративных сотрудников.
Традиционно ИИ обучается в два шага: сначала модель поглощает огромные объемы информации, а затем проходит тонкую настройку для специализации.
Однако для выполнения офисных задач этого недостаточно. Модели необходимо научить взаимодействовать с приложениями, как человек, — то есть совершать целенаправленные действия в цифровой среде, понимая причинно-следственные связи.
Именно разрыв между простым «знанием» и «умением делать» привел к появлению новой школы для искусственного интеллекта. Если раньше модель училась на статических данных, то теперь ее отправляют на «стажировку» в виртуальные копии реальных офисных приложений.
По-другому их называют RL-средами. Они представляют собой симуляции популярных сервисов вроде Salesforce, LinkedIn или Gmail, где модель экспериментирует, получает обратную связь и улучшает навыки.
RL-среды напоминают симулятор полетов, но для ИИ-агентов. Их созданием уже занимаются ведущие лаборатории. Turing стал одним из первых стартапов, который разработал свыше 1000 виртуальных тренажеров — от клонов Airbnb и Zendesk до таблиц Microsoft Excel. Проект предлагает свои инструменты в том числе и OpenAI. В июне 2025 года он привлек инвестиции на $111 млн.
Вслед за ним на рынок вышли и другие стартапы. Так, площадка Scale получила $14 млрд от Meta, а ее конкурент Surge ведет переговоры о финансировании на $1 млрд.
«Тренировочный день» у ИИ-агента проходит примерно так:
Главное преимущество — масштаб и безопасность. ИИ-агент может часами повторять итерации одной и той же задачи, доводя действия до автоматизма. При этом он не заспамит реальных клиентов, не сломает базу данных и не удалит критически важную информацию.
Чтобы сделать процесс максимально эффективным, компании нанимают специалистов из различных областей — от биологии до программирования и медицины. Они демонстрируют ИИ, как правильно использовать рабочие инструменты. Модель запоминает не только шаги, но и логику принятия решений экспертом.
По мере прогресса требования ужесточаются. На первых этапах хватало знаний студентов, но теперь лаборатории привлекают профессионалов из корпораций вроде NASA и других государственных проектов.
Спрос взвинчивает цены. По данным фирмы Labelbox, которая поставляет специалистов OpenAI и другим гигантам, около 20% ее подрядчиков получает больше $90 в час, а почти 10% — свыше $120. Ожидается, что в ближайшие полтора года расценки для топовых экспертов взлетят до $150–250.
OpenAI планирует потратить на оплату экспертов и RL-среды около $1 млрд в 2025 году и $8 млрд — к 2030. Anthropic, по слухам, может направить до $1 млрд в течение следующего года только на создание и использование виртуальных приложений.
Можно было бы предположить, что Anthropic и OpenAI вкладывают миллиарды в симуляторы и экспертов просто для того, чтобы их модели стали чуть умнее. Однако реальная цель масштабнее — речь идет о преодолении потолка возможностей современных ИИ и создании новой бизнес-модели.
Во-первых, основанные на прогнозировании следующего слова в интернет-текстах методы обучения LLM себя исчерпывают. RL-среды — качественно иной путь. Он позволяет ИИ не просто генерировать текст, а действовать в рамках сложных, многошаговых процессов, что является ключом к реальной автономии.
По словам CEO Surge Эдвина Чена, методы Anthropic и OpenAI «зеркалят то, как учатся люди», помещая модели искусственного интеллекта в условия, максимально приближенные к реальному миру.
Но главное — RL-среды привлекают возможностью монетизации. Для ИИ-гигантов продажа API-доступа к чат-боту — лишь первый шаг. Следующая, гораздо более ценная бизнес-модель — сдача «виртуальных сотрудников» в аренду. Получается, что в новой гибридной реальности агенты искусственного интеллекта будут преимущественно обрабатывать данные и выполнять административные задачи.
С одной стороны, такой сдвиг вызывает энтузиазм по поводу беспрецедентного роста производительности и качества выполнения рутинных операций. С другой — понятную тревогу о замещении рабочих мест.
В Startup Magazine считают, что идеальная модель гибридной работы строится не на замене, а на усилении человеческих возможностей. В качестве примера эксперты привели пример работы службы поддержки:
Эксперты также отметили, что успех внедрения будет зависеть от подхода компании. Для этого лидерам необходимо сосредоточиться на настроении сотрудников, инвестициях в переобучение и экспериментах.
Стратегия крупных компаний, делающих ставку на ИИ-агентов, косвенно подтверждает такую идею. Их цель — не заменить человека, а создать для него мощного партнера, который возьмет большую часть повседневных задач на себя.
К тому же, как показывают исследования, стремительное развитие искусственного интеллекта не оказало существенного влияния на рынок труда.
Видение будущего, которое обсуждают в кулуарах OpenAI, еще смелее. Как пишет The Information, один из старших исполнительных директоров компании приватно заявил, что ожидает превращения «всей экономики» в одну большую «RL-машину».
Это означает, что в будущем ИИ будет учиться не на искусственных симуляциях, а реальных записях рабочих процессов профессионалов по всему миру: как врач ставит диагноз в медицинской системе, логист оптимизирует цепочки поставок, а юрист составляет контракт.