Платформа Google DeepMind анонсировала AlphaGenome — модель искусственного интеллекта, которая наконец-то может расшифровать загадочную «мусорную ДНК». Та самая часть генома, которая составляет более 90% всей нашей наследственной информации, но долгие годы считалась бесполезным хламом. Оказывается, этот «хлам» управляет всем шоу. Когда мусор становится сокровищем Долгое время ученые фокусировались только на тех участках ДНК, которые напрямую… Сообщение Google научила ИИ читать «мусорную ДНК» — это меняет медицину навсегда появились сначала на Hash Telegraph.
Платформа Google DeepMind анонсировала AlphaGenome — модель искусственного интеллекта, которая наконец-то может расшифровать загадочную «мусорную ДНК». Та самая часть генома, которая составляет более 90% всей нашей наследственной информации, но долгие годы считалась бесполезным хламом.
Оказывается, этот «хлам» управляет всем шоу.
Долгое время ученые фокусировались только на тех участках ДНК, которые напрямую кодируют белки — строительные блоки нашего организма. Это понятно: читать инструкции по сборке проще, чем разбираться в пульте управления. Но вся остальная ДНК — те самые 90% — работает именно как пульт управления. Она решает, когда включить или выключить гены, где и в каком количестве.
Проблема в том, что этот пульт написан на языке, который мы толком не понимали. До сих пор.
AlphaGenome — это первая модель ИИ, способная обрабатывать участки ДНК длиной до миллиона пар оснований одновременно. Для сравнения: предыдущие модели работали с короткими фрагментами, словно пытались понять симфонию, слушая отдельные ноты.
С технической точки зрения AlphaGenome построена на архитектуре U-Net с трансформером и содержит «всего» 450 млн параметров. Да, это смешно мало по сравнению с языковыми моделями, которые оперируют миллиардами параметров. Но учтите: ДНК оперирует всего четырьмя основаниями — A, T, C, G. Весь человеческий геном — это 3 млрд пар этих букв. Модель заточена под одну конкретную задачу и выполняет ее блестяще.
Система работает как многоуровневый переводчик: сначала кодирует последовательность ДНК, затем трансформер анализирует дальние связи между участками, а декодер восстанавливает результат обратно до уровня отдельных оснований. Это позволяет делать прогнозы с различным разрешением — от детального анализа отдельных мутаций до общей картины регуляции генов.
AlphaGenome превзошла существующие модели в 46 из 50 тестов на предсказание регуляторных функций и влияния генетических вариантов. Такие «чистые победы» в области биоинформатики случаются редко — обычно улучшения измеряются процентами.
Модель может предсказать, как мутация повлияет на работу генов, за считанные секунды. Раньше такой анализ требовал недель лабораторных экспериментов. Более того, она способна моделировать экспрессию генов, события сплайсинга, состояния хроматина и даже трехмерную структуру генома.
Обучение модели заняло всего четыре часа на специальных процессорах Google TPU, используя вдвое меньше вычислительных ресурсов, чем ее предшественник Enformer. При этом AlphaGenome обучалась на огромном массиве публичных данных — ENCODE, GTEx, 4D Nucleome и FANTOM5, которые включают тысячи экспериментальных профилей различных типов клеток человека и мыши.
Самое важное — Google DeepMind сделала AlphaGenome доступной для исследователей через API для некоммерческих исследований. Компания также разместила обширную документацию и поддержку сообщества на GitHub. Это кардинально меняет ситуацию в геномике, которая долгое время была закрыта в специализированных лабораториях с дорогостоящими базами данных.
Да, модель пока не полностью открыта — исследователи не могут скачать и запустить ее локально. Но API и сопутствующие ресурсы на GitHub позволяют ученым по всему миру генерировать прогнозы, адаптировать анализы для различных видов или типов клеток. DeepMind обещает более широкий открытый релиз в будущем.
Возможность анализировать некодирующие варианты ДНК — именно там находится большинство мутаций, связанных с заболеваниями — открывает новые горизонты в понимании генетических расстройств и редких болезней. Высокоскоростной анализ вариантов также поддерживает персонализированную медицину, где лечение подбирается под уникальный генетический профиль пациента.
AlphaGenome входит в растущую экосистему ИИ-инструментов для биологии. Модель Ankh от университетов Мюнхена и Колумбии обрабатывает белковые последовательности как язык, создавая новые белки. GenSLMs от Nvidia прогнозирует вирусные мутации для исследований пандемий. ИИ уже помогает в разработке химических и генных методов борьбы со старением.
Некодирующий геном больше не черный ящик, а роль ИИ в геномике будет только расширяться. AlphaGenome может и не приведет нас к «дивному новому миру» Хаксли, но четко указывает направление: больше данных, лучшие прогнозы и более глубокое понимание механизмов жизни.
Самые интересные и важные новости на нашем канале в Telegram
Сообщение Google научила ИИ читать «мусорную ДНК» — это меняет медицину навсегда появились сначала на Hash Telegraph.