Обсудим Новости науки

DId2

DId2

Бывалый
Команда форума
Супер Модератор
21:45
Регистрация
Ноя 16, 2024
Темы
31
Сообщения
2,868
Репутация
180
Реакции
6,046
Уровень
7
Награды
9

ДНК — не код и не чертёж. Учёные признали: главная метафора биологии биологии была ошибкой всё это время​


Только 2% генома человека кодирует белки. Остальные 98% — то, о чём наука до сих пор спорит.

ДНК десятилетиями называли чертежом жизни, но современная геномика всё хуже укладывается в эту удобную картинку. Последовательность из трёх миллиардов химических букв в человеческом геноме почти полностью расшифровали ещё в рамках международного проекта Human Genome Project, который шёл с 1990 по 2003 год. Ожидалось, что после этого биологи быстро поймут, как устроен человек на молекулярном уровне. Вместо ясной инструкции учёные получили систему, где одних букв ДНК недостаточно: важны форма хроматина, химические метки, пространственные петли, регуляторные участки, РНК-молекулы и сигналы из окружающей среды.
Главный сюрприз проекта оказался довольно неприятным. Только около 2% человеческого генома составляют участки, напрямую кодирующие белки. Белки строят и поддерживают клетку: работают ферментами, рецепторами, структурными элементами, переносчиками сигналов. Но большая часть ДНК не даёт прямых инструкций для сборки белков. Долгое время такие участки называли некодирующими, а иногда слишком грубо относили к бесполезной ДНК. Сейчас всё больше данных показывает, что именно за пределами классических генов прячется значительная часть управления.
Геном уже нельзя понимать как список генов с короткими пояснениями, где напротив каждого пункта написано, за что он отвечает. У человека около 20 тысяч белок-кодирующих генов, и многие из них есть не только у нас, но и у куда более простых организмов. Разница между клеткой кожи, нейроном, мышечной клеткой и клеткой печени возникает не потому, что внутри них лежат разные геномы. Материал почти один и тот же. Различается то, какие гены включены, какие молчат, в какой момент срабатывают и насколько сильно.
Классическая схема работы гена остаётся верной, но слишком короткой. Сначала фермент полимераза считывает участок ДНК и создаёт молекулу матричной РНК, или мРНК. Этот этап называют транскрипцией. Затем рибосома читает мРНК и собирает по ней белок. Этот процесс называют трансляцией. На учебной схеме всё выглядит прямолинейно: ДНК дала РНК, РНК дала белок. В живой клетке между этими шагами и вокруг них работает множество регуляторов, которые решают, когда начинать считывание, где остановиться, какую версию РНК оставить и дойдёт ли дело до белка.

Запуск транскрипции зависит от факторов транскрипции. Это белки, которые связываются с ДНК и помогают привлечь полимеразу к нужному гену. У бактерий подобная система часто устроена проще: сигнал включает или выключает конкретный ген, а белок-регулятор узнаёт свой участок ДНК довольно надёжно. У сложных организмов логика гораздо менее прямолинейна. Один фактор транскрипции может работать по-разному в разных клетках. В одном окружении он помогает включить ген, в другом подавляет активность. Всё зависит от соседних регуляторов, типа клетки, стадии развития и текущих сигналов.
Поэтому регуляция генов у человека больше похожа не на выключатель, а на решение, которое принимается после множества условий. Клетка учитывает не один сигнал, а сочетание нескольких: какие белки уже присутствуют, какой участок ДНК доступен, какие сигналы пришли от соседних клеток, какие химические метки стоят на хроматине. Такая логика даёт гибкость. Ген может работать слабее или сильнее, включаться только в конкретной ткани, реагировать на стресс, воспаление, развитие эмбриона или изменение среды.
Факторы транскрипции часто собираются на энхансерах. Энхансеры, или усилители транскрипции, представляют собой участки ДНК, которые помогают активировать гены. Простая схема быстро ломается, потому что энхансеров у человека намного больше, чем генов: счёт идёт на сотни тысяч, возможно на миллионы. Один ген может зависеть от множества энхансеров, а один энхансер может влиять на несколько генов. Биологи до сих пор не знают точного местоположения и роли всех таких участков.
Отдельная трудность связана с расстоянием. Некоторые энхансеры находятся рядом с геном или даже внутри него, но другие лежат далеко: между энхансером и целевым геном могут находиться миллионы нуклеотидов и другие гены. Нуклеотиды - это химические "буквы" или своеобразные пазлы, из которых складывается ДНК. Возникает простой вопрос: как удалённый регулятор передаёт сигнал нужному гену, а не соседним участкам? Один из ответов даёт трёхмерная форма генома.
В клетке ДНК не лежит ровной строкой. Она упакована вместе с белками в хроматин, который постоянно меняет форму. Когда клетка не делится, хроматин не похож на аккуратную X-образную хромосому из школьного учебника. Он развёрнут, изогнут, собран в петли и участки разной плотности. Дальние энхансеры могут оказаться рядом с нужным геном не по линейному расстоянию вдоль ДНК, а в пространстве. Хроматиновая петля сближает участки, которые на плоской карте генома находятся очень далеко.
В создании таких петель участвует белковый комплекс когезин. Его часто описывают как молекулярный мотор: он движется вдоль ДНК и вытягивает петлю, пока нужные участки не окажутся достаточно близко. Раньше можно было представить, что после сближения энхансер и ген образуют устойчивую молекулярную машину. Сейчас картина выглядит мягче и подвижнее. Регуляторные белки и участки ДНК скорее собираются во временные сгущения, или конденсаты, где компоненты взаимодействуют быстро, слабо и не всегда строго избирательно.
Транскрипционные узлы постоянно меняются. Даже две клетки одного типа в один и тот же момент могут немного по-разному раскладывать хроматин, формировать петли и собирать регуляторные комплексы. Поэтому геном нельзя описать только последовательностью букв. Нужно учитывать, как именно эта последовательность сложена в пространстве, какие участки открыты, какие спрятаны и какие молекулы находятся рядом.
Плотность упаковки тоже решает многое. В хроматине есть более плотные области, которые называют гетерохроматином. ДНК внутри таких участков хуже доступна для факторов транскрипции, а гены обычно молчат. Более рыхлые и открытые области называют эухроматином. Там регуляторным белкам проще добраться до ДНК, поэтому гены чаще доступны для считывания. Клетка постоянно перестраивает эту упаковку, открывая одни участки и закрывая другие.
Трёхмерная организация генома включает ещё один уровень - топологически ассоциированные домены, или ТАДы. Это области хроматина, внутри которых участки ДНК чаще контактируют друг с другом. Гены внутри одного домена могут включаться или выключаться согласованно, помогая клетке поддерживать нужный набор активных программ. Для разных типов клеток такие наборы различаются: кожа, мозг и мышца используют один и тот же геном, но выбирают разные группы генов.
На работу хроматина влияют эпигенетические метки. Это небольшие химические изменения на ДНК или на гистонах, белках, вокруг которых намотана ДНК. Некоторые метки меняют электрические свойства гистонов и заставляют хроматин упаковываться плотнее или свободнее. В результате один и тот же участок ДНК может оказаться доступным или закрытым. При делении клетки часть эпигенетических меток копируется, поэтому клеточная память передаётся дочерним клеткам. Но строгого и универсального эпигенетического кода пока нет: значение каждой метки зависит от места, времени и соседних сигналов.
Даже после появления мРНК регулирование не заканчивается. Клетка может решить, что белок по этой инструкции сейчас не нужен. В дело вступают некодирующие РНК. В отличие от матричной РНК, такие молекулы не служат шаблоном для сборки белка, но выполняют собственные задачи. Многие из них участвуют в управлении генами.
Один из примеров - микроРНК. Эти короткие молекулы могут направлять специальные ферменты к конкретной мРНК, чтобы разрушить её или химически изменить. После такого вмешательства рибосома уже не соберёт белок. МикроРНК тоже работают не по схеме один регулятор - одна цель. Одна микроРНК может влиять на многие мРНК, а одна мРНК может зависеть от нескольких микроРНК. Клетка получает дополнительный контрольный пункт: транскрипция уже прошла, но производство белка ещё можно остановить или ослабить.
Ещё один уровень появляется при сплайсинге. Свежая РНК после транскрипции содержит экзоны и интроны. Экзоны несут фрагменты будущей белковой инструкции, интроны нужно вырезать. Этой работой занимается сплайсосома, молекулярный комплекс из белков и некодирующих РНК. Сплайсосома вырезает интроны и соединяет экзоны, но может делать это по-разному в разных типах клеток.
Из-за альтернативного сплайсинга один и тот же ген способен давать разные версии белка, или изоформы. Иногда различия между ними сильно меняют функцию. Например, одна версия регуляторного белка может усиливать активность генов, а другая - подавлять. Поэтому даже знание исходной ДНК-последовательности и факта транскрипции не гарантирует понимания конечного результата. Нужно знать, как клетка обработала РНК после считывания.
Все эти уровни делают геном саморегулирующейся системой. Факторы транскрипции, некодирующие РНК, ферменты для изменения хроматина и другие участники регуляции сами кодируются или контролируются геномом. Получается петля: геном производит молекулы, которые затем меняют доступность и активность самого генома. При этом система учитывает прошлое состояние клетки, сигналы от соседей, условия среды и текущие потребности ткани.
Эволюция не строит систему с нуля по понятной схеме, а постоянно использует уже имеющиеся детали. С ростом сложности организмов клеткам понадобилось точнее выбирать, какие гены включать в разных тканях и на разных стадиях развития. Для этого геном накапливал всё больше регуляторных участков. Когда энхансеры уже не помещались рядом с нужными генами, всё важнее становились дальние контакты, петли хроматина и ТАДы.
Дополнительную нагрузку создали транспозоны - подвижные генетические элементы. Часть таких последовательностей пришла от паразитических вирусов и за время эволюции встроилась во многие места хромосом. Транспозоны умеют копировать себя и перемещаться по геному. Клеткам пришлось нарастить регуляторные барьеры, чтобы не превращать лишние или вредные РНК в белки и не давать опасным участкам мешать нормальной работе.
На этом фоне геномные модели искусственного интеллекта выглядят одновременно полезными и ограниченными. Evo 2, Genos, AlphaGenome и похожие системы обучают на больших массивах геномных данных. Биологи используют их, чтобы предсказывать, как изменения в ДНК могут повлиять на клеточные процессы, признаки организма или риск болезни. Внутри таких моделей связи между последовательностью и результатом извлекаются из известных примеров, а многие уровни регуляции остаются в чёрном ящике.
Для практических задач подход может дать много пользы. Модель способна находить закономерности, которые человек не заметит вручную, и быстро оценивать варианты мутаций. Но геном не работает как простая функция, где на вход подали последовательность, а на выходе получили точный признак. На результат влияют тип клетки, возраст, развитие организма, питание, среда, микробиом, культура, прошлые состояния тканей и физическая форма хроматина. Значительная часть нужной информации не записана в линейной последовательности ДНК.
Поэтому ИИ может помогать генетикам, но вряд ли заменит понимание принципов. Модель может предсказать связь, но не обязательно объяснить, почему регуляторный участок сработал именно в этой клетке и именно в такой момент. Чтобы разобраться в работе генома, биологам придётся объединять данные о последовательности ДНК, трёхмерной упаковке хроматина, эпигенетических метках, РНК-регуляции, внешних сигналах и истории клетки.
Геном не похож на чертёж здания и не работает как программа, которую процессор выполняет строка за строкой. Он ближе к чувствительной системе управления внутри клетки: воспринимает сигналы, перестраивает упаковку ДНК, меняет доступ к генам, исправляет ошибки, подавляет опасные элементы и подбирает нужные белки под контекст. У человеческих технологий нет прямого аналога такой системе, поэтому сравнения с кодом, компьютером и инструкцией помогают только на самом первом уровне.
Самый важный сдвиг в геномике как раз в этом. Последовательность ДНК остаётся основой наследственности, но сама по себе не объясняет, как из одного генома возникают разные клетки, ткани, реакции и болезни. Жизнь работает не только через текст генов, но и через способы чтения, пропуска, упаковки, редактирования и временного подавления этого текста. Именно эти слои сейчас мешают свести геном к простой инструкции и одновременно дают шанс понять, как клетка принимает решения на молекулярном уровне.

Источник
 

Создайте учетную запись или войдите в систему, чтобы комментировать

Вы должны быть участником, чтобы видеть весь контент и оставлять комментарии

Создать аккаунт

Создайте учетную запись в нашем сообществе. Это просто!

Авторизоваться

У вас уже есть учетная запись? Войдите в систему здесь.

Верх Низ