Цена доставки диссертации от 500 рублей 

Поиск:

Каталог / БИОЛОГИЧЕСКИЕ НАУКИ / Биоинформатика

Динамика экспрессии генов сегментации у дрозофилы

Диссертация

Автор: Самсонова, Мария Георгиевна

Заглавие: Динамика экспрессии генов сегментации у дрозофилы

Справка об оригинале: Самсонова, Мария Георгиевна. Динамика экспрессии генов сегментации у дрозофилы : диссертация ... доктора биологических наук : 03.00.28 / Самсонова Мария Георгиевна; [Место защиты: Институт цитологии и генетики Сибирского отделения РАН] Новосибирск, 2008 136 c. :

Физическое описание: 136 стр.

Выходные данные: Новосибирск, 2008






Содержание:

Введение
1 Современные представления о детерминации сегментов у дрозофилы Обзор литературы
11 Эмбриогенез дрозофилы
12 Сеть генов сегментации
13 Об использовании мутантов для анализа регуляторных взаимодействий
2 Материал и методы
21 Материал
22 Методы обработки цифровых изображений
23 Извлечение характерных признаков из одномерных картин экспрессии
231 Сплайновая аппроксимация
232 Быстрое избыточное двоичное вейвлет-преобразование
24 Обобщение метода SVM на случай регрессионного оценивания
25 Метод генных сетей
251 Базовая концепция модели
252 Уравнения модели
253 Оптимизация параллельным численным отжигом Лама
254 Биологический анализ генных сетей
26 Базы данных
261 Реляционная модель данных и реляционные СУБД
262 Информационные технологии создания интерфейсов
3 Метод получения количественных данных по экспрессии генов сегментации
31 Сегментация изображений
311 Приведение изображений в стандартную ориентацию
31/2 Построение гладкой маски эмбриона
313 Получение количественных данных
32 Удаление фонового сигнала
321 Определение неэкснрессируюгцих областей
322 Выделение опорных точек
323 Аппроксимация фонового сигнала
324 Удаление фона
325 Особые случаи
326 Оценка точности метода
33 Определение возраста эмбриона
331 Формирование обучающей выборки эмбрионов
332 Предсказание возраста эмбрионов
34 Регистрация картин экспрессии генов у эмбрионов
341 Аффинное преобразование
342 Оценка точности метода регистрации
35 Конструирование интегрированных картин экспрессии генов сегментации
4 Динамическая природа позиционной информации
41 Концепция позиционной информации
42 Градиенты морфогенов
43 Модель "французского флага"
44 Сдвиги областей экспрессии генов сегментации
45 Динамическая позиционная информация
5 Регуляторные взаимодействия в сети генов gap
51 Анализ регуляторных механизмов, контролирующих экспрессию генов gap
511 In silico реконструкция сети генов gap
52 Анализ полученных генных сетей
521 Анализ коэффициентов матрицы регуляторных взаимодействий
522 Графический анализ регуляции в системе генов gap
523 Пять базовых регуляторных механизмов позиционирования областей экспрессии генов gap
53 Механизм сдвига границ областей экспрессии генов gapIll
6 Создание атласа экспрессии генов сегментации во времени и пространстве
61 Модель данных
62 Архитектура системы
621 Java-серверы приложений
622 Визуализация количественных и преобразованных данных
623 Визуализация динамики экспрессии генов
63 Объем данных
64 Ве&-интерфейс
65 Практическое использование FlyEx

Введение:
За последние 25 лет биология развития добилась впечатляющих успехов. Применение генетических методов, а также методов функциональной геномики позволило клонировать большое количество генов, регулирующих процессы развития, выделить их продукты - РНК и белки и проанализировать функции всех этих молекул. Однако, несмотря на огромный объем полученной информации, картина того, каким образом гены контролируют фенотипы тканей, органов и, как следствие, развитие всего организма, до сих пор отсутствует.
Причинная связь между генотипом и фенотипом является сложной. Дело в том, что любая система (ткань, орган и т.н.) формируется в результате процессов и регуляторных механизмов, действующих на разных уровнях организации (от молекулярного до организменного). В каждом из этих процессов участвует большое число гетерогенных компонент (генов, белков, разных типов клеток и т.д.), которые вступают друг с другом в сложные взаимодействия, причём наличие ансамбля взаимодействующих компонент характерно для каждого уровня организации. На результаты таких взаимодействий (часто называемых "новыми сущностями "или "свойствами ансамбля") на любом уровне организации могут сильно влиять гетерогенность состава и взаимодействия биологических компонент на более низком и/или высоком уровнях организации.
Экспериментальная биология еще недавно была нацелена, главным образом, на изучение структуры и функции отдельных биологических компонент. Необходимость анализа свойств ансамблей, их синергии, а также гетерогенность биологических компонент, входящих в ансамбли на каждом уровне организации, требуют привлечения принципиально иных методов исследования. В последние годы в биологии развивается новое направление - системная биология, целью которой является получение информации о биологическом объекте как о системе взаимодействующих компонент и процессов. О важности системного подхода в современной молекулярной биологии можно судить но ряду детальных обзоров и коллективных монографий, см. например (Ратушный et al., 2005; Kolchanov and Hofestadt, 2005; Kitano, 2002).
Фундаментальным понятием биологин развития является морфогенетическое поле - совокупность клеток, в результате взаимодействия которых формируется орган. Эти взаимодействия приводят к тому, что каждая клетка поля становится детерминированной, выбирая один из многих возможных путей развития, а также занимает определенное положение относительно одной или нескольких точек формирующейся системы. Современные экспериментальные технологии позволяют регистрировать компоненты морфогенетических полей, однако чрезвычайная сложность процессов развития, протекающих в этих полях, требует применения, помимо молекулярно-биологических методов, новых подходов, использующих математическое моделирование, теорию вероятности и статистику, теорию распознавания образов, теорию оптимального управления и вычислительные методы.
В данной работе системный биологический подход применяется для изучения механизмов детерминации сегментов в раннем эмбриогенезе плодовой мушки Drosophila melanogaster.
Актуальность работы. Несмотря на большой объем информации о регуля-торных взаимодействиях генов сегментации (Akam, 1987; Ingham, 1988; Корочкин, 2002), знания о механизмах регуляции этих генов, и в особенности, о механизмах экспрессии генов gap, являются далеко не полными. Это, с одной стороны объясняется неполнотой экспериментальных данных о регуляторных взаимодействиях, с другой - методологическими трудностями, которые возникают, когда вывод о регуляторном взаимодействии у многоклеточного организма делается на основе качественного анализа экспрессии гена у мутантов. Кратко эти трудности можно обозначить как проблемы непротиворечивости, уникальности и полноты предполагаемого регуляторного механизма.
Для доказательства непротиворечивости гипотетического регуляторного механизма требуется учет вклада всех регуляторов исследуемого гена. Современные экспериментальные методы, однако, имеют ограниченную возможность одновременного анализа влияния всех регуляторов на данный ген, поскольку они основаны на анализе картин экспрессии у мутантов, а получение организмов с мутациями более чем в трех регуляторах часто является непростой задачей. Более того, генная сеть у мутантов по определению состоит из неполного, или дефектного набора регуляторных взаимодействий генов. Таким образом, выводы о структуре генной сети дикого типа приходится делать на основании данных многих экспериментов с мутантами. Непротиворечивость же выявленных взаимодействий может быть продемонстрирована только при проверке их в интактном развивающимся организме, содержащем полный набор регуляторов.
Другая проблема, возникающая при интерпретации картин экспрессии у мутантов состоит в доказательстве уникальности механизма взаимодействия, т.е. доказательстве того, что данное регуляторное взаимодействие является прямым, а не опосредованным. Такие доказательства требуют проведения дополнительных экспериментов.
И наконец, существует фундаментальная проблема демонстрации полноты выявленных регуляторных взаимодействий. Действительно, необходимость материнских генов и генов gap - физических компонент морфогенетического поля сегментации - для правильной экспрессии генов gap не означает достаточности этого набора генов. В принципе доказательство достаточности выявленного регулятор-ного механизма невозможно без реконструкции системы ab initio из отдельных, хорошо контролируемых компонентов. Очевидно, что современные экспериментальные методы не позволяют провести такую реконструкцию, и, следовательно, она должна быть проведена in silico с помощью математического моделирования и численных расчетов (Ратушиый et al., 2005).
Другой вопрос, один из самых важных в эмбриологии, состоит в выяснении механизма детерминации клеток и частей зародыша. В основе этого механизма лежит активация тех или иных генов в разных клетках, что приводит к возникновению пространственно неоднородной картины экспрессии генов ("узора"или так называемого паттерна). У дрозофилы детерминация сегментов определяет положение парасегментпых, а не сегментных границ. Образование иарасегмен-тов предшествует формированию сегментов на более поздних стадиях развития. В морфогенетическом поле сегментации сегментный препаттерн образуют полосы экспрессии генов segment-polarity (Lawrence and Johnston, 1989; Martinez-Arias and Lawrence, 1985; Ingham and Martinez-Arias, 1992; Жимулев, 2003).
Классическое объяснение механизмов детерминации было предложено в 1969 году Л.Волпертом, сформулировавшим теорию позиционной информации (Wolpert, 1969; Wolpert, 1989). Согласно этой теории судьба клетки определяется ее положением в определенном пространственном поле зародыша, в котором существует градиент концентрации некой сигнальной молекулы, называемой морфогеном. Считывание информации о градиенте морфогена и ее интерпретация приводят к дифференциации клеток в том или ином направлении в зависимости от уровня концентрации морфогена.
У дрозофилы продукт материнского координатного гена bed является классическим примером морфогена (Driever and Niissleiii-Volhard, 1988b; Driever and Nusslein-Volhard, 1988a; Ephrnssi and St Johnston, 2004). Проведенные в последнее время генетические и теоретические исследования указывают на то, что действие одного лишь морфогена Bed недостаточно для возникновения прострвнственно неооднородной картины экспрессии генов в бластодерме дрозофилы. В нашей работе исследована динамика позиционирования областей экспрессии генов сегментации, и на основе полученных данных обсуждается адекватность концептуальной модели Л.Волперта для объяснения механизмов формирования сегментного пре-паттерна в бластодерме дрозофилы.
Понимание принципов организации и функционирования морфогепетического поля сегментации требует детального количественного описания динамики каждой из его компонент. Несмотря па высокую разрешающую способность, метод ДНК чипов так же, как и многие другие методы количественной оценки экспрессии генов (количественный PCR, CAT assays), имеет ограниченное применение для решения этой задачи. Дело в том, что все эти методы используют гомогенаты клеток и, таким образом, теряют информацию об экспрессии генов в пространстве. Перспективным является использование иммунофлуоресцентного маркирования биологических макромолекул в сочетании с лазерной конфокальной микроскопией, которая позволяет получать качественные цифровые изображения картин экспрессии генов, готовые для извлечения количественных данных об экспрессии путем компьютерной обработки.
Очевидно, что качество математического моделирования зависит от качества экспериментальных данных. Как было отмечено Х.Китано (Kitano, 2002) идеальный набор данных должен быть исчерпывающим по полноте оцениваемых компонент, измеряемых параметров и по охвату временной динамики, точным в количественном отношении, а также систематическим. Последнее означает, что способ получения данных разных типов должен допускать их согласованную интеграцию. Хотя эти требования очевидны, в настоящее время лишь немногие наборы данных им удовлетворяют и, поэтому, получение такого набора данных по экспрессии генов сегментации имеет важное значение.
Эффективное использование количественных данных но экспрессии генов сегментации требует организации набора данных в виде базы данных, что обеспечит эффективное хранение и выборку информации, а также облегчит анализ данных, нацеленный на выявление новых биологических закономерностей изучаемого процесса и формулировку новых гипотез для их направленной проверки в экспериментах. Отметим, что по своей сути такая база данных будет пространственно-временным атласом экспрессии генов, поскольку она хранит количественную информацию по экспрессии в разных точках морфогепетического ноля и в разные моменты времени.
Цель и задачи исследования состояли в том, чтобы проверить достаточность материнских градиентов Bed, Hb и Cad для правильного позиционирования областей экспрессии генов gap и выяснить роль взаимной репрессии генов gap в этом процессе. Конкретные задачи исследования состояли в следующем:
1. Разработать новый конвейерный метод количественной оценки уровня экспрессии главных компонент морфогенетического поля сегментации у дрозофилы - генов сегментации - на основе изображений, полученных с помощью конфокальных микроскопов. Этот метод должен включать сегментацию изображений, удаление фонового сигнала, определение возраста эмбриона, пространственную регистрацию картин экспрессии и интеграцию данных.
2. Получить исчерпывающий по полноте, точный в количественном отношении и систематический набор количественных данных об экспрессии генов сегментации в каждом ядре каждого индивидуального эмбриона, а также эталонные, интегрированные данные об экспрессии каждого из 14 генов сегментации в каждой области эмбриона в разные моменты времени;
3. Изучить динамику формирования областей экспрессии генов в морфогенети-ческом поле сегментации путем оценки положения каждой области в разные моменты времени;
4. Создать математическую модель механизмов регуляции экспрессии генов gap в цикле деления ядер 14А. Примененить эту модель для in silico реконструкции сети генов gap и выявления механизмов, обеспечивающих сдвиги границ областей экспрессии этих генов;
5. Для облегчения работы теоретиков и биологов с данными создать пространственно-временной атлас экспрессии генов сегментации в виде реляционной базы данных, доступной в сети Интернет.
Научная новизна работы. В настоящей работе впервые
• разработай конвейерный метод получения количественных данных по экспрессии генов сегментации из конфокальных изображений картин экспрессии этпх генов. Метод включает 5 процедур, а именно, сегментацию изображений, удаление фонового сигнала, определение возраста эмбриона, пространственную регистрацию картин экспрессии и интеграцию данных, которые можно применять последовательно и по отдельности;
• получен полный, точный и систематический набор количественных данных об экспрессии генов сегментации в каждом ядре каждого из 1580 индивидуальных эмбрионов, а также интегрированные данные об экспрессии каждого из 14 генов сегментации;
• показано, что области экспрессии генов сегментации, локализованные в будущей зародышевой полоске, по мере своего формирования в цикле 14А смещаются к переднему полюсу эмбриона;
• предложена математическая модель для предсказания механизмов регуляции экспрессии генов gap в цикле 14А, правильно воспроизводящая временную динамику экспрессии этих генов, степень перекрывания соседних областей экспрессии, а также воспроизводящая сдвиги границ областей экспрессии генов gap в ходе цикла 14А;
• исследованы механизмы сдвигов центральной области экспрессии Кг, а также задних областей экспрессии kni, gt и hb по направлению к переднему концу эмбриона;
• создан пространственно-временной атлас экспрессии генов сегментации в виде реляционной базы данных FlyEx, доступной по сети Интернет.
Основные положения, выносимые на защиту. На защиту выносятся
1. Компьютерная обработка цифровых изображений картин экспрессии генов, полученных с помощью конфокального микроскопа и нммунофлуоресцент-ного маркирования биологических макромолекул, может быть использована для получения количественных данных по экспрессии генов in situ.
2. Количественное описание пространственно-временной динамики компонент морфогенетического поля сегментации необходимо для понимания механизмов его функционирования.
3. Сдвиги областей экспрессии генов сегментации важны для позиционирования областей экспрессии генов-мишеней и играют важную роль в формировании сегментного препаттерна.
4. Материнские гены bed, cad и гены gap Кг, kni, gt, hb, til не только необходимы, но и достаточны для правильной экспрессии генов gap в будущей зародышевой полоске.
5. Позиционная информация в бластодерме дрозофилы задается динамически меняющейся во времени комбинацией концентраций продуктов материнских и зиготических генов. В каждый момент времени эта комбинация определяется не только материнскими морфогенами, но и сдвигами границ областей экспрессии генов сегментации из-за регуляторных взаимодействий. Это толкование подразумевает активный, а не пассивный способ интерпретации градиента морфогена и размывает границу между формированием и интерпретацией позицнонрюй информации.
Практическое значение работы. Научно-практическая значимость работы состоит в том, что в ней впервые разработан и успешно применен метод конвейерной обработки картин экспрессии генов сегментации с целью получения количественных данных по экспрессии генов. Метод был успешно адаптирован для обработки данных по экспрессии генов сегментации на уровне мРНК (Janssens et al., 2006), для обработки оптических срезов изображений картин экспрессии генов в ядрах эмбриона дрозофилы, а также для маскирования экспрессирующих областей и получения количествешшх данных по экспрессии генов в раннем развитии коралла Acropora millepora и морского анемона Nematostella vectensis (Kozlov et al., 2007). Все это позволяет считать разработанный метод важным инструментом извлечения количественной информации из изображений картин экспрессии генов. Отметим также, что в силу универсальности большинства процедур разработанный метод может с небольшими модификациями применяться для обработки широкого спектра биологических изображений и, таким образом, представляет интерес для широкого круга ученых в области молекулярной биологии.
В качестве одной из процедур конвейерного метода предложен новый метод определения возраста эмбриона в цикле развития 14А, основанный на анализе динамичных картин экспрессии гена eve, окрашенного у всех эмбрионов, и стандартизации этих картин экспрессии относительно возраста эмбриона, определенного в эксперименте. Этот метод позволяет автоматизировать процедуру предсказания возраста, делает ненужршм трудоемкое определение возраста экспериментальным путем и, таким образом, является важным усовершенствованием метода определения возраста эмбриона дрозофилы в раннем эмбриогенезе.
Количественные данные по экспрессии генов сегментации, полученные в данной работе, уникальны по охвату временной динамики, точны, имеют клеточное разрешение и получены в результате систематических и масштабных экспериментов, проводимых в одной лаборатории и с использованием одних и тех же стандартизованных методов. Эта особенность сделала полученные данные исключительно востребованными мировым сообществом, использующим их как в теоретических исследованиях, так и для изучения механизмов сегментации, см. например, Holloway et al., 2003; Pereanu and Hartenstein, 2004; Diambra and da Costa, 2005; Aegerter-Wilmsen et al., 2005; Isalan et al., 2005; Ludwig et al., 2005; Holloway et al., 2006; Krishna ct al., 2005; Ochoa-Espinosa et al., 2005; Perkins et al., 2006; Yucel and Small, 2006; Zinzen and Papatsenko, 2007; Bergmann et al., 2007.
Созданный пространственно-временной атлас экспрессии генов сегментации FlyEx является открытым ресурсом, широко используемым мировым сообществом биологов и биоинформатиков. Так например, в 2006 году общее количество обращений к FlyEx составило более  260000 .
В работе исследуется центральный вопрос эмбриологии - механизмы детерминации клеток и частей зародыша в морфогенетических полях. Помимо этого, выполненные исследования имеют важное значение для лучшего понимания медицинских аспектов развития, а совокупность разработанных методов и моделей формирует, в конечном итоге, методологическую базу для реконструкции генной сети организма при отсутствии или ограниченном использовании мутагенеза.
С использованием материалов диссертации автором сделано 2 приглашенных доклада в Lawrence Berkeley National Laboratory, USA (2002 и 2006 гг.), доклад на Московском семинаре но биоинформатике (2006), приглашенные доклады в 2003 г. в Genetics Department, Cambridge University (UK) и в Bioinformatics Research Centre, University of Glasgow (UK), приглашенные доклады в 2005 г. на Bioinformatics Colloquium, Georg-August-Universitat Gottingen (Germany) и на Waterman Seminars, the Leibniz Institute of Plant Genetics and Crop Plant Research (IPK, Germany), приглашенный доклад в Laurence H. Baker Center for Bioinforraatics and Biological Statistics Seminar Series, Iowa University, USA (2001), а также 2 приглашенных лекции на the Les Houches Summer School "Multiple Aspects of DNA and RNA: from biophysics to bioinformatics"(2004). Также сделаны 3 приглашенных доклада на семинарах Dagstuhl: 3d Dagstuhl Seminar for Information and Simulation Systems for the Analysis of Gene Regulation and Metabolic Pathways (2001); Dagstuhl Seminar 04281 "Integrative Bioinformatics - Aspects of the Virtual Cell (2004), Dagstuhl Seminar 03051, "Information and Process Integration: A Life Science Perspective" (2003) и многих других семинарах. Сделан также доклад на семинаре, организованном фирмой Leica, "Современные конфокальные микроскопы фирмы Leica и их применение в биологии" (Санкт-Петербург,2006).
Кроме того результаты работы обсуждались на Санкт-Петербургском семинаре по компьютерной биологии, на семинарах кафедр эмбриологии и генетики Санкт-Петербургского государственного университета и были включены в лекцию на Международной школе-семинаре BGRS "Эволюция, системная биология и суперкомиьютерные вычисления в биоинформатике "в 2005 г. (Новосибирск, Россия).
Публикации. По материалам диссертации опубликовано 45 научных работ (все в соавторстве), в том числе 23 статьи в реферируемых научных журналах.
Структура диссертационной работы. Диссертация состоит из введения, 7 глав, выводов и библиографии (229 наименований). Ее полный объем составляет 165 страниц, количество рисунков 44.