ISSN: 1745-7580
Герман Нудельман, Юнчао Ге, Цзяньчжун Ху, Мадху Кумар, Джереми Сето, Джейми Л. Дюк, Стивен Х. Кляйнштейн, Фернан Хайо, Стюарт Си Силфон, Джеймс Дж. Ветмур
Предыстория: Генная корегуляция в популяции является важным аспектом значительной изменчивости иммунного ответа человека на вирусную инфекцию. Методология ее исследования должна опираться на ряд компонентов, начиная от кластеризации генов и заканчивая анализом обогащения факторов транскрипции. Результаты: Мы разработали методологию для исследования корреляций генов для экспрессии 34 генов, связанных с иммунным ответом обычных дендритных клеток (ДК), инфицированных вирусом болезни Ньюкасла (NDV) у 145 доноров-людей. Уровни экспрессии генов показали большую вариацию у разных людей. Мы создали карту генной коэкспрессии с использованием попарной корреляции и многомерного шкалирования (MDS). Анализ этих данных показал, что среди 13 генов, оставшихся после фильтрации статистически значимых вариаций, образуются два кластера. Мы исследовали, в какой степени наблюдаемые закономерности корреляции можно объяснить общими факторами транскрипции (TF), контролирующими эти гены. Наш анализ показал, что существует значительная положительная корреляция между расстояниями MDS и общими TF во всех парах генов. Мы применили анализ обогащения к ТФ, имеющим сайты связывания в промоторных областях этих генов. Этот анализ после фильтрации Gene Ontology указал на существование двух кластеров генов (CCL5, IFNA1, IFNA2, IFNB1) и (IKBKE, IL6, IRF7, MX1), которые транскрипционно корегулируются. Чтобы облегчить использование нашей методологии другими исследователями, мы также разработали интерактивный веб-инструмент для исследования корегуляции под названием CorEx. Он позволяет изучать МДС и иерархическую кластеризацию данных в сочетании с анализом обогащения ТФ. Мы также предлагаем веб-сервисы, которые предоставляют программный доступ к МДС, иерархической кластеризации и анализу обогащения ТФ. Выводы: Картирование МДС на основе корреляции в сочетании с анализом обогащения ТФ представляет собой полезный вычислительный метод для генерации прогнозов, лежащих в основе корегуляции генов в популяции.