Журнал гликомики и липидомики

Журнал гликомики и липидомики
Открытый доступ

ISSN: 2153-0637

Абстрактный

Выявление клинически полезных геномных и эпигеномных вариантов

Сюн Момяо

Технологии секвенирования следующего поколения будут генерировать беспрецедентно массивные (тысячи или даже десятки тысяч индивидуумов) и высокоразмерные (до сотен миллионов) данные геномных и эпигеномных вариаций. Фундаментальный вопрос заключается в том, как эффективно извлекать геномную и эпигеномную информацию клинической значимости. Традиционная парадигма для определения вариантов клинической валидности заключается в проверке ассоциации вариантов. Однако значительно ассоциированные генетические варианты могут быть или не быть полезными для диагностики и прогнозирования заболеваний. Альтернативой исследованиям ассоциаций для поиска генетических вариантов предсказательной полезности является систематический поиск вариантов, которые содержат достаточную информацию для прогнозирования фенотипа. Чтобы достичь этого, мы вводим концепции достаточного сокращения размерности, которые проецируют исходные высокоразмерные данные в очень низкоразмерное пространство, сохраняя при этом всю информацию о фенотипах ответа. Затем мы формулируем клинически значимую проблему обнаружения генетических и эпигенетических вариантов в разреженную проблему SDR и разрабатываем алгоритмы, которые могут выбирать значимые генетические варианты из до или даже из десяти миллионов предикторов с помощью деления SDR для всего генома на ряд задач sub-SDR, определенных для геномных регионов. Разреженная SDR, в свою очередь, формулируется как разреженная проблема оптимальной оценки. Чтобы ускорить вычисления, мы применяем метод чередующегося направления для множителей для решения разреженной проблемы оптимальной оценки, который можно легко реализовать параллельно. Чтобы проиллюстрировать его применение, предлагаемый метод применяется к общему набору данных по раку TCGA.

Отказ от ответственности: Этот тезис был переведен с использованием инструментов искусственного интеллекта и еще не прошел рецензирование или проверку.
Top