ISSN: 2169-0111
Цзи-Ган Чжан, Цзянь Ли, Вэньлун Тан и Хун-Вэнь Дэн
Обычно наблюдается, что между генами существуют сильные статистические взаимодействия, связанные с заболеваниями, важными для общественного здравоохранения. Взаимодействие генов может потенциально способствовать повышению точности классификации заболеваний. Особенно, когда экспрессия генов различается в разных классах недостаточно, важнее использовать взаимодействие генов для анализа классификации заболеваний. Однако большинство алгоритмов отбора генов в анализе классификации просто фокусируются на генах, уровни экспрессии которых показывают различия в разных классах, и игнорируют дискриминационную информацию от взаимодействия генов. В этом исследовании мы разрабатываем двухэтапный алгоритм, который может учитывать взаимодействие генов во время процедуры отбора генов. Его самое большое преимущество заключается в том, что он может использовать дискриминационную
информацию от взаимодействия генов, а также различия в экспрессии генов, используя «ошибку Байеса» в качестве критерия отбора генов. Используя смоделированные и реальные наборы данных микрочипов, мы демонстрируем способность взаимодействия генов повышать точность классификации и представляем, что предлагаемый алгоритм может выдавать небольшие информативные наборы генов, приводя к высокоточным результатам классификации. Таким образом, наше исследование может дать новый взгляд на будущие алгоритмы отбора генов для дискриминации заболеваний человека.