ISSN: 1745-7580
Чжилян Чен, Эндрю М. Коллинз, Ян Ван, Бруно Гаэта
Предыстория: Клональное расширение В-лимфоцитов в сочетании с соматической мутацией и селекцией антигенов позволяет гуморальной иммунной системе млекопитающих вырабатывать высокоспецифичные иммуноглобулины (ИГ) или антитела против вторгающихся бактерий, вирусов и токсинов. Доступность методов высокопроизводительного секвенирования ДНК открывает новые возможности для изучения этого клонального расширения и выявления факторов, направляющих выработку антител. Выявление групп перестроенных последовательностей генов иммуноглобулинов, произошедших от одной и той же перестройки (клонально-связанные наборы) в очень больших наборах последовательностей, облегчается доступностью программного обеспечения для выравнивания и разделения последовательностей генов иммуноглобулинов, которое может точно предсказать компонент гена зародышевой линии, но требует кропотливого визуального осмотра и анализа последовательностей.
Результаты: Мы разработали и внедрили алгоритм для идентификации наборов клонально-связанных последовательностей в больших наборах последовательностей вариабельной области гена тяжелой цепи человеческого иммуноглобулина. Программа обрабатывает последовательности, которые были разделены с помощью iHMMune-align, и использует попарные сравнения последовательностей CDR3 и сходства в назначениях генов зародышевой линии IGHV и IGHJ для построения матрицы расстояний. Затем для идентификации вероятных групп клонально-связанных последовательностей используется агломеративная иерархическая кластеризация. Программа доступна для загрузки с http://www.cse.unsw.edu.au/~ihmmune/ClonalRelate/ClonalRelate.zip.
Выводы: Метод был оценен на нескольких контрольных наборах данных и обеспечил более точную и значительно более быструю идентификацию клонально-связанных последовательностей генов иммуноглобулинов, чем визуальный осмотр экспертами в данной области.