ISSN: 1745-7580
Э. Джейн Хоман
Предыстория: Функционирование иммунной системы многомерно. Снижение размерности необходимо для облегчения понимания этой сложной биологической системы. Одной из многомерных граней иммунной системы является связывание эпитопов с молекулами MHC-I и MHC-II различными популяциями людей. Прогнозирование такого связывания эпитопов имеет решающее значение, и было разработано несколько иммуноинформатических стратегий, использующих матрицы замены аминокислот, для разработки предсказательных алгоритмов. В то же время вычислительные и статистические инструменты развивались для обработки многомерного и мегамерного анализа, но они не были систематически применены для прогнозирования связывания MHC. Анализ частичных наименьших квадратов, анализ главных компонентов и связанные с ними методы регрессии стали нормой при обработке сложных наборов данных во многих областях. Более двух десятилетий назад Уолд и его коллеги показали, что главные компоненты аминокислот можно использовать для прогнозирования связывания пептидов с клеточными рецепторами. Мы применили это наблюдение к анализу связывания MHC и к выводу предсказательных методов, применимых в масштабе всего протеома. Результаты: Мы показываем, что подходы основных аминокислотных компонентов и частичных наименьших квадратов могут быть использованы для визуализации основных физико-химических свойств домена связывания MHC с использованием коммерчески доступного программного обеспечения. Мы также показываем применение основных аминокислотных компонентов для разработки как линейных частичных наименьших квадратов, так и нелинейных алгоритмов прогнозирования регрессии нейронной сети для молекул MHC-I и MHC-II. Несколько вариантов визуализации для вывода помогают понять основные физико-химические свойства, позволяют подтвердить более ранние работы по относительной важности определенных пептидных остатков для связывания MHC, а также предоставляют новые сведения о различиях между молекулами MHC. Мы сравнили как линейные, так и нелинейные инструменты прогнозирования связывания MHC с несколькими инструментами прогнозирования, доступными в настоящее время в Интернете. Выводы: В отличие от сильно ограниченных парадигм взаимодействия с пользователем подходов веб-сервера, локальные вычислительные подходы позволяют проводить интерактивный анализ и визуализацию сложных многомерных данных с использованием надежных математических инструментов. Наша работа показывает, что такие инструменты прогнозирования могут быть созданы на широкодоступной платформе JMP®, могут работать в среде электронных таблиц на настольном компьютере и способны выполнять анализ в масштабе протеома с высокой пропускной способностью.