ISSN: 1745-7580
Йоханнес Зольнер, Райнер Громанн, Рональд Рапбергер, Пол Перко, Арно Лукас и Бернд Майер
Предыстория: Применение пептидной диагностики и терапии, имитирующей часть белкового антигена, переживает новый интерес. До сих пор выбор и обоснование дизайна таких пептидов обычно диктуются прогнозированием эпитопа Т-клеток, доступной экспериментальной и смоделированной трехмерной структурой, прогнозами эпитопа В-клеток, такими как графики гидрофильности или опыт. Если структура недоступна, рациональный выбор пептидов для производства функционально изменяющих или нейтрализующих антител практически невозможен. В частности, если доступно много альтернативных антигенов, сокращение требуемых синтезируемых пептидов до тех пор, пока не будет найден один успешный кандидат, представляет собой центральный технический интерес. Мы исследовали интеграцию прогнозирования эпитопа В-клеток с изменчивостью антигена и сохранением шаблонов для прогнозирования посттрансляционной модификации (PTM) для улучшения по сравнению с современным уровнем техники в этой области. В частности, применение методов машинного обучения показывает многообещающие результаты. Результаты: Мы обнаружили, что области белка, приводящие к производству функционально изменяющих антител, часто характеризуются отчетливым увеличением совокупной суммы трех представленных параметров. Кроме того, концепция максимизации антигенности, минимизации изменчивости и минимизации вероятности посттрансляционной модификации для идентификации соответствующих участков приводит к биологически интересным наблюдениям. В первую очередь, для примерно 50% антигена подход хорошо работает с индивидуальными значениями площади под кривой ROC (AROC) не менее 0,65. С другой стороны, значительная часть показывает эквивалентно низкие значения AROC <= 0,35, что указывает на общее негауссовское распределение. Хотя около трети из 57 антигенов кажутся неосязаемыми с помощью нашего подхода, наши результаты предполагают существование по крайней мере двух отдельных классов биоинформатически обнаруживаемых эпитопов, которые следует прогнозировать отдельно. В качестве побочного эффекта нашего исследования мы представляем вручную отобранный набор данных для проверки классификации протективности. На основе этого набора данных методы машинного обучения дополнительно улучшают предсказательную силу до разделения классов в уравновешенном наборе данных до 83%. Заключение: Мы представляем вычислительный метод для автоматического выбора и ранжирования пептидов для стимуляции потенциально защитных или иным образом функционально изменяющих антител. Можно показать, что интеграция изменчивости, сохранение паттерна посттрансляционной модификации и антигенность В-клеток улучшают рациональный выбор по сравнению со случайным угадыванием. Вероятно, что еще важнее, мы обнаружили, что для примерно 50% антигена подход работает существенно лучше, чем для общего набора данных из 57 белков. По сути, в качестве побочного эффекта наш метод оптимизируется для предположительно лучших применимых пептидов, поскольку они, как правило, скорее всего, не модифицированы и максимально неизменны, что отвечает потребностям в диагностике и лечении патогенной инфекции.Кроме того, мы показываем потенциал дальнейшего улучшения за счет применения методов машинного обучения, в частности случайных лесов.