Передовые методы в биологии и медицине

Передовые методы в биологии и медицине
Открытый доступ

ISSN: 2379-1764

Абстрактный

Анализ набора данных для расчета эффективности прогнозирования моделей QSAR на основе обрывов активности

Фатима Адилова и Алишер Икрамов

Концепция обрыва активности имеет большое значение для медицинской химии. В данной работе мы изучаем концепцию «моделируемости набора данных», т. е. априорную оценку возможности получения внешне предсказывающих моделей QSAR для набора данных биологически активных соединений. Эта концепция возникла в результате анализа влияния так называемых «обрывов активности» на общую производительность моделей QSAR. Некоторые индексы «моделируемости» (SALI, ISAC и MODI) уже известны. Мы расширили версию MODI на наборы данных соединений с реальными значениями активности. Прогностическая эффективность моделей QSAR выражается как правильная скорость классификации алгоритмом SVM, которая сравнивается с результатами двух других алгоритмов: алгоритма MODI и алгоритма Воронина, модифицированного авторами. Сравнительный анализ результатов, выполненный с использованием квадрата коэффициента корреляции Пирсона. Наше исследование показало крайнее отсутствие оценки прогностической эффективности набора данных, основанного только на «обрывах активности». При разработке более точных методов, позволяющих оценить возможность построения эффективных моделей на выборках данных, необходимо учитывать и другие свойства выборки, а не только наличие (и количество) «обрывов активности».

Отказ от ответственности: Этот тезис был переведен с использованием инструментов искусственного интеллекта и еще не прошел рецензирование или проверку.
Top