ISSN: 2379-1764
Фатима Адилова и Алишер Икрамов
Концепция обрыва активности имеет большое значение для медицинской химии. В данной работе мы изучаем концепцию «моделируемости набора данных», т. е. априорную оценку возможности получения внешне предсказывающих моделей QSAR для набора данных биологически активных соединений. Эта концепция возникла в результате анализа влияния так называемых «обрывов активности» на общую производительность моделей QSAR. Некоторые индексы «моделируемости» (SALI, ISAC и MODI) уже известны. Мы расширили версию MODI на наборы данных соединений с реальными значениями активности. Прогностическая эффективность моделей QSAR выражается как правильная скорость классификации алгоритмом SVM, которая сравнивается с результатами двух других алгоритмов: алгоритма MODI и алгоритма Воронина, модифицированного авторами. Сравнительный анализ результатов, выполненный с использованием квадрата коэффициента корреляции Пирсона. Наше исследование показало крайнее отсутствие оценки прогностической эффективности набора данных, основанного только на «обрывах активности». При разработке более точных методов, позволяющих оценить возможность построения эффективных моделей на выборках данных, необходимо учитывать и другие свойства выборки, а не только наличие (и количество) «обрывов активности».