ISSN: 2376-130X
Джон Андер Гомес Адриан
Большинству методов искусственного интеллекта, в частности, принадлежащих машинному обучению, необходимо как можно больше данных для получения более надежных и точных моделей, обученных с помощью алгоритмов, которые используют выборки данных для настройки параметров модели. Например, модель на основе глубоких нейронных сетей имеет миллионы параметров (называемых весами), значения которых постепенно обновляются алгоритмом обратного распространения ошибки, который итеративно посещает все образцы набора обучающих данных. Г-н Кукье объяснил, что исследователи из Стэнфордского университета использовали тысячи образцов раковых клеток молочной железы и показатели выживаемости пациентов для обучения модели машинного обучения и определили целевую функцию алгоритма обучения для выявления закономерностей в атрибутах входных данных, которые наилучшим образом коррелируют с целью прогнозирования того, будет ли данная биопсия тяжело раковой. Полученная модель машинного обучения определила одиннадцать атрибутов, которые наилучшим образом предсказывают, что биопсия тяжело раковая. Исследователей удивило то, что только восемь из одиннадцати атрибутов были ранее известны врачам и изучались в медицинской литературе. Поскольку исследователи Стэнфорда включили в эксперимент все атрибуты входных данных, не указав алгоритму обучения, какие из них использовать, результатом стало то, что три атрибута (или индикатора), найденные алгоритмом машинного обучения, не были признаны медицинским сообществом релевантными; патологи никогда не фокусировали свое внимание на таких индикаторах. Как заметил г-н Кукиер, машинное обучение работает, потому что алгоритм обучения получает большой объем данных — гораздо больше информации, чем любой человек может усвоить за всю жизнь и обработать в любой момент