ISSN: 2376-130X
Дункан Уоллес
В эпоху «больших данных» вычислительные решения посредством крупномасштабного машинного обучения (ML) предоставили возможность решать проблемы, которые ранее было бы очень трудно решить. В последние годы подходы ML успешно применялись для анализа данных о симптомах пациентов в контексте диагностики заболеваний, по крайней мере, там, где такие данные хорошо кодифицированы. Однако большая часть данных, представленных в электронных медицинских картах (EHR), вряд ли окажется подходящей для классических подходов ML. Кроме того, поскольку множество данных широко распространено как по больницам, так и по отдельным лицам, приоритетом является децентрализованная, масштабируемая с точки зрения вычислений методология. Наши исследования основаны на раннем выявлении небольшой подгруппы пациентов, которые являются частыми пользователями. Это пациенты, у которых есть сопутствующие заболевания, которые заставят их неоднократно требовать медицинской помощи. OOHC действует как ad hoc доставка телемедицины и лечения, где взаимодействие происходит без обращения к полной истории болезни соответствующего пациента. Истории болезни, относящиеся к пациентам, обращающимся в OOHC, могут находиться в нескольких отдельных системах EHR в нескольких больницах или клиниках, которые недоступны для рассматриваемого OOHC. Таким образом, хотя локальное решение является лучшим вариантом для этой проблемы, из этого следует, что исследуемые данные являются неполными, неоднородными и состоят в основном из шумных текстовых заметок, составленных во время рутинных мероприятий OOHC. Целью данного исследования является предоставление средств для идентификации случаев пациентов при первоначальном контакте, которые, вероятно, будут связаны с такими выбросами, с помощью ряда методологий машинного обучения. В частности, при разработке системы классификации этих случаев были приняты подходы глубокого обучения. Еще одной целью данного исследования является выяснение обнаружения частых случаев использования путем изучения точных терминов, которые обеспечивают надежное указание на положительные и отрицательные записи случаев.