ISSN: 2153-0637
Алекс В. Васенков
В этом докладе основное внимание будет уделено Большим данным для исследований и разработок (НИОКР). Существует несколько определений Больших данных, которые создают путаницу в этой теме. Еще больше путаницы возникает в отношении синтетических Больших данных, которые можно определить как набор исследовательских статей, диссертаций, патентов, отчетов об испытаниях и отчетов об описании продуктов. Такие данные обладают новыми атрибутами, такими как большой объем, высокая скорость, большое разнообразие и достоверность, которые затрудняют анализ синтетических данных. Возникает насущная потребность в фреймворке, который может синергетически интегрировать поиск или извлечение информации (ИР) с извлечением информации (ИИ). Традиционный текстовый поиск на основе ИР может использоваться для быстрого исследования больших коллекций синтетических данных. Однако этот подход не позволяет находить конкретные концепции НИОКР в таких коллекциях и устанавливать связи между этими концепциями. Кроме того, модели ИР не способны изучать концепции и отношения между концепциями. Напротив, модели ИИ слишком специфичны и, как правило, требуют настройки для интересующей области. Будет представлена новая фреймворк и будет показана ее осуществимость для добычи синтетических данных. Было обнаружено, что возможно частично или полностью автоматизировать анализ синтетических данных для поиска маркированной информации и связывающих концепций. Настоящая структура может помочь людям определить неочевидные решения проблем НИОКР, служить в качестве входных данных для инноваций или классифицировать предшествующее искусство, относящееся к технологической концепции или рассматриваемой патентной заявке