УНЦ «Проблемы и методы интеллектуального анализа данных» ОИС изучает и развивает методы интеллектуального анализа данных и их применение для решения задач в различных предметных областях, лишённых развитых формальных инструментов и обладающих накопленными массивами (качественных/неколичественных) эмпирических данных. Особенное внимание уделяется задачам гуманитарных областей (в частности, наук о человеке и обществе). В сферу интересов включаются также задачи медицинской диагностики, в которых чрезвычайно значимым оказывается субъективный компонент – как врача (лечащего или исследователя), так и пациента (в том числе, его субъективные мнения и ощущения).
Существующий обширный корпус методов анализа данных включает чрезвычайно развитые и распространённые методы статистического анализа, применение которых ограничено требованиями заметных объёмов и репрезентативности выборок данных. Эти ограничения не являются препятствием для использования также чрезвычайно распространённых методов Data Mining, которые также относят к методам интеллектуального анализа данных. Сфера применения этих методов имеет другие ограничения. Прежде всего, они не нацелены на работу с открытыми областями и чувствительны к добавлению новых данных. Результаты применения этих методов – извлечение паттернов (образцов) из данных.
Развиваемые в УНЦ методы интеллектуального анализа данных используют современные достижения Искусственного интеллекта и направлены на получение нового знания в открытых предметных областях, причём особенное внимание уделяется выявлению регулярностей при добавлении новых данных – эмпирических закономерностей: законов и тенденций. Порождение таких закономерностей осуществляется процедурами, подбираемыми с учётом особенностей предметной области и природой механизмов причинного вынуждения, а результаты анализа получают несингулярные оценки.
Таким образом, работа УНЦ направлена на создание методов интеллектуального анализа данных, формирующих инструментальную область для когнитивных исследований.
Сотрудники УНЦ занимаются развитием ДСМ-метода автоматизированной поддержки исследований и созданием реализующих его интеллектуальных компьютерных систем (ИС-ДСМ). Такие системы имеют общий Решатель, обеспечивающий воспроизведение исследовательских эвристик с помощью процедур и стратегий ДСМ-метода, и специфицируются для соответствующей предметной области подсистемами представления данных и знаний, а также пользовательским интерфейсом, ориентированным на потребности эксперта-исследователя.
Наиболее значимыми результатами работы УНЦ является создание логических средств для формализации открытых (квазиаксиоматических) теорий, разработка их семантики и принципов моделирования предметных областей. В процессе развития ДСМ-метода автоматизированной поддержки научных исследований разработаны средства обнаружения эмпирических закономерностей (ЭЗк), оказывающихся инвариантами при расширении (изменении) эмпирических данных.
Обнаружение эмпирических закономерностей (ЭЗк) в последовательно расширяющихся базах эмпирических фактов в медицине и социологии средствами ДСМ-метода носит инновационный характер. Предлагаемый подход учитывает различные характеристики множества порождаемых ЭЗк: монотонность возрастания степени каузальной полноты (доли абдуктивно объяснённых фактов) при расширении БФ, антитонность убывания функционалов степени противоречивости (доли гипотез, меняющих истинностные значения), а также монотонность степени сохранения истинностных значений (доли гипотез, сохраняющихся в корпусе порождённых гипотез). При этом поиск закономерностей опирается на пред-процессинг исходных данных, а стратегия анализа осуществляется на основании выбора упорядоченных по силе процедур, образующих решётку методов. Соответственно, оценка результатов носит комплексный характер, и такое оценивание не имеет аналогов в традициях интеллектуального анализа данных.
В УНЦ с привлечением аспирантов и студентов создаются интеллектуальная система анализа развития сахарного диабета у больных хроническим панкреатитом и интеллектуальная система формализованного качественного анализа социологических данных. Такие системы обеспечивают инструментальную поддержку исследовательской и практической деятельности в медицине и социологии.
Важным практическим результатом работы является осмысление проблемы формирования общих понятийных систем в межпрофессиональной коммуникации представителей точных и гуманитарных областей. Элементами таких систем являются мобилизованные для совместной работы парадигмы, концепты, инструменты и процедуры. Сформированная система базовых понятий и структуры данных является основой для эмпирической верификации формального языка.
Студенты 2-го и 3-го бакалавриата Отделения интеллектуальных систем (в гуманитарной сфере) изучают дисциплину «Методы обработки социологических данных», в рамках которой студенты знакомятся со средствами ДСМ-метода и особенностям его применения в гуманитарных областях (на примере анализа социологических данных). Здесь же читается курс «Применение ДСМ-метода автоматизированной поддержки научных исследований», посвящённый обзору существующих прикладных интеллектуальных систем типа ДСМ и принципам их конструирования. Для студентов 1-го курса магистратуры Отделения читается курс «Принципы интеллектуального анализа данных и ДСМ-исследования». Курсы читаются сотрудниками УНЦ и аккумулируют результаты их работы. Сотрудники Центра также руководят курсовыми работами студентов младших курсов, часть которых затем выполняет в УНЦ и выпускную квалификационную работу.
За последнее время опубликованы следующие монографии:
В период с 06.04.2020 г. по 30.04.2020 г. подготовлены:
Д.т.н., Заслуженный деятель науки РФ, профессор В.К. Финн и д.т.н., г.н.с. М.А. Михеенкова являются членами программного комитета, осуществляя рецензирование и отбор докладов на Национальные конференции по искусственному интеллекту с международным участием КИИ-2016, КИИ-2018, КИИ-2019 (информация о конференциях размещена на сайте), Первый национальный конгресс по когнитивным исследованиям, искусственному интеллекту и нейроинформатике (ИИКН-2020) (сайт конгресса), 11 и 12 Всероссийскую мультиконференцию по проблемам управления (2017, 2019 гг.)
Д.т.н., Заслуженный деятель науки РФ, профессор В.К. Финн является главным организатором Межвузовской конференции «Интеллектуальные системы в гуманитарной сфере. Опыт преподавания и развитие образовательных программ» в рамках международного научно-практического форума «Россия в XXI веке: глобальные вызовы, риски и решения», Москва, РГГУ, 29 мая 2019 г. В конференции принимала активное участие д.т.н., г.н.с. М.А. Михеенкова. Информация о конференции была размещена на сайте РГГУ.
Сотрудники УНЦ «Проблемы и методы интеллектуального анализа данных» являются руководителями и участниками следующих проектов, поддержанных РФФИ:
УНЦ «Проблемы и методы интеллектуального анализа данных» проводит работу в области применения логических средств в когнитивных исследованиях совместно с Лабораторией прикладной логики (г. Будапешт, Венгрия, рук. проф. Т. Гергей, T. Gergely)
При участии сотрудников Центра были созданы две программные системы, решающие задачи интеллектуального анализа данных (ИАД) в области гастроэнтерологии: интеллектуальная система для предсказания развития диабета у больных хроническим панкреатитом (ИС-СД3с) и интеллектуальная система дифференциальной диагностики рака поджелудочной железы и хронического панкреатита (ИС-РПЖ).Результаты работы используются в исследовательской практике московского клинического научно-практического центра Департамента здравоохранения г. Москвы.
Созданная сотрудниками УНЦ с привлечением аспирантов и студентов интеллектуальная система формализованного качественного анализа социологических данных обеспечивает инструментальную поддержку исследовательской и практической деятельности в совместной работе со специалистами Института социологии РАН.