Автоматическое распознавание речевых медицинских данных с использованием LLM
В журнале «Программные системы: теория и приложения» (2025, Т. 16, №6, с. 197–219) опубликована статья Сидорова Ю.Г., Малых В.Л., Калинина А.Н. и Елистратовой О.С., посвященная автоматическому распознаванию речевых медицинских данных с использованием LLM.
Исследование, представленное в работе, выполнено совместно специалистами группы компаний «Интерин» и Института программных систем имени А. К. Айламазяна РАН (ИПС РАН). Исследование посвящено практическому решению проблемы создания речевого интерфейса ввода медицинских данных на основе методов ИИ. Учитывалась специфика предметной области, особенности работы врача, повышенные требования к точности работы речевого интерфейса. Исследование проводилось на специально подготовленном верифицированным врачами наборе данных (НД). Перед LLM изначально ставились широкие задачи по исправлению ошибок системы распознавания речи (ASR), по использованию заданных шаблонов структуры и содержания результирующего медицинского документа, по семантической фильтрации речи (аудиозаписи на приёме). Оценивалась семантическая точность работы связки ASR + LLM.
Первые полученные результаты показали, целесообразность применения LLM для построения речевого интерфейса врача. На сформированном наборе данных была получена семантическая точность в обработке речевого потока в 95%-96%. Исследование продолжается уже на реальных аудиоданных, записанных на приёме, оценивается точность в условиях, когда большую часть речевого потока требуется отфильтровать. Предложенный подход в перспективе позволяет получить решение проблемы речевого ввода медицинских данных с приемлемой для медицины точностью.
Выходные данные: Сидоров Ю.Г., Малых В.Л., Калинин А.Н., Елистратова О.С. Автоматическое распознавание речевых медицинских данных с использованием LLM // Программные системы: теория и приложения. 2025. Т. 16. № 6(71). С. 197–219. DOI: 10.25209/2079-3316-2025-16-6-197-219
Ссылки: Автоматическое распознавание речевых медицинских данных с использованием LLM
