Автоматическое стенографирование речи: состояние и перспективы Пилипенко В.В. Международный научно-учебный центр информационных технологий и систем.

Презентация:



Advertisements
Похожие презентации
Распознавания речи распознавания речи. Что такое распознавание речи? Система преобразования речевых сигналов в текст либо в набор управляющих команд.
Advertisements

Проблемы распознавания речи славянских языков Хейдоров И.Э. Белорусский государственный университет Сакрамент ИТ.
Распознавание речи – это многоуровневая задача распознавания образов, в которой акустические сигналы анализируются и структурируются в иерархию структурных.
Меламуд Александр Евгеньевич 445 гр. Научный руководитель: к.т.н. Булашевич Александр Евгеньевич.
Российские разработки корпусов устной речи I. Корпусы звучащей речи = фонетические базы данных II. Корпусы устных текстов.
Исследовательская деятельность в школе -Навык работы со специальной литературой, современными средствами хранения и поиска информации -Основанное на.
Основы информационной культуры. Модуль «Работа с информационными ресурсами: поиск и извлечение информации». ЛАНГЕПАССКОЕ ГОРОДСКОЕ МУНИЦИПАЛЬНОЕ БЮДЖЕТНОЕ.
Государственная итоговая аттестация по русскому языку 2012 год.
Введение в задачи исследования и проектирования цифровых систем Санкт-Петербургский государственный университет Факультет прикладной математики - процессов.
1 Искусство построения моделей или Этапы решения задач с помощью ЭВМ.
«Критерии оценок» Выполнила: Драган Ирина Анатольевна Учитель английского языка Конзаводской СОШ 2.
Муниципальное общеобразовательное учреждение средняя общеобразовательная школа 1 г.Камешково Владимирской области Куцева Надежда Алексеевна Образование:
Средства мультимедиа. Мультимедиа - это современная компьютерная информационная технология, позволяющая объединить в компьютерной системе текст, звук,
ФГОС начального общего образования. Метапредметные результаты освоения основной образовательной программы Активное использование речевых средств и средств.
Структура ГИА.. Экзаменационная работа по русскому языку состоит из 3 частей, которые последовательно выполняются учениками. Время выполнения работы –
ГБОУ СО «ЦПМСС «Речевой центр» Использование мультимедийного обеспечения «Живой звук 3.01» в условиях внедрения ФГОС при организации коррекционно-развивающей.
Кодирование информации Подготовила: учитель информатики Ефимова Н.Ю.
Более 100 общелексических и тематических словарей, входящих в перечень ABBYY LINGVO, являются наиболее актуальными и авторитетными изданиями в своих областях.
МОДЕЛИРОВАНИЕ И ФОРМАЛИЗАЦИЯ Работу выполнили ученицы 9 «Б» класса Шебаршова Рита и Гордеева Татьяна.
ГИА 2013 года по русскому языку. В экзаменационной работе 3 части, тематически связанные: - сжатое изложение; - задания с выбором ответа А1 – А7; - задания.
Транксрипт:

Автоматическое стенографирование речи: состояние и перспективы Пилипенко В.В. Международный научно-учебный центр информационных технологий и систем

Стенографирование vs речевой диалог Стенографирование Стенографирование получение текстов из записанных речевых файлов при помощи автоматического распознавания речи Особенности: Нет непосредственной обратной связи от говорящего Слитная речь с большим объемом словаря Много дикторов разного стиля произношения, акценты Слабо контролируемые условия записи Преимущества: Можно анализировать в несколько проходов Можно легко задействовать много компьютеров Область применения: Новости Парламент Телевизионные шоу Суды Научные доклады

Парламентская речь Стенографирование Спонтанная речь. Иногда встречаются доклады, зачитываемые по заранее подготовленному тексту. Публичные дикторы. Быстрый темп. Часто эмоционально окрашена. Непрерывные выступления дикторов. Качество записи достаточно высокое, поскольку каждое депутатское место оснащено микрофоном.

Стенографирование в парламентах Стенографирование Стенографист набирает текст в 3-5 раз медленнее темпа речи. Обычно допускает в тексте 2-5% ошибок. 6-7 стенографистов набирают текст порциями по 3 минуты. Черновая стенограмма готова на следующее утро. Отдел редактирования (около 20 человек) готовит официальную стенограмму обычно в течение двух недель. Отличается от сказанного.

Наша цель Стенографирование Автоматизированное стенографирование. Один стенографист прослушивает речь и устраняет ошибки в темпе поступления речи. Точность автоматического распознавания не менее 85%.

Схема распознавания речи Пилипенко В.В Распознавание речи

Спектральный анализ сигнала Пилипенко В.В Распознавание речи

Анализ сигнала Распознавание речи

Пилипенко В.В Распознавание речи последовательность векторов наблюдений Задача распознавания речи

Пилипенко В.В Распознавание речи последовательность векторов наблюдений Задача распознавания речи

Пилипенко В.В Распознавание речи последовательность векторов наблюдений правило Байеса лингвистическая часть акустическая часть Задача распознавания речи

Модель порождения речевого сигнала Распознавание речи Состояния Наблюдаемая последовательность Поиск кратчайшего пути при помощи алгоритма динамического программирования

Вероятность порождения речи моделью Пилипенко В.В Распознавание речи

Лингвистическая модель Пилипенко В.В Распознавание речи - история Ф – класс эквивалентности N-граммная модель - коэффициенты сглаживания

Виды моделей при распознавании Пилипенко В.В Распознавание речи

Корпуса речи и текстов Стенографирование Верховная Рада65 часов300 дикторов Телевизиные передачи280 часов3000 дикторов Новости телеканала NewsOne700 часов Запись из телевизионного канала Застенографировано и размечено экспертами на фразы Текстовый корпус из Интернета больше 600 миллионов слов Радуцкий Александр, SRS

Причины понижения точности Стенографирование Влияние каналов связи и шумов Разнообразие голосов дикторов Неизвестные слова от 2 до 20% словаря Построение лингвистических моделей по текстам Собственные имена от 5 до 20% словаря Экстралингвистические явления от 2 до 15% случаев Редукция и быстрый темп Суржик и другое неправильное произношение Людовик Татьяна

Многодикторное распознавание Стенографирование

Адаптация к голосу диктора Стенографирование Для адаптации необходимо 2 минуты речи диктора Для известных дикторов (которые вошли в обучающий корпус) - 2% улучшения точности распознавания Для неизвестных дикторов от 5 до 20% улучшения Разработана технология адаптации без участия эксперта для транскрибирования адаптационного образца речи Юхименко Александр

Варианты транскрипций словоформ, индивидуальные для дикторов Стенографирование Робейко Валентина СловоформаОбычная транскрипция Спонтанная фонетическая транскрипци я шановнийш а н О в н и йш а н О в н и колик о л И к О л и к о л и доброгод О б р о г од О б р о Около 3% улучшения точности распознавания

Моделирование незнакомых слов Стенографирование

Пример ответа распознавания при наличии незнакомых слов Стенографирование провадження !B ж о к' І х !E санкцій проти !B т й х' І т р !E на провайдерів які не відключають !B н е !E законні комітети провадження * санкцій проти * на провайдерів які не відключають * законні комітети

Экстралингвистические явления Стенографирование Ладошко Ольга, Гузиенко Ирина Экстралингвистические явления от 2 до 15% случаев Улучшение точности распознавания от 2 до 6%

Распознавание многоязычной речи без идентификации языка Стенографирование Людовик Татьяна Речевые сегменты Количество слов УкраинскийРусскийУкр + Рус украинские русские украинские + русские Набор фонем украинский Для русских фонем замены: « и » на « і », « э » на « е », « г » на « ґ » Словарь украинские словоформы и русских словоформ

Обучение на корпусе с неточным текстовым сопровождением Стенографирование Селюх Руслан Исходный корпус 100 часов речи несовпадение 15% Размеченный корпус 60 часов Улучшение точности распознавания на 5% Для обучения необходимо точное соответствие звука и текста Обычно стенограмма имеет от 5 до 20% несовпадений Для точной разметки эксперт тратит в 8 раз больше времени звучания

Примеры ответов распознавания Стенографирование

Примеры ответов распознавания Суд над Тимошенко 67% Стенографирование

Достигнутое состояние Стенографирование Средняя точность распознавания 77% Для отдельных дикторов - 89%

Лингвистические модели Стенографирование Сажок Николай Семинар Образный компьютер 12 февраля 2013

Спасибо за внимание !