Компьютерный анализ естественно-языкового текста Кафедра информационных систем в искусстве и гуманитарных науках.

Презентация:



Advertisements
Похожие презентации
Компьютерный анализ естественно-языкового текста Кафедра информационных систем в искусстве и гуманитарных науках.
Advertisements

Компьютерный анализ естественно-языкового текста Кафедра информационных систем в искусстве и гуманитарных науках.
Компьютерная лингвистика как наука. 1. Определения компьютерной лингвистики 2. Компьютерная лингвистика и искусственный интеллект 3. Разделы компьютерной.
Компьютерный анализ естественно-языкового текста Кафедра информационных систем в искусстве и гуманитарных науках.
ЗАДАЧИ КОМПЬЮТЕРНОЙ ЛИНГВИСТИКИ. 1.Что такое компьютерная лингвистика? 2. История. 3. Направления компьютерной лингвистики. 4. Заключение.
1 Exactus Expert - система интеллектуального поиска и анализа научных публикаций Смирнов Иван Валентинович с.н.с. ИСА РАН.
Система понимания и перевода естественного языка ABBYY Compreno Александр Костюченко ABBYY.
"Электронные библиотеки " Дубна Россия Метаданные в системе управления многоязычной лингвистической базой знаний Н.В. Лунева Институт.
Естественно-языковые системы Выполнили: Книга А., Мишалевский С., Нагорный А., Крупский П. Группа – 9ВМ40-04.
ПРОГРАММНЫЕ СРЕДСТВА ВЫЯВЛЕНИЯ ТЕРМИНОЛОГИЧЕСКИХ ВАРИАНТОВ В ТЕКСТАХ Антонов Вадим Юрьевич Научный руководитель: Ефремова Наталья Эрнестовна Дипломная.
Компьютерный анализ естественно-языкового текста Кафедра информационных систем в искусстве и гуманитарных науках.
Text Mining. Анализ текстовой информации. Text Mining- методы анализа неструктурированного текста Обнаружение знаний в тексте Обнаружение знаний в тексте.
Тема урока: « Информационные системы. Классификация информационных систем »
Связь правовой информатики с другими науками 1. Кибернетика Семиотика Лингвистика Когнитивная психология Теория информации Информациология 2.
Автоматический перевод это - выполняемое на компьютере действие по преобразованию текста на одном естественном языке в эквивалентный по содержанию текст.
ТЕХНОЛОГИИ ИСКУССТВЕННОГО ИНТЕЛЕКТА ABBYY Оптическое распознавание и машинный перевод Давид Ян (ABBYY)
Лекция 1 Введение. Программирование.. Введение. Информатика – предмет и задачи. Существует много определений информатики: Информатика это наука и сфера.
Системы оптического распознавания символов. Оптическое распознавание символов механический или электронный перевод изображений рукописного, машинописного.
Лекция по предмету интеллектуальные информационные системы Искусственный интеллект в обработке изображений и распознавании образов на них Автор: к.т.н.
Общероссийские тенденции в области управления документами Козлов Андрей Директор ЭОС Софт.
Транксрипт:

Компьютерный анализ естественно-языкового текста Кафедра информационных систем в искусстве и гуманитарных науках

Компьютерный анализ естественно-языкового текста СТРУКТУРА КУРСА 1.Введение в дисциплину 2.Автоматический анализ текста на морфологическом уровне 3.Автоматический анализ текста на синтаксическом уровне 4.Семантический компонент в системах автоматического анализа текста

Компьютерный анализ естественно-языкового текста СТРУКТУРА КУРСА 1.Введение в дисциплину 2.Автоматический анализ текста на морфологическом уровне 3.Автоматический анализ текста на синтаксическом уровне 4.Семантический компонент в системах автоматического анализа текста

Компьютерный анализ естественно-языкового текста ВВЕДЕНИЕ В ДИСЦИПЛИНУ Лингвистические информационные технологии: актуальные задачи Лингвистическая составляющая ЛИТ (прикладная лингвистика, компьютерная лингвистика, языковая инженерия) Функциональность ЛИТ и уровни обработки естественно-языкового текста

ЛИНГВИСТИЧЕСКИЕ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ Распознавание звучащей речи Поддержка ввода текста на электронные носители (распознавание печатного и рукописного текста, автозавершение, коррекция на лексико- морфологическом и синтаксическом уровне) Синтез речи по тексту Информационный поиск (лингвистически нетривиальные функции); рубрикация/индексация текстов Машинный перевод Извлечение фактов и знаний Диалог с компьютерными системами на естественном языке Компрессия текста (аннотирование, реферирование)

ЛИНГВИСТИЧЕСКИЕ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ Составляющие по областям знания Техническая составляющая Математическая составляющая Лингвистическая составляющая

ЛИНГВИСТИЧЕСКАЯ СОСТАВЛЯЮЩАЯ ЛИТ компьютерная лингвистика это наука о том, в каком виде представлен естественный язык в компьютерных системах, решающих утилитарные задачи Содержательно близкое понятие: инженерная лингвистика (по В.Ш.Рубашкину)

ИНЖЕНЕРНАЯ ЛИНГВИСТИКА, иные трактовки термина 1.Linguistic Engineering – отрасль теоретических и прикладных знаний, позволяющих создавать компьютерные системы с лингвистическими компонентами; синоним – Natural Language Engineering, впоследствии – Human Language Technology 2.отрасль знаний, разрабатываемая школой под руководством Р.Г.Пиотровского (группа «Статистика речи»)

ФУНКЦИОНАЛЬНОСТЬ ЛИТ: ВХОДЫ И ВЫХОДЫ Входы Звучащая речь в электронном представлении Письменный текст как последовательность символов: –Без ограничений (любой текст) –Набор ключевых слов для поиска –Тексты как источник информации –Команды информационным системам и роботам Изображения письменного текста

ФУНКЦИОНАЛЬНОСТЬ ЛИТ: ВХОДЫ И ВЫХОДЫ Выходы Письменный текст: –Результат коррекции входного текста –Перекодированный из другой языковой системы –Результат компрессии входного текста –Изложение фактов и элементов знаний (соотв. исходному запросу) Звучащая речь –Озвученный входной текст –Озвученные результаты перекодирования, компрессии, выполнения информационных запросов Ссылки на электронные документы Действия роботов

ФУНКЦИОНАЛЬНОСТЬ ЛИТ: ВХОДЫ И ВЫХОДЫ Пути преобразования входов в выходы цифровая запись на ест. или иск. языке звучащая речь изображения письм. текста действия роботов- манипуляторов распознавание синтез выполнение команд коррекция переводкомпрессия инф. запросы

ФУНКЦИОНАЛЬНОСТЬ ЛИТ: операции с текстом в цифровом представлении Учет правил построения: слова из букв высказывания из слов текста из высказываний Типовые операции: Форм.Содерж.Форм.Содерж.Форм.Содерж. Коррекция+–+±–– Перевод++++(±)(±)(±)(±) Компрессия+(±)(±)(±)(±)(±)(±)±(±)(±) Информ. запрос +±±±––

ФУНКЦИОНАЛЬНОСТЬ ЛИТ: операции с текстом в цифровом представлении Уровень языка: Лексико- морфологи- ческий СинтаксическийТекстовой Типовые операции: Форм.Содерж.Форм.Содерж.Форм.Содерж. Коррекция+–+±–– Перевод++++(±)(±)(±)(±) Компрессия+(±)(±)(±)(±)(±)(±)±(±)(±) Информ. запрос +±±±––

Рекомендуемая литература Леонтьева Н.Н. Автоматическое понимание текстов: системы, модели, ресурсы. М., 2006.