Компьютерные словари и системы машинного перевода текстов.

Презентация:



Advertisements
Похожие презентации
Е.А. Тулаева МОУ СОШ 18 г.Пенза Компьютерные переводчики Технология обработки текстовой информации.
Advertisements

Информатика в школе КОМПЬЮТЕРНЫЕ ПЕРЕВОДЧИКИ Технология обработки текстовой информации.
Система оптического распознавания документа. Системы оптического распознавания символов При coздании электронных библиотек и архивов путем перевода книг.
План: 1. Компьютерные словари. 2. Системы компьютерного перевода. 3. Итог.
Система оптического распознавания документа Шинкаренко Евгений Александрович МОУ Гимназия 2 г. Чернняховск Калининградской области.
Тема урока: Компьютерные словари и системы машинного перевода текстов. Системы оптического распознавания документов.
Системы оптического распознавания форм. При проведении Единого государственного экзамена, при заполнении налоговых деклараций и т. д. используются различного.
Системы оптического распознавания символов. Оптическое распознавание символов механический или электронный перевод изображений рукописного, машинописного.
Система оптического распознавания документа. Системы оптического распознавания символов При coздании электронных библиотек и архивов путем перевода книг.
К ОМПЬЮТЕРНЫЕ СЛОВАРИ системы компьютерного перевода текстов.
Гипертекст. Используется для отображения в тексте смысловых связей между основными разделами или понятиями. Позволяет структурировать документ путем выделения.
Цели и задачи урока: Формирование знаний о системах оптического распознавания документов. Контроль знаний и умений: тестирование, выполнение зачетной.
помочь учащимся получить представление об OCR – программах распознавания текста, познакомиться с возможностями данных программы, воспитание информационной.
На дом: §17 Системы перевода и распознавания текстов.
Тезаурусы. Использование систем двуязычного перевода и электронных словарей.
Компьютерные словари и системы машинного перевода текстов. План урока: 1.История возникновения словарей. 2.Возможности компьютерных словарей. 3.Системы.
ИНСТРУМЕНТЫ РАСПОЗНОВАНИЯ ТЕКСТОВ И КОМПЬЮТЕРНОГО ПЕРЕВОДА Информатика и ИКТ.
ИНСТРУМЕНТЫ РАСПОЗНОВАНИЯ ТЕКСТОВ И КОМПЬЮТЕРНОГО ПЕРЕВОДА ОБРАБОТКА ТЕКСТОВОЙ ИНФОРМАЦИИ.
ИНСТРУМЕНТЫ РАСПОЗНОВАНИЯ ТЕКСТОВ И КОМПЬЮТЕРНОГО ПЕРЕВОДА ОБРАБОТКА ТЕКСТОВОЙ ИНФОРМАЦИИ Информатика и ИКТ.
Программы переводчики. Словари. СРЕДСТВА АВТОМАТИЗАЦИИ ПЕРЕВОДОВ 2.
Транксрипт:

Компьютерные словари и системы машинного перевода текстов

Компьютерные словари Компьютерные словари могут содержать переводы на разные языки сотен тысяч слов и словосочетаний, а также предоставляют пользователю дополнительные возможности.

Возможности компьютерных словарей Компьютерные словари могут являться многоязычными - давать пользователю возможность выбрать языки и направление перевода (например, англо-русский, испанско-русский и т. д.); могут кроме основного словаря общеупотребительных слов содержать десятки специализированных словарей по областям знаний (техника, медицина, информатика и др.).

Возможности компьютерных словарей обеспечивают быстрый поиск словарных статей: "быстрый набор", когда в процессе набора слова возникает список похожих слов; доступ к часто используемым словам по закладкам; возможность ввода словосочетаний и др.; могут являться мультимедийными, т. е. предоставлять пользователю возможность прослушивания слов в исполнении дикторов, носителей языка.

Системы компьютерного перевода Способны переводить многостраничные документы с высокой скоростью (одна страница в секунду); переводить Web-страницы "на лету", в режиме реального времени; не применимы для перевода художественных произведений, так как не способны адекватно переводить метафоры, аллегории и другие элементы художественного творчества человека.

Системы оптического распознавания документов Используются при создании электронных библиотек и архивов путем перевода книг и документов в цифровой компьютерный формат. Сначала с помощью сканера необходимо получить изображение страницы текста в графическом формате. Далее для получения документа в текстовом формате необходимо провести распознавание текста, т. е. преобразовать элементы графического изображения в последовательность текстовых символов.

Растровое изображение каждого символа последовательно накладывается на растровые шаблоны символов, хранящиеся в памяти системы оптического распознавания. Результатом распознавания является символ, шаблон которого в наибольшей степени совпадает с изображением

При распознавании документов с низким качеством печати (машинописный текст, факс и т. д.) используется векторный метод распознавания символов. В распознаваемом изображении символа выделяются геометрические примитивы (отрезки, окружности и др.) и сравниваются с векторными шаблонами символов. Системы оптического распознавания символов являются "самообучающимися" (для каждого конкретного документа они создают соответствующий набор шаблонов символов), и поэтому скорость и качество распознавания многостраничного документа постепенно возрастают.

Системы оптического распознавания форм При заполнении документов большим количеством людей (например, при сдаче выпускником школы единого государственного экзамена (ЕГЭ)) используются бланки с пустыми полями. Данные вводятся в поля печатными буквами от руки. Затем эти данные распознаются с помощью систем оптического распознавания форм и вносятся в компьютерные базы данных. Сложность состоит в том, что необходимо распознавать символы, написанные от руки, которые довольно сильно различаются у разных людей. Кроме того, такие системы должны уметь определять, к какому полю относится распознаваемый текст.