Нужны ли (и возможны ли) "честные" оценки лингвистических подходов и прикладных систем.

Презентация:



Advertisements
Похожие презентации
Инициативный проект Российского семинара по оценке методов информационного поиска (РОМИП)
Advertisements

ЗАДАЧИ КОМПЬЮТЕРНОЙ ЛИНГВИСТИКИ. 1.Что такое компьютерная лингвистика? 2. История. 3. Направления компьютерной лингвистики. 4. Заключение.
3.1. Назначение онтологий. Информационный поиск..
Формальное представление лексических отношений русских глаголов Магистерская диссертация Галушко Надежды Леонидовны (филологический факультет, кафедра.
Методика проведения семинарских занятий. Самостоятельная работа слушателей.
Практический опыт разработки ООП на основе ФГОС ВПО на экономическом факультете МГУ им. М.В.Ломоносова Телешова Ирина Георгиевна зам.декана экономического.
Ситуационная задача. Кейс-задача.. ШАНС НА УСПЕХ умение сотрудничать, способность к общению, жизни в обществе и участию в нем; способность решать проблемы,
ОБУЧЕНИЕ КЛАССИФИКАТОРОВ НА ОСНОВЕ ВЫДЕЛЕНИЯ ФРАГМЕНТОВ Васильев В.Г.
Лингваториум: адаптивная обучающая система и полигон для доказательных лингвистических исследований Евгений Чухарев-Худилайнен
Информационно-поисковые системы. Сычев А.В г.1 Анализ задачи информационного поиска Воронежский государственный университет Факультет компьютерных.
ИССЛЕДОВАТЕЛЬСКИЙ ПРОЕКТ ШКОЛЬНИКА. Какими знаниями, умениями и навыками должен овладеть юный исследователь?
Структура и содержание биологического исследования ТРИЗ.
Text Mining. Анализ текстовой информации. Text Mining- методы анализа неструктурированного текста Обнаружение знаний в тексте Обнаружение знаний в тексте.
Выполнил: Гильматдинов М.М.. Системный Процессный Ситуационный.
Воспроизведение лучших результатов ad hoc поиска семинара РОМИП Romip-base project Красильников Павел, Механико-математический факультет МГУ им. Ломоносова.
ИНТЕГРАЦИЯ ЛИНГВИСТИЧЕСКИХ И СТАТИСТИЧЕСКИХ МЕТОДОВ ПОИСКА В ПОИСКОВОЙ МАШИНЕ «EXACTUS» к.т.н. Тихомиров Илья Александрович 14-я международная конференция.
Компьютерная лингвистика как наука. 1. Определения компьютерной лингвистики 2. Компьютерная лингвистика и искусственный интеллект 3. Разделы компьютерной.
По основам информационных технологий. 2 ИСПОЛЬЗОВАНИЕ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ В СОВРЕМЕННОМ КОНТЕНТ-АНАЛИЗЕ.
Семинар для молодых преподавателей Занятие 1: преподавание в магистратуре.
РОМИП в 2004 году М.С. Агеев, НИВЦ МГУ Губин М.В., ИК «Кодекс» Добров Б.В., НИВЦ МГУ Кураленок И.Е., СПбГУ Некрестьянов И.С., СПбГУ Плешко В.В., Гарант-Парк-Интернет.
Транксрипт:

Нужны ли (и возможны ли) "честные" оценки лингвистических подходов и прикладных систем

модели, подходы, словари базовые алгоритмы прикладные системы задачи данные

Нужна ли оценка ? фейс-контроль хорошие люди хорошие результаты НО: хорошие = знакомые И хорошо относящиеся проблемы для новых проблемы «групповых войн» продажи / установки чем больше продано тем лучше НО: широко продается только малая часть обычно для устойчивого спроса соревновательные оценки на тестовых задачах возможно ли?

Проблемы отсутствия оценки «недоделанность» до конца любого исследования трудность самостоятельной оценки границ и перспектив проведенного исследования последующие (аспиранты) начинают ссылаться на «недоделанное» как на полученный факт на не до конца проверенных данных строятся новые выводы/теории (вот-вот получим…, сейчас, за поворотом… ) разочарование машинный перевод, синтаксический анализ семантический анализ, ИИ в целом

Проблемы организации оценки отличать исследования и бизнес адекватность оценки реальным задачам интерпретация результатов: исследовательская составляющая интерпретация результатов: бизнес- составляющая

Существующие методологии оценки TREC (Text Retrieval Conference) – задачи информационного поиска -- Методика «пула» результатов -- Обучение на части – результат на всей коллекции -- Анонимность при оценке -- Открытость Оценки на корпусах -- Классификация текстов (Reuters-21458) -- Синтаксический анализ (BNC)

Существующие методологии оценки - 2 CLEF (Cross-Language Evaluation Forum) -- многоязычный поиск iCLEF – поиск изображений TREC HARD (High Accuracy Retrieval from Documents) TREC QA (Question Answering) SUMMAC (SUMMArization Conference) DUC (Document Understanding Conference) MUC (Message Understanding Conference) TDT (Topic Detection and Tracking) SENSEVAL (word sense disambiguation) РОМИП (romip.narod.ru) Поиск по web-, legal- коллекциях Классификация по web-, legal- коллекциям …

Методологии оценки постоянно развиваются Оценки на корпусах -- Классификация текстов (Reuters-21458) -- Синтаксический анализ (BNC) Оценки на корпусах -- Классификация текстов для небольших классификаторов с большим количеством обучающих примеров (Reuters-21458) -- Синтаксический анализ для текстов, похожих на тексты из BNC (BNC) ВАЖНОСТЬ ПРАВИЛЬНОЙ ИНТЕРПРЕТАЦИИ Существующие методологии оценки - 3

Польза от оценки проверка систем в целом или отдельных компонент, отдельных моделей ознакомление с другими подходами участие коммерческих компаний стандартизация (зрелость отрасли) движение вперед (разработка новой функциональности) укрепление доверия

Предварительные ВЫВОДЫ доклады на конференциях, диссертационные работы обязательность обсуждения возможности оценки результатов; оценка результатов отдельное направление – обсуждение вопросов оценки оценка результатов: либо по сравнению с другими либо указать недостатки существующих оценок, предложить свою для исследуемой задачи