Скачать презентацию
Идет загрузка презентации. Пожалуйста, подождите
Презентация была опубликована 10 лет назад пользователемlmp
1 Проект общедоступного многопользовательского корпуса Проблемы и перспективы Дмитрий Грановский
2 Зачем ещё один? У существующих корпусов: Авторские права –На текст –На разметку Административные ограничения Недоступна сама разметка
3 Что будет уметь? Просмотр и редактирование разметки (многопользовательский) Возможность скачивания в разных форматах Встроенный поиск по популярным запросам Обработка «тяжёлых» запросов
4 Кто будет делать? Техническая часть – группа разработчиков Наполнение – пользователи
5 Откуда брать тексты? Тексты с истекшим авторским правом Тексты, на которые авторское право не распространяется Тексты под свободной лицензией (e.g. Википедия) Остальное – по договорённости с правообладателем
6 Задачи инструментария 1. Редактирование 2. Хранение 3.Поиск
7 Как можно использовать? Статистические исследования Машинное обучение (как обучающий корпус) Тестовый корпус для других ресурсов
8 Проблемы Почему эта модель доступа должна работать? Как обеспечить совместную работу многих людей? (многопользовательский) Как обеспечить целостность данных?
9 Проблемы Откуда взять столько квалифицированных редакторов? Как бороться с ошибками редактирования? Как не делать разметку с нуля? Как унифицировать разметку?
10 Ваши вопросы
11 СПАСИБО! Дмитрий Грановский
Еще похожие презентации в нашем архиве:
© 2024 MyShared Inc.
All rights reserved.