Проект общедоступного многопользовательского корпуса Проблемы и перспективы Дмитрий Грановский.

Презентация:



Advertisements
Похожие презентации
Ваш текст
Advertisements

Ваш текст
Шины и Диски Bontyre-Stalker.ru
Спасибо за просмотр.
Программное обеспечение компьютера. Операционная система.
Есть вопросы? Пишите
Подготовила асс. кафедры СМК Воробьева Т.А.. Программное обеспечение (ПО) - комплекс программ, обеспечивающих обработку или передачу данных, а также предназначенных.
Словообразовательная разметка Национального корпуса русского языка: задачи и методы М.Г.Тагабилева, Ю.Н.Березуцкая.
Навигационная Система По Информационным Ресурсам Государственной Системы Научно – Технической Информации Технологические аспекты
Опыт реализации отказоустойчивого сервера приложений и хранилища данных на базе СУБД ЛИНТЕР Михаил Ермаков, Дмитрий Мухоедов, РЕЛЭКС.
Комплексная технология автоматической классификации текстов ИПИ РАН Васильев В.Г.
Опыт создания сайта с целью сохранения и популяризации литературного наследия М. А. Светлова Лариса Мариановна Сергунина главный библиотекарь Отдела информационных.
ИС «Командировки» ГОУ ВПО «Саратовский государственный университет имени Н.Г. Чернышевского» Вычислительный центр СГУ.
Электронные формы использования результатов интеллектуальной деятельности в Концепции совершенствования четвертой части Гражданского кодекса Калятин В.О.,
Моделирование поведения взаимодействующих агентов в среде с ограничениями Юданов А.А., студент 525 гр. Научный руководитель: к.ф.-м.н. Бордаченкова Е.А.
SMS как средство взаимодействия пользователя и системы Алексей Каленюк ведущий проектировщик.
Особенности использования и обеспечения сохранности цифровых документов библиотечного фонда.
Использование ресурсов КМ-школы в процессе самоподготовки учащихся Найденова Татьяна Николаевна Заместитель директора по УВР, МОУ школа 70.
СОДЕРЖАНИЕ В данной презентации содержится Руководство пользователя по работе книгами«Университетской библиотеки онлайн» 1.Содержание 2.Каталог 3.Справочники.
РАЗВИТИЕ ЭЛЕКТРОННО- БИБЛИОТЕЧНОЙ СИСТЕМЫ НГТУ. ИНТЕГРАЦИЯ. АНАЛИЗ ВЗАИМОДЕЙСТВИЙ. Вагнер В. В. зав. отделом электронных ресурсов.
Транксрипт:

Проект общедоступного многопользовательского корпуса Проблемы и перспективы Дмитрий Грановский

Зачем ещё один? У существующих корпусов: Авторские права –На текст –На разметку Административные ограничения Недоступна сама разметка

Что будет уметь? Просмотр и редактирование разметки (многопользовательский) Возможность скачивания в разных форматах Встроенный поиск по популярным запросам Обработка «тяжёлых» запросов

Кто будет делать? Техническая часть – группа разработчиков Наполнение – пользователи

Откуда брать тексты? Тексты с истекшим авторским правом Тексты, на которые авторское право не распространяется Тексты под свободной лицензией (e.g. Википедия) Остальное – по договорённости с правообладателем

Задачи инструментария 1. Редактирование 2. Хранение 3.Поиск

Как можно использовать? Статистические исследования Машинное обучение (как обучающий корпус) Тестовый корпус для других ресурсов

Проблемы Почему эта модель доступа должна работать? Как обеспечить совместную работу многих людей? (многопользовательский) Как обеспечить целостность данных?

Проблемы Откуда взять столько квалифицированных редакторов? Как бороться с ошибками редактирования? Как не делать разметку с нуля? Как унифицировать разметку?

Ваши вопросы

СПАСИБО! Дмитрий Грановский