Мультимедийные корпуса Семинар по идишу Ольга Созинова
Список корпусов 1. НКРЯ, мультимедийный корпус 2. CHILDES Transcript Browser (Child Language Data Exchange System) 3. National Center for Sign Language and Gesture Resources (NCSLGR) corpushttp://secrets.rutgers.edu/dai/queryPages/querySelection.php 4. Corpus Project in Colloquial Japanese Sign Languagehttp://research.nii.ac.jp/jsl-corpus/en/ 5. Диалектологический корпус (Архангельская обл., д.Михалевская) 6. Scottish Corpus Of Texts & Speechhttp:// 7. BACKBONE Pedagogic corpora for content & language integrated learninghttp://webapps.ael.uni-tuebingen.de/backbone-search/faces/search.jsp 8. English Language Interview Corpus as a Second-Language Applicationhttp:// 9. Spanish Learner Language Oral Corporahttp:// French Learner Language Oral Corporahttp://
1. НКРЯ, мультимедийный корпус Написан на JavaScript Видео в формате *.flv, проигрыватель: Yandex Player Есть возможность скачать видео в *.mp4 Выдача большая: преконтекст, пост контекст Нет синхронизации видео с текстом Как и в основном корпусе НКРЯ – морфологическая разметка, мощный поиск
1. НКРЯ, мультимедийный корпус Возможность задать речевые действия и жесты: – количество говорящих в клипе; – социальная ситуация, отраженная в клипе; – типы речевых действий; – ориентация ладони; – направление движения; – многое другое
1. НКРЯ, мультимедийный корпус Запрос: ехать + речевое действие: вопрос к самому себе
2. CHILDES Transcript Browser Записи детской речи Есть материалы с аудио, видео и просто текст Материалы с видео: – Проигрыватель QuickTime Plug-in – Текст с пронумерованными строчками, синхронизация видео с текстом Поиск при помощи особого языка команд CLAN. Разработано именно для этого проекта.
2. CHILDES Transcript Browser Страница примера
3. National Center for Sign Language and Gesture Resources (NCSLGR) corpus Корпус жестов Поиск по разным свойствам жестов, чекбоксы В выдаче таблица с названиями жестов и именами людей, в пересечении – ссылка на видео с жестом и видео с контекстом Поисковая страница – PHP, также использован JavaScript Видео – JW Player (очень классный!)
3. National Center for Sign Language and Gesture Resources (NCSLGR) corpus Страница выдачи
3. National Center for Sign Language and Gesture Resources (NCSLGR) corpus Видео в всплывающем окне
4. Corpus Project in Colloquial Japanese Sign Language Безумно красивый сайт с Flash-вставками
4. Corpus Project in Colloquial Japanese Sign Language Но совсем нет никакого поиска – просто 2 базы данных жестов Страница «What is your sign for?»
4. Corpus Project in Colloquial Japanese Sign Language Видео в всплывающем окне с аннотацией Красиво, но написано на Flash -> долго грузится
5. Диалектологический корпус (Архангельская обл., д.Михалевская) Поиск с CQP-запросами Выдача аудио и текста (контекст + выделено цветом искомое) Синхронизации с текстом нет, аудио выдается только с контекстом PHP, XML
5. Диалектологический корпус (Архангельская обл., д.Михалевская) Страница выдачи
6. Scottish Corpus Of Texts & Speech Простой поиск (слово/фраза, автор, тип текста – устный или письменный, и т.д.) PHP, JavaScript Аудио – всплывающее окно в QuickTime, возможность синхронизации с текстом Возможность просмотреть только простой текст и скачать его; также можно скачать аудиофайл
6. Scottish Corpus Of Texts & Speech Страница выдачи
6. Scottish Corpus Of Texts & Speech Страница примера
6. Scottish Corpus Of Texts & Speech Всплывающее окно с аудио
7. BACKBONE Pedagogic corpora for content & language integrated learning search/faces/search.jsp search/faces/search.jsp Видео-интервью с носителями 6 языков Поиск по категориям (база данных), co- occurrence, concordance (но выдача только текстовая) Аудио и видео только скачивать (несмотря на надпись Play), формат *.wvx JavaScript
7. BACKBONE Pedagogic corpora for content & language integrated learning search/faces/search.jsp search/faces/search.jsp Страница выдачи
7. BACKBONE Pedagogic corpora for content & language integrated learning search/faces/search.jsp search/faces/search.jsp Всплывающее окно с аннотацией
8. English Language Interview Corpus as a Second-Language Application (ELISA) Интервью с носителями английского языка Похож на BACKBONE Для каждого интервью можно просмотреть простой текст, XML, частотные списки слов Видео только скачивать (формат *.smil)
8. English Language Interview Corpus as a Second-Language Application (ELISA) Страница с интервью
9, 10. Spanish Learner Language Oral Corpora French Learner Language Oral Corpora Корпуса для исследований французского и испанского языков как L2 Использованы технологии CHILDES (Child Language Data Exchange System) Поиск простой, по параметрам (корпус, тип задания – general chat, story recall, etc.) Аудио открывается в том же окне JavaScript
9, 10. Spanish Learner Language Oral Corpora French Learner Language Oral Corpora Страница выдачи