VoiceBase.com распределенное приложение на платформе Amazon Cloud Докладчик: Лаухин Роман ООО «Кварт-Софт»
Цели проекта Индексированный поиск по голосовому контенту (транскрипции) Создание транскрипций для звукового контента (voice) Хранение контента Предоставление публичного доступа к контенту и его транскрипции
Пользователь может: Загрузить аудио или видео файл (voice) Искать контент среди своих и публичных записях.
Home page
Upload files
Record audio/video
Search
Application services Web сервер (apache/nginx) База данных (mysql) Запись аудио/видео (Adobe FMS) Полнотекстовый поиск (sphinx) Конвертация файлов (ffmpeg) Транскрибирование (dragon, nexiwave, human)
Web сервер EC2 instances Amazon EC2 Internet User Load Balancer Apache
Ресурсы Web application RDS Sphinx S3 Cloud Front Adobe FMS
Процессы Загрузка файлаПеремещение на S3 Преобразование в единый формат ТранскрибированиеИндексированиеПоказ на сайте
Загрузка на S3 Пользователь загрузил файл Web UI Задание на загрузку файла Gearman Загрузка файла на S3 Отправка задания на конвертацию (SQS) SQS
Конвертация и транскрибирование Конвертация файла Загрузка на S3 Задание на транскрибирование SQS Транскрибирование Задание на преобразование формата транскрипции SQS Подготовка транскрипции Сохранение транскрипции на S3 SQS
Общая схема SQS Web сервера Cервера с ffmpeg Сервера с dragon
Amazon management console
Обновление (ffmpeg, dragon ) Остановка избыточных серверов Обновление ПОСоздание эталонного AMI
Сервисы от Amazon EC2 – Linux/Windows сервера (Web, ffmpeg, dragon, sphinx) – Cервера «по требованию» (spot instances) – Load balancer – Создание AMI – EBS – Elastic IP
Сервисы от Amazon S3 CloudFront RDS
Вопросы?
Материалы / html / html
Спасибо за внимание! Контакт: Skype: r.laukhin