Автоматизированная система учета расходования личных средств Фомин Алексей Дмитриевич 545 группа Научный руководитель: к. ф.-м. н. Д.С. Шалымов САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ Математико-механический факультет Кафедра Системного Программирования
Идея проекта Учет расходов – актуальная задача Проблема ввода данных – Решение – использование кассовых чеков Необходимо распознавание информации o Со стороны сервера o На клиентской стороне
Архитектура системы учета расходов Распознаватель Данные Сервер Данные
Задача Проверка применимости схемы Проектирование системы извлечения данных из чеков Разработка алгоритма распознавания на основе SPSA Реализация прототипа под платформу iOS
Распознавание текста Существующие решения: Tesseract-ocr ABBYY … Требования: Мобильность Доступность
Общая схема Итоговая сумма рублей...
Обработка изображения
Фрагментация
Распознаватель Построение вектора признаков (1, 2, 2, 0.3, 0,5, …)
Распознаватель Классификация - SPSA Особенности метода: Помехоустойчивый Адаптивный Устойчивый к увеличению размерности пространства
Извлечение данных Использование словаря Корректировка стоимости: «лишние» символы: *, =, Наименование валюты: «100.00РУБ»
Архитектура приложения Engine Image ProviderPrior Modifier Segmentator Vocabulary Provider Data Grabber … Numeric Recognizer Character Recognizer
Результаты Реализован алгоритм распознавания на основе SPSA Построена схема извлечения данных Создан прототип под iOS