Скачать презентацию
Идет загрузка презентации. Пожалуйста, подождите
Презентация была опубликована 11 лет назад пользователемgenes1s.net
1 Решение для автоматизированной обработки клиентских данных Вы приобретаете высокотехнологичный, конкурентный IT-продукт за меньшие деньги
2 О нашей компании GENES1S intellectual solutions Мы сочетаем в своей работе большой опыт разработки программных продуктов и использование современных технологий проектирования. В нашем штате работают признанные специалисты в области теории алгоритмов, архитектуры и разработки программного обеспечения, статистического анализа данных, а также дизайна интерфейсов.
3 Проблема качества клиентских данных Одной из наиболее серьёзных проблем, возникающих при обработке больших клиентских реестров, является низкое качество содержащихся в них данных. Ошибки в реестрах обычно возникают в силу стечения двух обстоятельств: 1)действия человеческого фактора (ошибки, допускаемые операторами при вводе информации); 2)несовершенства информационной системы, не производящей валидацию данных на этапе их ввода. К наиболее распространённым проблемам качества клиентских данных относятся: 1)ошибки в записи адресов, в т.ч. хранение адреса в виде одного строкового поля при отсутствии единого принципа форматирования адреса; 2)ошибки в записи телефонов (устаревшие коды, отсутствие единого форматирования); 3)ошибки в ФИО клиента, в т.ч. Хранение ФИО в виде одного строкового поля; 4)ошибки при указании пола клиента.
4 Проблема качества клиентских данных Качество клиентских данных является базовым требованием при выполнении любых операций с реестром, начиная от рассылки уведомлений и заканчивая статистической обработкой данных. Кроме того, при импорте сторонних реестров в базу данных компании, может потребоваться разделение адресного поля или поля ФИО на составляющие. Ручное редактирование клиентских данных весьма трудоёмкая задача, которая не только требует существенных затрат средств и времени, но, кроме того, не гарантирует достижения необходимого результата. Например, редактирование адреса требует не только правильного выделения его составляющих, но и проверки его валидности при помощи КЛАДР (государственного реестра адресов). При этом неоднозначности в записи адреса могут потребовать многократных обращений к КЛАДР, что ещё более замедляет и усложняет процесс редактирования.
5 Описание продукта Пакет CLEANUPDATA TM представляет собой набор компонентов для автоматического и полуавтоматического исправления ошибок в пакетах клиентских данных. CLEANUPDATA TM включает в себя компоненты для интеллектуального анализа и исправления полей адресов, телефонов, ФИО и других типичных компонентов клиентских данных. Эвристические алгоритмы, используемые системой, позволяют автоматически разбирать подавляющее большинство записей даже в случае их крайне низкого качества, что делает CLEANUPDATA TM лучшим решением в этой области, доступным на российском рынке. CLEANUPDATA TM также включает в себя модули для автоматического преобразования структур данных для случаев, когда необходимо импортировать сторонний реестр в базу данных фирмы.
6 Примеры работы модуля разбора адресов 1. Исходная строка адреса: «г. Москва, ул.Советская, д.1, кв.4». 2. Исходная строка адреса: «Москва, Советская, 1-4» 3. Исходная строка адреса: «МО,Москва, Совецкая, 1кв4». 4. Исходная строка адреса: «МосьКВА ул.Соевтская, 1-4». 5. Исходная строка адреса: «Россия. Моск.обл., Москва, Советская ул. д.1-4». 6. Исходная строка адреса: «М.О.,,г. Москва, УЛ. СОВЕТСКАЯ 1 4». 7. Исходная строка адреса: «гМосква, улСоветская, 1, 4». 8. Исходная строка адреса: «Москва, неопределен, Советская д1кв4». Результат работы парсера для любой из вышеперечисленных строк: ЭлементЗначение Почтовый индекс Регионг. Москва Район НП-1 (город) НП-2 (село) Улицаул. Советская Домд. 1 Квартиракв. 4 Статус разбораОК
7 Примеры работы модуля разбора адресов 9. Исходная строка адреса: «ЗЕЛЕНОГРАД ». Некоторые населенные пункты имеют специфическую нумерацию зданий. Например, в г. Зеленоград большая часть домов не относится к какой-либо улице, а вместо номера дома имеют только номер корпуса. Система обладает необходимыми знаниями для правильной обработки таких специфических ситуаций. Результат работы парсера: ЭлементЗначение Почтовый индекс Регионг. Москва Район НП-1 (город)г. Зеленоград НП-2 (село) Улица Домк Квартиракв. 9 Статус разбораОК
8 Примеры работы модуля разбора адресов 10. Исходная строка адреса: «Неопределен, Калининец, Центральная ул в/ч61896, 1». Типичной ситуацией является использование слов «неопределен», «отсутствует», «NULL», «UNDEF», а также прочерков вместо какого-либо отсутствующего элемента адреса. Кроме того, адрес может содержать указание воинской части, в то время, как КЛАДР, не содержит в себе адресов воинских частей. Даже в такой сложной ситуации парсер в состоянии решить проблему разбора: Результат работы парсера: ЭлементЗначение Почтовый индекс РегионМосковская обл. РайонНаро-Фоминский р-н НП-1 (город) НП-2 (село)п. Калининец-1 Улица Домд. 1 Квартира Статус разбораОК
9 Примеры работы модуля разбора адресов 11. Исходная строка адреса: «Летчика Бабушкина, 2-12». В ряде случаев в адресе могут отсутствовать некоторые обязательные элементы. Поскольку парсер использует КЛАДР, он в состоянии, например, определить, что улица Лётчика Бабушкина есть только в одном городе России, а именно, в Москве. Результат работы парсера: ЭлементЗначение Почтовый индекс Регионг. Москва Район НП-1 (город) НП-2 (село) Улицаул. Летчика Бабушкина Домд. 2 Квартиракв. 12 Статус разбораОК
10 Примеры работы модуля разбора адресов 12. Исходная строка адреса: «ул.Советская, 2-1». В некоторых ситуация отсутствие необходимых частей адреса не позволяет однозначно его идентифицировать. В таких случаях адресу присваивается статус «Ambiguous» (неоднозначный), а в качестве элементов адреса выдаются элементы соответствующие региону с наибольшим населением (что максимизирует вероятность «угадывания» адреса). Приоритеты регионов могут быть изменены в соответствие с настройками. Результат работы парсера: ЭлементЗначение Почтовый индекс Регионг. Москва Район НП-1 (город) НП-2 (село) Улицаул. Советская Домд. 2 Квартиракв. 1 Статус разбора Ambiguous
11 Примеры работы модуля разбора адресов 13. Исходный адрес «На деревню дедушке Василию Макаровичу». Конечно, бывают ситуации, в которых искусственный интеллект бессилен. В таких ситуациях парсер присваивает адресу статус «ParseError» (ошибка разбора), а также сообщает некоторые детали в отношении произошедшей ошибки: Результат работы парсера: ЭлементЗначение Почтовый индекс Регион Район НП-1 (город) НП-2 (село) Улица Дом Квартира Статус разбора ParseError («Unrecognized string token: На»)
12 Обработка плохих адресов Те адреса, которые не были успешно разобраны системой, могут быть обработаны вручную с помощью удобного интерфейса, позволяющего не только вручную модифицировать отдельные компоненты адреса, но и внести необходимое изменение в исходную строку, а затем повторно вызвать парсер для её разбора. Такой подход позволяет существенно снизить трудозатраты на разбор испорченных адресов. Форма для ручного редактирования адреса может быть добавлена в вашу информационную систему нашими специалистами на этапе интеграции. В некоторых случаях парсер в состоянии однозначно определить, что адрес испорчен и не подлежит восстановлению. Например, если строка не содержит ни одного значащего идентификатора (пуста или содержит только числа и знаки препинания). Выбраковка таких адресов также позволяет сэкономить время, затрачиваемое на ручную обработку адресов, не разобранных парсером.
13 Примеры работы модуля разбора телефонов 1. Исходная строка « ». 2. Исходная строка «(495) ». 3. Исходная строка «8 (095) ». 4. Исходная строка «8 (095)(985) ». 5. Исходная строка «8 ( 0495) ». 6. Исходная строка «Контактный телефон: 8 (495) ». 7. Исходная строка « ». 8. Исходная строка «Звоните по номеру (7495) ». Результат работы парсера для любой из перечисленных строк: ЭлементЗначение Номер телефона Код495 Регионг. Москва ОператорМГТС Тип телефонаГородской Статус разбораОК Примечания
14 Примеры работы модуля разбора телефонов 9. Исходный телефон «8 (495) ». В ряде городов России в разное время производились замены телефонных номеров. Модуль разбора телефонов содержит в себе базу данных подобных изменений. Поскольку приведенный нами номер может соответствовать как номеру, для которого была произведена замена, так и номеру, вновь выданному уже после замены, результат становится неоднозначным. Поэтому парсер, наравне с оригинальным номером, предлагает также другой вариант телефона : Результат работы парсера: ЭлементЗначение Номер телефона Код499 Регионг. Москва ОператорМГТС Тип телефонаГородской Статус разбораAmbiguous ПримечанияЗамена номеров XXXX на XXXX ( )
15 Резюме Результат работы парсеров может быть легко приведён к форме, необходимой для корпоративной информационной системы.
16 Импорт сторонних клиентских реестров Модули CLEANUPDATA TM могут быть использованы для организации импорта сторонних клиентских реестров в базу данных Компании. Данные исходного реестра преобразуются в XML-формат, который затем подвергается преобразованию при помощи XSLT в XML, соответствующий структуре базы данных Компании. Полученный XML десериализуется в коллекцию объектом ORM NHibernate/ActiveRecord, которая затем сохраняется в базу данных. При этом парсеры адресов, ФИО, телефонов и т.д. могут быть использованы как пользовательские функции при создании XSLT. CLEANUPDATA TM использует пакет Altova MapForce для визуального редактирования XSLT.
17 Импорт сторонних клиентских реестров Использование ORM позволяет легко адаптировать систему для работы с любой СУБД, используемой в вашей компании. При необходимости обеспечения экстремально высокой производительности при вставке данных в БД, CLEANUPDATA TM содержит в себе компоненты для осуществления пакетной вставки записей. Задача стыковки модулей импорта реестров с информационной системой компании достаточна проста и сводится в большинстве случаев к созданию ORM- мэппинга для конкретной структуры базы. Использование CLEANUPDATA TM позволяет организовать импорт сторонних клиентских реестров фактически без участия квалифицированных IT-специалистов, разгрузив IT-отдел компании от больших объёмов черновой работы.
18 Интеграция и сопровождение Модули CLEANUPDATA TM могут поставляться как в виде компонентов.NET, так и в виде SOAP-сервисов. Помимо поставки компонентов, наша компания предлагает следующие сопутствующие услуги: работы по интеграции компонентов в информационную систему вашей компании; разработка необходимых интерфейсов для ввода и обработки данных (включающих в себя механизмы автоматической валидации и быстрого ввода), в т.ч. на основе web; разработка на основе компонентов CLEANUPDATA TM системы для импорта пакетов данных в информационную систему вашей компании; расширение функционала системы в случае наличия специфических требований; организация обучения персонала вашей компании (в т.ч. IT-специалистов) особенностям работы с поставляемыми решениями; регулярное сопровождение и обновление поставляемых решений.
19 Другие решения нашей компании Наша компания также предлагает вашему вниманию следующие решения и услуги в сфере IT: пакет компонентов для автоматического поиска контактных телефонов физических лиц при помощи большого набора online и offline телефонных баз; услуги по разработке программного обеспечения с применением широкого спектра программных инструментов; в том числе с передачей исходных текстов и исключительных прав; услуги по статистическому анализу данных (data mining), созданию математических моделей для скоринга и прогнозирования; верстка и дизайн корпоративных сайтов, в т.ч. реализующих сложные сервисы для их посетителей; комплекс IT-решений для букмекерского бизнеса; консалтинг в области IT на единовременной или регулярной основе, в т.ч. помощь в организации подбора кадров, создании IT-инфраструктуры компании.
20 О нашей компании Основными направлениями деятельности компании ООО «Генезис» являются: разработка IT-решений для автоматизированной интеллектуальной обработки данных, data mining, а также консалтинг в сфере IT. Мы сочетаем в своей работе большой опыт разработки программных продуктов и использование современных технологий проектирования, практикуя гибкий и рациональный подход при взаимодействии с нашими клиентами, направленный на достижение максимального удобства для конечного пользователя. Мы готовы взяться за решение самых сложных задач и создать для вас простой и практичный программный инструмент. Наш сайт: Вы приобретаете высокотехнологичный, конкурентный IT-продукт за меньшие деньги
Еще похожие презентации в нашем архиве:
© 2024 MyShared Inc.
All rights reserved.