Опыт реализации системы контентной фильтрации Интернет-ресурсов на базе технологий АРИОН.

Презентация:



Advertisements
Похожие презентации
Поиск и сбор информации о персонах и организациях в сети Интернет Хлестов Михаил, системный аналитик ООО «САЙТЭК»
Advertisements

Информационно- поисковая система «Архив документов»
Формализация предметной области при обработке фактографической информации А.В. Босов ИПИ РАН Д.В. Краюшкин ООО «САЙТЕК»
ОТЧЕТ ПО ИСПОЛНЕНИЮ I ЭТАПА ГОСУДАРСТВЕННОГО КОНТРАКТА ОТ Развитие системы коммуникационного сопровождения процессов развития.
+7 (495) Эргономичный интерфейс Эффективный поиск Удобная работа с результатами поиска Профессиональные возможности Персональные.
Интеллектуальная система поиска. Огромные объёмы библиотечных информационных ресурсов Библиографическая информация Книжные фонды Научная литература Периодические.
Окно поискового робота. Добавление нового источника Аналогично можно добавить новый запрос к поисковым системам (поставив галочку Запрос)
Автоматизированная система нормативно- правовой документации (АСНПД) на базе «1 С:Предприятие»
+7 (495) Эргономичный интерфейс Эффективный поиск Удобная работа с результатами поиска Профессиональные возможности Персональные.
Информационно- поисковые машины и системы.. Поисковая машина комплекс программ, предназначенный для поиска информации. Обычно является частью поисковой.
Поиск информации в ИНТЕРНЕТЕ Для слушателей курсов. ХалкечеваЛ.В.
Автоматизация деятельности архивной отрасли Система «АРХИВНЫЙ ФОНД» (версия 4.1) Управление государственной архивной службы Новосибирской области 2010.
Ачинский район, 2010 г. Районный конкурс педагогических работников – молодых специалистов «ПОЗИТИВ» Богданова Дарья Вячеславовна, учитель информатики МОУ.
Бренд мониторинг и социальная аналитика
Информационно-поисковая система. Классификация информационно- поисковых систем.
Реализация концепции построения и формирования отраслевой системы государственного учета, регистрации и мониторинга (ОСГУРМ) информационных ресурсов сферы.
, Москва Контроль над имуществом ®ICON3-PG.
Учитель информатики МОУ СОШ 14 с. Новопаньшино Меньшикова Татьяна Николаевна.
Предпосылки создания ИАС АСТАРТА Высокая потребность в оперативной информации для принятия управленческих решений Необходимость проведения исследований.
Дополнительные справочники СПС. Выделим три основные возможности программных технологий справочно-правовых систем 1. хранение и обработка больших объемов.
Транксрипт:

Опыт реализации системы контентной фильтрации Интернет-ресурсов на базе технологий АРИОН

Принципы контентной фильтрации 1. Эффективная контентная фильтрация обеспечивается глубоким анализом текстового содержимого Интернет-ресурсов 2. Релевантный поиск и проблемный анализ содержимого Интернет-ресурсов должен выполняться специальным программно-аппаратным комплексом 3. Задача комплекса – формирование и «веерное» распространение базы данных запрещенных ресурсов для их последующего блокирования 4. Ресурсы, относящиеся к запрещенной тематике, должны быть классифицированы в соответствии с их информационной направленностью 5. Для каждой категории пользователи может задаваться свой перечень запрещенных классов ресурсов

Платформа – ИАС «АРИОН»

Ключевые технологии 1. Автономный поиск и автоматическая загрузка текстового содержания ресурсов Интернета 2. Фактографический разбор и тональный анализ текстов на естественном языке 3. Анализ и классификация ресурсов с использованием полнотекстового и фактографического режимов

Концептуальная схема

Аналитическая часть

Сбор информации - Краулер Назначение поиск в Интернете ресурсов по заданным критериям Основные возможности автономный переход по ссылкам использование поисковых машин извлечение текста из различных форматов: txt, html, rtf, doc, pdf первичный анализ текстового содержимого (с помощью фильтров)

Сбор информации Интернет - ресурсы

Сбор информации Менеджер загрузки Свойства задачи

Назначение анализ текстового содержания найденных ресурсов Основные возможности Полнотекстовый отбор мощный язык запросов учет морфологии поддержка синонимов и опечаток Фактографический анализ графематический анализ морфологический анализ синтаксический анализ логико-семантический анализ Тональный анализ Модуль индексирования

Индексирование Список источников, загруженных в систему

Индексирование Текст источника с выделенными объектами (желтый цвет) и тональными маркерами (серый цвет)

Индексирование Карточка объекта

Назначение автоматическое рубрицирование ресурсов на основании выполненного анализа Способы рубрицирования анализ характерных слов и выражений (полнотекстовый поиск). анализ описываемых ситуаций (фактографический поиск) анализ отношения автора текста к предмету (анализ тональности высказываний) Модуль рубрикации

Запросы рубрикации

Рубрикация на основе полнотекстового поиска Текст запроса рубрикации

Рубрикация на основе полнотекстового поиска Дерево рубрик Список источников рубрики «Сайты обществ и движений, выступающих за легализацию наркотиков»

Запросы рубрикации

Рубрикация на основе фактографического поиска Критерии отбора источников в рубрику «Акции против наркотиков» и текстовых документов в рубрику «Акции против наркотиков» (документы)

Рубрикация на основе фактографического поиска Результаты запроса - источники и текстовые документы

Рубрикация на основе фактографического поиска Список найденных документов

Рубрикация на основе фактографического поиска Список найденных источников

Рубрикация на основе фактографического поиска Список источников, добавленных в рубрику «Акции против наркотиков»

Запросы рубрикации

Рубрикация на основе тональности высказываний Выбор пакетов правил тональностей Режим редактирования запроса

Рубрикация на основе тональности высказываний Критерии запроса для отбора «Умеренно негативных источников» и «Крайне негативных источников»

Рубрикация на основе тональности высказываний Результаты запроса - негативные и крайне негативные источники

Рубрикация на основе тональности высказываний Список источников, добавленных в рубрику «Умеренно негативные источники»

Шаблон «Статистика мониторинга» Категории выборки Период выборки

Список запрещенных ресурсов Формирование и выгрузка списка запрещенных ресурсов

Формирование списка запрещенных ресурсов Критерии запроса для формирования списка запрещенных ресурсов

Формирование списка запрещенных ресурсов

Печатная версия списка запрещенных ресурсов

Заключение Технологии ИАС «АРИОН» в рамках системы контентной фильтрации Интернет-ресурсов обеспечили решение следующих задач: Сбор и загрузка текстового содержания искомых ресурсов Интернета Анализ и классификация ресурсов с использованием полнотекстового и фактографического режимов Тональный анализ текстов на естественном языке Формирование списка запрещенных ресурсов

Адрес: , Россия, Москва, Электролитный проезд, дом 5Б, строение 8 Телефон: +7 (495) Факс: +7 (499) Электронная почта: Web: Контактная информация