Лекция «Модели информационных потоков» ЛАНДЭ Д.В., д.т.н., профессор НТУУ «КПИ», ведущий научный сотрудник ИПРИ НАН Украины Летняя школа Компьютерной лингвистики.

Презентация:



Advertisements
Похожие презентации
© ElVisti Лекция 6 Математические модели информационных потоков Дмитрий Владимирович ЛАНДЭ МЕЖДУНАРОДНЫЙ СОЛОМОНОВ УНИВЕРСИТЕТ.
Advertisements

Лекция «Элементы фрактального анализа информационных потоков» ЛАНДЭ Д.В., д.т.н., профессор НТУУ «КПИ», ведущий научный сотрудник ИПРИ НАН Украины Летняя.
Лекция «Самоподобие в информационном пространстве» ЛАНДЭ Д.В., д.т.н., профессор НТУУ «КПИ», ведущий научный сотрудник ИПРИ НАН Украины Летняя школа Компьютерной.
Синергетика и компьютерное моделирование. Игра «Жизнь» Один из подходов к моделированию процессов самоорганизации – «клеточные автоматы» – появился благодаря.
ИНФОРМАЦИОННЫЕ ПОТОКИ В ВЕБ - ПРОСТРАНСТВЕ И СОЦИАЛЬНО - ПРАВОВОЕ МОДЕЛИРОВАНИЕ Дмитрий Владимирович ЛАНДЭ, доктор технических наук, член-корреспондент.
ДИНАМИЧЕСКИЕ ЭКОНОМЕТРИЧЕСКИЕ МОДЕЛИ. Опр. Эконометрическая модель является динамической, если в данный момент времени она учитывает значения входящих.
ФАКТОРЫ СЕТЕВОЙ МОБИЛИЗАЦИИ А.Г. Додонов, Д.В. Ландэ Институт проблем регистрации информации Национальной Академии наук Украины XII международная научно-практическая.
Марковские процессы. Понятие случайного процесса Понятия: Cостояние Переход Дискретный случайный процесс Непрерывный случайный процесс.
Различные подходы к измерению информации
Модели теории логистики Модель «точно в срок». Аналитическая модель Профессор А. А. Смехов впервые рассматривает модель доставки грузов «точно в срок»,
MegaLing'2011 Горизонты прикладной лингвистики и лингвистических технологий MegaLing'2011 Горизонты прикладной лингвистики и лингвистических технологий.
Лекция 5. Модели надежности программного обеспечения Учебные вопросы: 1. Классификация моделей надежности 2. Аналитические модели надежности 3. Эмпирические.
Точность оценок случайных величин. Определение термина Случайная величина: в теории вероятностей, величина, принимающая в зависимости от случая те или.
ИНФОРМАЦИОННАЯ ЧУВСТВИТЕЛЬНОСТЬ КОМПЬЮТЕРНЫХ АЛГОРИТМОВ И ЕЁ КОЛИЧЕСТВЕННЫЕ МЕРЫ д.т.н., профессор М.В. Ульянов Кафедра «Управление разработкой программного.
В общем виде вероятностный ( стохастический ) автомат ( англ. probabilistic automat) можно определить как дискретный потактный преобразователь информации.
Нормальное распределение Тема 1. Вопросы для обсуждения 1.Случайная величина и ее распределение 2.Математическое ожидание и его оценка 3.Дисперсия и ее.
Математические модели Динамические системы. Модели Математическое моделирование процессов отбора2.
Метод выявления неявных связей объектов Снарский А.А., Ландэ Д.В., Женировский М. И. НТУУ «Киевский политехнический институт», Информационный центр «ЭЛВИСТИ»,
Лекция 9. Расчет газовых течений с помощью газодинамических функций,, Рассмотрим газодинамические функции, которые используются в уравнениях количества.
Тема 2 Основные подходы к построению математических моделей систем Дисциплина «Имитационное моделирование экономических процессов» Специальность
Транксрипт:

Лекция «Модели информационных потоков» ЛАНДЭ Д.В., д.т.н., профессор НТУУ «КПИ», ведущий научный сотрудник ИПРИ НАН Украины Летняя школа Компьютерной лингвистики 5-11 июля 2011 г.

Модели информационных потоков Общий характер временной зависимости числа тематических публикаций в сети определяется закономерностями, которые целиком допускают построение математических моделей. Модель, аналогичная модели Бартона-Кеблера, учитывает статическую и динамическую составляющие от общих объемов сообщений по заданной тематике с учетом старения информации: v(T) = 1 – ae -T – be -2T.. Летняя школа Компьютерной лингвистики 5-11 июля 2011 г.

Баланс тем Летняя школа Компьютерной лингвистики 5-11 июля 2011 г. Организации-генераторы новостной информации в производят поток информации, в среднем постоянный по количеству сообщений. Изменяются во времени лишь объемы сообщений, которые соответствуют той или другой теме. Таким образом, рост количества публикаций по одной теме сопровождается уменьшением публикаций по другим темам: где n i (t) – количество публикаций в единицу времени, а M – общее количество всех возможных тем.

Линейная модель В некоторых случаях динамика тематических информационных потоков реализуется линейно, то есть количество сообщений в момент времени t можно представить формулой: y(t) = y(t 0 ) + v(t - t 0 ), где y(t) – количество сообщений на время t, v – середняя скорость увеличения (уменьшения) интенсивности тематического информационного потока во времени. Летняя школа Компьютерной лингвистики 5-11 июля 2011 г.

Флюктуация информационного потока Содержательная составляющая информационного потока может быть оценена как флюктуация информационного потока – изменение стандартного отклонения (t): В случае поведения стандартного отклонения (t) t, то чем большее значение, тем выше корреляция между текущими и предыдущими сообщениями. В этих случаях характеризует степень связи между случайными событиями и принимает значение от ½ до 1. Летняя школа Компьютерной лингвистики 5-11 июля 2011 г.

Примеры Летняя школа Компьютерной лингвистики 5-11 июля 2011 г. Динамика количества откликов на запрос «семантическ*» Динамика появления документов в информационном потоке, содержащих слово «масон»

Экспоненциальная модель В некоторых случаях процесс увеличения (роста) количества тематических сообщений в информационном потоке описывается экспоненциальной зависимостью, которую можно аппроксимировать такой формулой: где - среднее относительное изменение интенсивности информационного потока. Летняя школа Компьютерной лингвистики 5-11 июля 2011 г.

Относительное изменение интенсивности В реальности актуальность тематики является дискретной величиной, измеряемой в моменты времени которая лишь аппроксимируется приведенной выше зависимостью. В рамках данной модели справедливо: Откуда: Введем обозначение: - относительное изменение интенсивности тематического информационного потока в момент времени и прологарифмируем приведенное выше уравнение: Относительное изменение интенсивности на практике также часто вычисляется как соотношение: Летняя школа Компьютерной лингвистики 5-11 июля 2011 г.

Флюктуация величины λ Летняя школа Компьютерной лингвистики 5-11 июля 2011 г.

Примеры Летняя школа Компьютерной лингвистики 5-11 июля 2011 г. Посуточный график появления сообщений, содержащих термин «блог» Помесячный график в полулогарифмической шкале появления сообщений, содержащих термин «блог»

Логистичекая модель Летняя школа Компьютерной лингвистики 5-11 июля 2011 г. Pierre-François Verhulst В.И. Арнольд

Логистическое уравнение Летняя школа Компьютерной лингвистики 5-11 июля 2011 г.

Логистическая модель: примеры Летняя школа Компьютерной лингвистики 5-11 июля 2011 г. Динамика объемов публикаций в Интернет по тематике болезни и отхода от деятельности известного политического деятеля Динамика объемов публикаций в Интернет с упоминанием фамилии сенсационно избранного мэра большого города (до выборов и после)

Клеточные автоматы. Моделирование Летняя школа Компьютерной лингвистики 5-11 июля 2011 г. Разнообразие поведения публикаций по различным тематикам и сложность взаимного влияния различных публикаций заставляют искать новые, ранее неизвестные в этой области методы. По-видимому, на данном этапе в области моделирования сложных информационных процессов успех может быть достигнут лишь путем синтеза достаточно простых алгоритмов и концепций. Перспективными в этой области можно признать теорию клеточных автоматов, впервые предложенную более тридцати лет тому назад Дж. фон Нейманом и развитую С. Уолфрамом в фундаментальной монографии.

Клеточные автоматы Летняя школа Компьютерной лингвистики 5-11 июля 2011 г. Клеточный автомат представляет собой дискретную динамическую систему, совокупность одинаковых клеток, образом соединенных между собой. Состояние каждой клетки определяются состоянием клеток, входящих в ее локальную окрестность. Состояние j-го клеточного автомата в момент времени t + 1, таким образом, определяется следующим образом: y j (t+1) = F(y j (t), O(j), t), где F – некоторое правило, O(j) – окрестность, t - такт. Клеточные автоматы удовлетворяют таким правилам: изменение значений всех клеток происходит одновременно (единица измерения времени – такт); сеть клеточных автоматов является однородной, т.е. правила изменения состояний для всех клеток одинаковы; на клетку могут повлиять лишь клетки из ее локальной окрестности; множество состояний клетки конечно.

Модель диффузии информации Летняя школа Компьютерной лингвистики 5-11 июля 2011 г. Динамике распространения информации присущи некоторые свойства, которые были учтены в модели. Предполагается, что клетка может быть в одном из трех состояний: 1 – «свежая новость» (клетка окрашивается в черный цвет); 2 – новость, устаревшая, но сохраненная в виде сведений (серая клетка); 3 – клетка не имеет информации, переданной новостным сообщением (клетка белая, информация не дошла или уже забыта). Правила распространения новостей следующие: изначально все поле состоит из белых клеток за исключением одной – черной, которая первой «приняла» новость; белая клетка может перекрашиваться только в черный цвет или оставаться белой; белая клетка перекрашивается, если выполняется условие: pm > 1, p – вероятность «принятия информации», m – количество «проинформированных» соседей; если клетка черная, а вокруг нее исключительно черные и серые, то она перекрашивается в серый; если клетка серая, а вокруг нее исключительно серые и черные, то она перекрашивается в белый цвет.

Процесс эволюции Летняя школа Компьютерной лингвистики 5-11 июля 2011 г.

Динамика количества клеток Летняя школа Компьютерной лингвистики 5-11 июля 2011 г. Белые клетки - ( ); серые клетки - ( ); черные клетки – ( )

Аналитическое моделирование Летняя школа Компьютерной лингвистики 5-11 июля 2011 г.

Динамика реальных информ- потоков Летняя школа Компьютерной лингвистики 5-11 июля 2011 г.

Динамика реальных информ- потоков Летняя школа Компьютерной лингвистики 5-11 июля 2011 г. Динамика понятия «ЦВК, БЮТ, регистрация, но не референдум» Динамика понятия «четвертый указ», в системе интеграции новостей InfoStream

СПАСИБО ЗА ВНИМАНИЕ! Ландэ Д.В., Летняя школа Компьютерной лингвистики 5-11 июля 2011 г.