«Мир Тесен» по Джону Клайнбергу Мельников Иван Еремин Юрий.

Презентация:



Advertisements
Похожие презентации
Вероятностная НС (Probability neural network) X 1 X n... Y 1 Y m Входной слой Скрытый слой (Радиальный) Выходной слой...
Advertisements

Односторонние функции. Что такое криптография? Традиционный подход: как обеспечить секретность сообщения Алиса и Боб разговаривают, Ева пытается подслушать.
Выполнил: Горелов С.С. Под руководством: с.н.с. Афонин С.А., проф. Васенин В.А. Усечение пространства поиска в полуструктурированных данных при помощи.
ПРОВЕРКА СТАТИСТИЧЕСК ИХ ГИПОТЕЗ. Определение статистической гипотезы Статистической гипотезой называется всякое высказывание о генеральной совокупности.
Информационно-поисковые системы. Сычев А.В г. 1 Анализ гиперссылок при информационном поиске в Веб Воронежский государственный университет Факультет.
A b d c e Топология сетей Физическая топология сети - это конфигурация графа, вершинами которого является активное сетевое оборудование или компьютеры,
Задача построения расписания конфигураций с ограниченной глубиной узлов для беспроводных сенсорных сетей Евгений Наградов.
Задача построения расписания конфигураций с ограниченной глубиной узлов для беспроводных сенсорных сетей Евгений Наградов.
ВВЕДЕНИЕ В ВЫЧИСЛИТЕЛЬНУЮ МАТЕМАТИКУ Лекция 8 27 октября 2009 Методы решения нелинейных систем уравнений Задача интерполяции (гладкого восполнения функций)
Двусвязность Лекция 14. Связность компонент Граф G называется k-связным (k 1), если не существует набора из k-1 или меньшего числа узлов V` V, такого,
К созданию архитектуры поисковой системы в наборах документов. Горелов С.С. МГУ им. М.В. Ломоносова механико-математический факультет.
Теория графов Основные определения. Задание графов Графический способ – Привести пример графического задания графа, состоящего из вершин А, В и С, связанных.
ЗАДАЧА О МИНИМИЗАЦИИ ВРЕМЕНИ НА ВОССТАНОВЛЕНИЕ УДАЛЕННОЙ БИОМАССЫ.
Алгоритмы сканирования и обхода Лекция 3. Алгоритм сканирования графа Input: Орграф (граф) G и вершина s. Output: Множество R вершин, достижимых из s,
АЛГОРИТМЫ НАХОЖДЕНИЯ КРАТЧАЙШИХ ПУТЕЙ НА ГРАФАХ..
Виды Виды сетей Локальная сеть Региональная и Корпоративная сеть Глобальная сеть.
МОУ « Средняя общеобразовательная школа 14 с углубленным изучением отдельных предметов » авт. Кудимова Н. В.
Алгоритм приближённого joinа на потоках данных Выполнил : Юра Землянский, 445 группа Научный руководитель : Б.А. Новиков СПб, 2011 Санкт-Петербургский.
Система оптимизации цен на платформе Microsoft Azure Machine Learning spellabs.R- pricer.
Понятие о методах Монте-Карло. Расчет интегралов 2.5. Расчет интегралов методом Монте-Карло.
Транксрипт:

«Мир Тесен» по Джону Клайнбергу Мельников Иван Еремин Юрий

Краткое содержание 1. Введение 2. История 3. Сетевая модель 4. Сети, поддерживающие эффективный поиск 5. Выводы 6. Открытые вопросы 7. Ссылки

Введение Мир тесен тема анекдотических исследований и фольклора часто бывает, что мы встречаем незнакомца и оказывается, что у нас есть общий знакомый

задача поиска информации поведение пользователей Web поведение агентов поисковые протоколы (Gnutella, Freenet) Введение(2)

Эксперимент Стэнли Милграма проведенный в 1960х, остается одним из самых удачных в понимании проблемы человек из Небраски должен был передать письмо человеку, живущему в Массачусетсе шесть ступеней разделения людей в США

короткие пути в сетях знакомств существуют люди могут находить эти пути, зная только информацию о конечной цели Открытия Милграма

Исследования Пула и Кочена случайные сети имеют маленький диаметр если А и Б два индивидуума с общим другом, то скорее всего они сами друзья. НО, очень разветвленная сеть знакомств, не имеет малого диаметра

Модель Ватса и Строгатца балансирует между ограничениями разветвленности сети знакомств и диаметра сети пример - «сетчатый круг» простая структура, но при этом несколько ребер произведены случайным процессом, который эта структуры не описывает

Исследования Джона Клайнберга Почему незнакомые люди могут найти, соединяющую их короткую цепь знакомств? Существуют скрытые навигационные ключи, лежащие в социальной сети Децентрализованные алгоритмы

Открытия Джона Клайнберга существующих моделей недостаточно, чтобы объяснить успех децентрализованного алгоритма для одной из моделей класса обобщенных сетей Ватса и Строгатца существует децентрализованный алгоритм, способный находить короткие пути с большой вероятностью. существует уникальная модель в этом семействе, для которой децентрализованные алгоритмы эффективны.

Другие работы по теме как индивидуумы выбирают следующего адресата Бернард и Килворф : «обратные эксперименты тесного мира» Вайт – «смерть» цепи Хантер и Шотланд - прохождение цепи по разным социальным категориям людей Альберта, Йонг и Барабаси - способность агентов находить пути

Сетевая модель Описание модели Децентрализованные алгоритмы Результаты применения модели k – мерная сеть k – мерная сеть

Описание модели квадратная сетка n × n, {(i; j) : i {1; 2; : : : ; n}; j {1; 2; : : : ; n}} сетчатое расстояние d((i; j); (k; l)) = |k - i| + |l – j|

Описание модели(2) p >= 1 - локальные контакты q >= 0 - удаленные контакты r >= 0 [d(u; v)] -r - вероятность ребра из u в v [d(u; v)] -r / v[d(u; v)] -r - введем такую величину, обратное распределение степени r

Двухмерная сетка с n = 6, p = 1, q = 0 Пример: Сеточная модель

Контакты узла u при p = 1, q = 2, где v и w – дальние контакты Пример: Сеточная модель (2)

считая p и q фиксированными константами получаем однопараметрическое семейство сетей, зависящее от показателя r r – базовый параметр, измеряющий как широко разветвлена данная сеть при r = 0 получается модель Ватса Строгаца Описание модели(3)

Децентрализованные алгоритмы На каждом шаге держатель сообщения знает: множество локальных контактов местоположение цели на решетке * местоположение и дальние контакты всех узлов, которые были держателями сообщения

Децентрализованные алгоритмы Ожидаемое время доставки ожидаемое количество шагов по пути порождаем граф в соответствии с обратным распределение степени r начальная и целевая точки выбираются случайно равномерно

Результаты применения модели Теорема 1: Существует константа a 0, зависящая от p и q, не зависящая от n, такая что при r = 0, ожидаемое время доставки любого децентрализованного алгоритма не меньше a 0 n 2/3

Теорема 2: Существует децентрализованный алгоритм А и константа a 2, независящая от n, так что при r = 2 и p = q = 1, ожидаемое время доставки не больше a 2 (log n )2. Результаты применения модели (2)

Фундаментальное следствие когда дальние контакты создаются процессом, связывающих их определенным образом с геометрией решетки поиск эффективен

Главные предположения теорем В первой теореме равномерное распределение не позволяет алгоритму использовать скрытые «ключи» геометрии решетки алгоритм A второй теоремы: на каждом шаге держатель сообщения выбирает контакт наиболее близкий к цели в смысле сетчатой метрики

0 2 Существует константа a r, зависящая от p, q, r, независимая от n, такая что ожидаемое время доставки любого децентрализованного алгоритма не меньше a r n (r-2)/(r-1) Теорема

Зависимость ожидаемого времени от коэффициента кластеризации Ожидаемое время

k - мерная сеть обобщение результатов алгоритм может строить пути с длиной, полиноминально зависящей от log n, если только r = k

Скорость передачи «скорость передачи» класса сетей минимизация диаметра не то же самое что минимизация ожидаемого времения поиска сеть должна содержать структурные ключи которые могут быть использованы для направления к цели

Сети, поддерживающие эффективный поиск Иерархическая сетевая модель Модель с полилогарифмическим внешним уровнем Модель с полилогарифмическим внешним уровнем Модель с постоянным внешним уровнем Модель с постоянным внешним уровнем Групповые структуры

Иерархическая сетевая модель b - арное дерево T, b = const V – набор листьев из T, n – размер V для v и w, h (v, w) - высота их последнего общего предка в T монотонная невозрастающая функция f( ) - вероятность возникновения связи для v V, f(h(v,w))/ xv f(h(v, x)) число связей к - внешний уровень модели

k = c log 2 n, где с = const растет асимптотически как Модель с полилогарифмическим внешним уровнем

Естественные интерпретации модели WWW иерархия тем (yahoo.com) Science/Computer_Science/Algorithms более вероятно будет связана с Science/Computer_Science/Machine_Learning, чем с Arts/Music/Opera

Полученные результаты Теорема иерархическая модель степени = 1 с полилогарифмическим внешним уровнем, у которой время поиска децентрализованным алгоритмом оценивается O(log n).

Полученные результаты Теорема(продолжение) 1, не существует иерархической модели степени с полилогарифмическим внешним уровнем, у которой децентрализованный алгоритм может достичь полилогарифмическое время поиска.

Групповые структуры набор узлов V собрание подмножеств V константы λ 1: R - группа размером q>= 2, v R, R R, v R, R строго меньшая R, |R| λq R1,R2,R3,... – группы, имеющие размер не больше q и содержащие общий узел v, то их объединение имеет размер не больше βq

(V, {Ri}) q(v, w) - размер наименьшей подгруппы f ( ) – монотонная, невозрастающая f ( ) растет асимптотически как q - Индуцированная групповая модель cтепени

Полученные результаты Теорема: Для каждой групповой структуры существует индуцированная групповая модель степени = 1 с полилогарифмическим внешним уровнем, у которой время поиска децентрализованным алгоритмом оценивается O (log n). Для каждого < 1, не существует индуцированной групповой модели степени с полилогарифмическим внешним уровнем, у которой децентрализованный алгоритм может достичь полилогарифмическое время поиска.

Выводы соотношение между локальной структурой и дальними контактами вблизи критического порога – появляются «ключи» сети. ниже критического значения эти ключи исчезают в пределе короткие цепи существуют, но индивидуумы, дезориентированные в социальных контактах, не могут их найти.

Открытые вопросы Вопрос Фрагно Какие из развивающихся процессов могут сделать поиск по сетям более эффективным? Осознанность узлов-посредников Реконструкция сетей

Ссылки J. Kleinberg. Navigation in a Small World. Nature 406 (2000) J. Kleinberg. The small-world phenomenon: An algorithmic perspective. Proc 32nd Symposium on Theory of Computing, 2000 J. Kleinberg. Small-world Phenomena and the Dynamics of Information. Advances in Neural Information Processing Systems (NIPS) 14, 2001.

Ссылки(2) J. Kleinberg, P.Raghavan. Query Incentive Networks. Proc 46 th IEEE Symposium of Foundations of Computer Science, S. Milgram, The small world problem. Psychology Today 1 (1967)/ J. Kleinberg. The small world phenomenon and Decentralized Search, SIAM News, Volume 37, number 3, april 2004 Домашняя страница Джона Клайнберга.

Вопросы? Всем спасибо