СТРУКТУРНЫЕ ИССЛЕДОВАНИЯ НАУЧНОГО ВЕБА Печников Андрей Анатольевич Луговая Наталья Борисовна Институт прикладных математических исследований Карельского научного центра РАН Работа выполняется при поддержке гранта РФФИ а
Содержание доклада О ЧЕМ ДОКЛАД: о построении модели фрагмента российского научного Веба на основе сбора и анализа гиперссылок ЗАТРАГИВАЕМЫЕ ТЕМЫ: о программном обеспечении о сборе информации о разработке модели ВОЗМОЖНЫЕ ДАЛЬНЕЙШИЕ НАПРАВЛЕНИЯ ИССЛЕДОВАНИЙ: о схеме научного Веба о компоненте связности
Комплекс программ WebSciRes ПО WebSciRes - от слов Webomerics, Science и Research (представлено на конференции «Телематика » стендовым докладом). Состоит из робота-сборщика гиперссылок и базы данных. В базе данных WebSciRes содержится информация о 70 тысячах уникальных гиперссылок, собранных в результате сканирования 275 официальных сайтов организаций и учреждений Российской академии наук (так называемое «целевое множество» T ). Содержит около 20 различных операций над массивами данных: выборки различного типа, построение матриц и т.д.
Комплекс программ WebSciRes Устранение дублирования гиперссылок
Модель научного Веба Модель научного Веба – множество всех сайтов Веба, на которые существуют гиперссылки с сайтов целевого множества T, разбитое на несколько непересекающихся подмножеств и обнаруженные связи между этими подмножествами и множеством T.
Построение модели научного Веба Сформировано и отсканировано Обнаружено (на них существуют ссылки с целевого множества)
Построение схемы научного Веба
Построение модели научного Веба административное научно- методическое NoНазваниедоменное имя РАН, Президиум РАН Отделение по области науки Региональное отделение или региональный НЦ НЦ отделения институт Отделение по области науки 1Отделение по области науки 2 1 Российская академия наук ОТДЕЛЕНИЯ РАН (ПО ОБЛАСТЯМ НАУКИ) 2 Отделение математических наукomn.ras.ru 1 3 Отделение физических наук Отделение историко-филологических наук 1 РЕГИОНАЛЬНЫЕ ОТДЕЛЕНИЯ РАН 11 Дальневосточное отделение РАН Сибирское отделение РАН Уральское отделение РАН 1 РЕГИОНАЛЬНЫЕ НАУЧНЫЕ ЦЕНТРЫ РАН 15 Дагестанский научный центр РАН Карельский научный центр РАН Южный научный центр РАН 1 НАУЧНЫЕ ЦЕНТРЫ ОТДЕЛЕНИЙ 28 Амурский научный центр ДВО РАНamur.febras.ru Бурятский научный центр СО РАН Коми научный центр УрО РАН 13 УЧРЕЖДЕНИЯ РАН 50 Байкальский институт природопользования СО РАН Биолого-почвенный институт ДВО РАН Ботанический институт им. В. Л. Комарова РАН Ботанический сад-институт ДВО РАНbotsad.ru Фрагмент таблицы целевого множества
Построение модели научного Веба T – целевое множество, D – административное /научное подмножество.
Построение модели научного Веба T – целевое множество, B – ближайшие окрестности, K –коммуникаторы, S – оболочка.
Построение модели научного Веба B – ближайшие окрестности, B dir - прямые окрестности, Пример для natoarw.kirensky.ru silicon06.kirensky.ru zkross.kirensky.ru B hid - скрытые окрестности, Пример для petrsu.karelia.ru: aspirant.karelia.ru rcnit.karelia.ru
Построение модели научного Веба K - коммутаторы Веб-коммуникаторы K = K K K ссылок на них С сайтов ссылок с них На сайты РФФИ Научная электронная библиотека ВАКvak.ed.gov.ru Московский государственный университет МАИК Наука_Интерпериодика K - посредники Новосибирский государственный университет Отделение ГПНТБ СО РАН Междисциплинарный научный сервер Московский физико-технический институт K - индукторы Все о геологииgeo.web.ru Общероссийский математический портал Портал для аспирантов Библиотека Академии Наук На РФФИ ссылки со 102 сайтов из T (518 штук), а с РФФИ – на 9 сайтов из T (17 штук)
Построение модели научного Веба Множество-оболочка S = S 10 S 5 S 1 Насыщенная оболочка S 10 Яндекс, Gismeteo.ru Прогноз погоды, Российская газета, ГПНТБ России, SpringerLink Institute of Physics London, ScienceDirect Вязкая оболочка S 5 Томский политехнический университет, Компания ЦИТ Форум, Германская служба академических обменов, University of Liverpool, The Royal Society, Jornal of American Institute of Physics Разреженная оболочка S 1 Центральная научная библиотека ДВО РАН, Всё о российских лесах, American Physical Society Jornals, The McDonald Institute for Archaeological Research
Построение модели научного Веба
Некоторые числовые характеристики модели: T – целевое множество, 275 сайтов, 4200 ссылок B – ближайшие окрестности, 708 сайтов, 5000 ссылок K –коммуникаторы, 43 сайта, 2500 ссылок S – оболочка, сайтов, ссылок. Некоторые итоги: Минимальным количеством понятий описан достаточно большой фрагмент российского Веба. Что дальше: Анализ основных составляющих множеств Качественный анализ гиперссылок Теоретико-графовые методы И т.д. Построение модели научного Веба
Пример 1: Схема научного Веба Схема научного Веба - ориентированный граф, множество вершин которого соответствует исследуемым сайтам целевого множества и всем сайтам, на которые существуют гиперссылки с сайтов целевого множества, а дуги отражают гиперссылки, существующие между сайтами. Считается, что дуга существует тогда и только когда, существует хотя бы одна гиперссылка с одного сайта на другой.
Схема научного Веба (без оболочки) НЕКОТОРЫЕ РЕЗУЛЬТАТЫ: Сильная связность по каркасу Слабая связность по подмножествам И т.д.
Пример 2: компонента связности научного Веба Всего 275 сайтов, компонента сильной связности – 114 сайтов, компонента связности – 264 сайта.
Сайт: Почта: СТРУКТУРНЫЕ ИССЛЕДОВАНИЯ НАУЧНОГО ВЕБА Печников Андрей Анатольевич Луговая Наталья Борисовна СПАСИБО.