РАСПРЕДЕЛЕНИЕ БРЭДФОРДА И ПОДОБНЫЕ ЕМУ ИНФОМЕТРИЧЕСКИЕ ЗАКОНЫ РАСПРЕДЕЛЕНИЕ БРЭДФОРДА И ПОДОБНЫЕ ЕМУ ИНФОМЕТРИЧЕСКИЕ ЗАКОНЫ на примере статистики использования электронных ресурсов в университетской библиотеке Владимир Владимирович Писляков нач. отдела информационных систем и электронных ресурсов библиотеки ГУ-ВШЭ, Москва SCIENCE ONLINE: электронные информационные ресурсы для науки и образования Турция, 2005
Academic Search Premier Business Source Premier HealthSource MasterFILE Premier Newspaper Source ABI/INFORM Global Academic Research Library ProQuest Computing ProQuest Education Complete ProQuest Psychology Journals Social Science Plus Arts & Sciences I Arts & Sciences II Business Collection Language & Literature Collection EBSCOhost: ProQuest: JSTOR: Ресурсы, включенные в статистику использования-2004 ScienceDirect: Business, Management and Accounting Economics, Econometrics and Finance Social Sciences
Электронные журналы: статистика использования в ГУ-ВШЭ, 2004 г. число полнотекстовых изданий изданий, к полным текстам которых были обращения доля востребованных изданий EBSCO %10% JSTOR %75% ProQuest %39% ScienceDirect % всего %
Электронные журналы: статистика использования в ГУ-ВШЭ, 2004 г. открыто полнотекстовых статей EBSCO 6374 JSTOR ProQuest ScienceDirect 7719 всего 41960
Статистика использования эл. журналов: представление
Закон Брэдфорда: формулировка Bradford S. C. Sources of information on specific subjects // Engineering Vol P. 85–86. Bradford S. C. Documentation. London: Crosley Lockwood, 1948 (Washington: Public Affairs Press, 1950). 429 статей в 9 журналах 499 статей в 59 журналах 404 статьи в 258 журналах Lawani S. M. Bradfords Law and the Literature of agriculture // International Library Review Vol. 5. P. 341–350.
26 журналов статей 139 журналов статей 2427 журналов статей 139 : 26 = 5, : 139 = 17,5 3,5 33 журнала в «ядре» Закон Брэдфорда: проверка на статистике ГУ-ВШЭ
y = –159x x 2 – 1461x y'' = – 954x y'' = 0 при x = 4,36 4,36 78 журналов в «ядре»
Ядро из 78-ми журналов: анализ по базам данных число полнотекстовых изданий изданий из ядра ГУ-ВШЭ изданий из ядра, читаемых только из данного ресурса EBSCO JSTOR ProQuest ScienceDirect 31017
Закон Леймкулера: формулировка Leimkuhler F. F. The Bradford Distribution // Journal of Documentation Vol. 23. P. 197–207. Y = A ln(1 + BN) Y число статей в N наиболее продуктивных журналах; A и B некоторые коэффициенты Для нормированных величин: Y = ln(1 + βx) / ln(1 + β) Y доля от общего числа статей в доле x наиболее продуктивных журналов; β «коэффициент концентрации» журналы статьи доля журналов доля статей кривая Леймкулера :
Используем нелинейную регрессию и пытаемся, подбирая коэффициент β, приблизить наш график кривой, которая подчиняется закону Леймкулера. Закон Леймкулера: проверка на статистике ГУ-ВШЭ нелинейная регрессия исходные данные β 5860 Найдем площадь под кривой Леймкулера: S = Y(x) dx = = [ln(1 + βx) / ln(1 + β)] dx = = / β – 1 / ln(β+1) S(β) возрастающая функция и S(β 0) 0,5 S(β ) 1 Для нашего случая S(5860) = 0,885.
Закон Лотки: формулировка Lotka A. J. The Frequency Distribution of Scientific Productivity // Journal of the Washington Academy of Sciences Vol. 16. P. 317–323. n = A / x, 2 n количество учёных, опубликовавших x статей; A некоторый коэффициент В логарифмическом виде: ln n = – ln x + K статьи ученые ln (статьи) ln (ученые)
Приложение закона к статистике использования электронных ресурсов: Найдем, из скольких журналов n было прочитано пользователями ровно x статей. Закон Лотки: проверка на статистике ГУ-ВШЭ нескорректированные данные скорректированные данные ln (журналов) ln (статей) Закон Лотки выполняется, причем = 1,7 n = A / x = A / x 1,7
Закон Ципфа: формулировка Zipf G. K. The Psycho-biology of Language. Boston: Houghton, Zipf G. K. Human Behaviour and the Principle of Least Effort. Reading: Addison-Wesley, r x f = const r порядковый номер слова (в порядке убывания частоты); f количество употреблений слова В обобщенном виде: ln r + ln f = const, 1 (обычно закон Ципфа плохо выполняется для верхних позиций рейтинга слов)
Приложение закона к статистике использования электронных ресурсов: Найдем зависимость между рангом журнала в упорядоченном списке востребованности изданий и количеством прочитанных из него статей. Закон Ципфа: проверка на статистике ГУ-ВШЭ Закон Ципфа выполняется удовлетворительно и = 1,3 f x r 1,3 = const ln (статей) ln (место в рейтинге)
Pareto V. Cours dÉconomie Politique. Vol. 2. Lausanne: 1 Université de Lausanne, Lorenz M. O. Methods of measuring the concentration of wealth // Publications of the American Statisical Association Vol. 9. P. 209–219 «Plot along one axis cumulated percents of the population from poorest to richest, and along the other the percent of the total wealth held by these percents» (p. 217) Gini C. Variabilità e mutabilità // Memori di Metodologia Statistica. Vol. 1. Rome, P. 211–382. беднейшие 20% населения получают 7% общего национального дохода беднейшие 40% населения получают 18% общего национального дохода беднейшие 60% населения получают 32% общего национального дохода беднейшие 80% населения получают 52% общего национального дохода беднейшие 100% населения (т.е. всё население) получают 100% общего национального дохода (весь доход) Принцип Парето, кривая Лоренца, индекс Джини
Кривая Лоренца–Леймкулера
Приложение закона к статистике использования электронных ресурсов: на 20% электронных журналов приходится 80% всех загрузок полнотекстовых статей Принцип Парето: проверка на статистике ГУ-ВШЭ процент журналов, содержащих 80% загруженных статей EBSCO 28% JSTOR 18% ProQuest 31% ScienceDirect 25% EBSCO + ProQuest 27% EBSCO + ProQuest + ScienceDirect 22% все ресурсы совокупно 14,7%
Кривая Лоренца-Леймкулера и индекс Джини по статистике ГУ-ВШЭ % журналов % прочитанных статей S общ S общ = 0,902 G= (S общ – 0,5) : 0,5 = 0,8
Bookstein A. Informetric Distributions, part I: Unified Overview // Journal of the American Society for Information Science Vol. 41. P. 368–375. Garfield E. Bradfords Law and Realted Statistical Patterns // Current Contents No. 19, 12 May. Egghe L. Type/Token-Taken Informetrics // Journal of the American Society for Information Science and Technology Vol. 54. P. 603–610. Egghe L., Rousseau R. A proposal to define a core of a scientific subject: A definition using concentration and fuzzy sets // Scientometrics Vol. 54. No. 1. P. 51–62. Burrell Q. Defining a core: Theoretical observations on the Egghe- Rousseau proposal // Scientometrics Vol. 57. No. 1. P. 75–92. Библиография
РАСПРЕДЕЛЕНИЕ БРЭДФОРДА И ПОДОБНЫЕ ЕМУ ИНФОМЕТРИЧЕСКИЕ ЗАКОНЫ РАСПРЕДЕЛЕНИЕ БРЭДФОРДА И ПОДОБНЫЕ ЕМУ ИНФОМЕТРИЧЕСКИЕ ЗАКОНЫ на примере статистики использования электронных ресурсов в университетской библиотеке Владимир Владимирович Писляков нач. отдела информационных систем и электронных ресурсов библиотеки ГУ-ВШЭ, Москва SCIENCE ONLINE: электронные информационные ресурсы для науки и образования Турция, 2005