Материалы занятий и вопросы к экзамену: Допуск к экзамену: 1. Все посещения лекций и лабораторных. Пропуск занятия «закрывается» рукописным рефератом (15 листов) 2. Конспект лекций (рукописный) 3. Выполнение всех контрольных и домашних работ 4. Выполнение всех (четырёх) лабораторных работ 5. Скачать и установить дома программу Gretl Прикладная статистика Кокодей Татьяна Александровна © Кокодей Т.А., 2012
Лекция 1 – Введение в прикладную статистику 1.1 Основные определения прикладной статистики 1.2 История прикладной статистики 1.3 Задачи и методы прикладной статистики 1.4 Основные выборочные статистические показатели 1.1 Основные определения прикладной статистики Статистика наука о сборе, анализе и интерпретации количественных или качественных данных. Её практическое применение в социологии, психологии, экономике и др. областях науки – это прикладная статистика. ПРИКЛАДНАЯ СТАТИСТИКА НАУКА О МЕТОДАХ СБОРА И ОБРАБОТКИ ДАННЫХ ПРОИЗВОЛЬНОЙ ПРИРОДЫ В ПРИКЛАДНЫХ ИССЛЕДОВАНИЯХ © Кокодей Т.А., 2012
Понятийный аппарат прикладной статистики : Генеральная совокупность - множество объектов, которые подлежат изучению и характеризуются определённым значением признака(-ов). Например, совокупность предприятий определённой отрасли (население определённого региона, студенты всей страны и т. п.); Часть объектов генеральной совокупности, отобранных случайным образом и выступающих в качестве объектов наблюдения в статистическом исследовании, называется выборкой. К выборке предъявляется требование репрезентативности; Признак объекта исследования – показатель (переменная), характеризующий некоторое свойство объекта совокупности, рассматриваемый как случайная величина; Случайная величина (СВ) - это некоторая переменная, принимающая в результате наблюдения, те или иные значения с определенными вероятностями; Вариация это различия индивидуальных значений признака (его изменчивость) у разных объектов за один и тот же промежуток времени; Под статистическими данными понимают числовые или нечисловые значения признаков исследуемых объектов, которые получены в результате наблюдений (сбора данных). Предприятие – объект наблюдения Признаки объекта- СВ Статистические данные: Выручка =…. числовые, Рентабельность =…. нечисловые Численность персонала =…. ……………………… …. Вид продукции =… Отрасль –генеральная совокупность © Кокодей Т.А., 2012 Выборка
1.2 История прикладной статистики - Одно из первый применений статистических методов описаны в Ветхом Завете (например, Книга Чисел ) : приводится подсчёт числа воинов в различных племенах - Впервые термин «статистика» появляется в художественной литературе – «Гамлет» Шекспира (1602 г., акт 5, сцена 2). Смысл – знать, придворные. Появилось около 200 определений с 1602 г.: 18 в. – сбор демографических и экономических данных, современное – в начале 19 в. - Зарождение современной статистики: 1663 г., публикация книги Natural and Political Observations Made upon the Bills of Mortality основателем статистики и демографии, лондонским галантерейщика John Grauntом ( ). По свидетельствам о смерти в Лондоне за 70 лет составил «таблицу жизни» с указанием вероятной продолжительности жизни в различных возрастах. © Кокодей Т.А., 2012
( ). © Кокодей Т.А., 2012
Carl Gauss (1777 – 1855) В 1794 г. немецкий математик Carl Friedrich Gauss (1777 – 1855) формализовал один из наиболее популярных метод наименьших квадратов и применил его при расчете орбиты астероида Церера, открыл Нормальное (гауссовское) распределение вероятностей случайной величины © Кокодей Т.А., 2012
Нормальное распределение вероятностей случайной величины Метод наименьших квадратов (МНК) © Кокодей Т.А., 2012
с 1900 г.: современный этап развития прикладной статистики, англичанин Karl Pearson (Пирсон) основал журнал "Biometrika, посвящённый применению статистических методов в биологии. Karl Pearson (1857 – 1936) Более 400 работ. Основатель корреляционного анализа - группы статистических методов, направленных на выявление зависимостей между выборками. Предложил коэффициент корреляции, характеризующий существование линейной зависимости между двумя величинами. Кривые распределения вероятностей случайной величины © Кокодей Т.А., 2012
Продолжатель работ – англичанин Ronald Aylmer Fisher (1890 – 1962) предложил дисперсионный анализ, который применяется для исследования влияния одной или нескольких качественных переменных (факторов) на одну зависимую количественную переменную (отклик). Например, влияние образования и пола на заработную плату индивида. Исследовал F-распределение вероятностей случайной величины, применяемое в регрессионном анализе. Student = William Gosset ( ) Ronald Fisher (1890 – 1962) T-распределение Стьюдента применяется, например, в регрессионном анализе при оценке значимости параметров регрессионного уравнения у=а 0 +а 1 *х. Знаменит за t-критерий В СССР термин «прикладная статистика» вошёл в широкое употребление в 1981, выход сборника «Современные проблемы кибернетики (прикладная статистика)». © Кокодей Т.А., 2012
Направления прикладной статистики Вид анализируемых данных Решаемые задачи Применяемые методы 1. Статистика случайных величин (одномерная статистика) Действительное число Расчет выборочных характеристик распределения, проверка гипотез о равенстве математического ожидания или дисперсии случайной величины эталонному значению и др. Методы расчёта статистических показателей: математическое ожидание, медиана, дисперсия, среднеквадратическое отклонение, коэффициент вариации и др. 2. Многомерный статистический анализ Вектор Исследование зависимости между признаками Корреляционный анализ, регрессионный анализ, дисперсионный анализ и др. Классификация объектов или признаков Дискриминантный анализ, кластерный анализ, методы группировки Снижение размерности пространства признаков Методы многомерного шкалирования, главных компонент, факторного анализа и др. 3. Статистика случайных процессов и временны́х рядов Функция - Выявление тенденции и прогнозирование будущего развития временного ряда; - Выделение основных составляющих и анализ структуры временного ряда и т.д. Анализ тренда, декомпозиция временного ряда; автокорреляционный анализ, метод авторегрессии, спектральный (Фурье) анализ 4. Нечисловая статистика Нечисловые данные (качественные, интервальные, др) Обрабатывать более объективную, более освобожденную от погрешностей информацию Методы нечисловой статистики (например, методы теории измерений) 1.3 Задачи и методы прикладной статистики
© Кокодей Т.А., Основные выборочные статистические показатели Меры среднего уровня и меры рассеяния: 1. Среднее арифметическое (average) сумма значений переменной, деленная на n (число значений переменной). 2. Дисперсия случайной величины (variance)- представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины и является мерой изменчивости признака n- число наблюдений - выборочное среднее
© Кокодей Т.А., Медиана разбивает выборку на две равные части. Половина значений переменной лежит ниже медианы, половина выше. Например, медиана пяти измерений: 10, 17, 21, 24, 25 – равна Мода представляет собой наиболее часто встречающееся значение пере менной (Например: 2, 6, 6, 8, 9, 9, 9, 10 – мода = 9).
© Кокодей Т.А., 2012 Термин "корреляция" означает "связь", меру зависимости между переменными.Коэффициент корреляции Пирсона характеризует существование линейной зависимости между двумя величинами, от до Меры взаимосвязи:
© Кокодей Т.А., 2012 СТАТИСТИЧЕСКИЕ РЕСУРСЫ 1. Официальный сайт Государственной службы статистики Украины 2. Національний банк України. Основні показники економічного розвитку The National Bureau of Economic Research, USA 4. U.S. Department of Commerce. Bureau of Economic Analysis 5. International Monetary Fund 6. United Nations Organization 7. Index Mundi 8. Food and Agriculture Organization of the UN СТАТИСТИЧЕСКИЕ ПРОГРАММЫ Gretl - Open source, Minitab SPSS Statistica
© Кокодей Т.А., 2012 i12345 x И=10В=3А=1Н=15О=16 У Д=5М=14И=10Т=20Р=18 cov xy r xy Домашнее задание: рассчитать дисперсии x и у, коэффициенты ковариации и корреляции Пирсона между ними ПО ВАРИАНТАМ: закодировать первые пять букв своей фамилии (x) и имени (y) по номеру в алфавите (а=1, б=2 и т.д.) Пример исходных данных для Дмитрия Иванова: ХУ И10Д5 В3М14 А1И10 Н15Т20 О 16 Р 18 ВИ Й