Лабораторная работа 6 Обработка результатов эксперимента в MathCad
1. Законы распределения случайных чисел Распределение случайной величины – это функция, позволяющая определить вероятность появления заданного значения случайной величины. В теории вероятностей сформулировано несколько законов распределения как для дискретных, так и для непрерывных случайных величин. Наблюдаемые на практике случайные величины часто не вполне соответствуют теоретическим распределениям, но с некоторой точностью могут быть приближенно ими представлены.
Законы распределения случайных чисел Для непрерывных случайных величин рассмотрим следующие законы: Равномерное распределение Нормальное распределение Экспоненциальное распределение Гамма-распределение
Равномерное распределение 2 параметра: a, b – границы отрезка a = min(X i ) b = max(X i ) Плотность вероятности Интегральная функция распределения
Равномерное распределение
Нормальное распределение 2 параметра: μ – мат. ожидание σ – стандартное, или среднеквадратическое, отклонение
Нормальное распределение
Экспоненциальное распределение 1 параметр масштаба λ λ = 1 / μ
Экспоненциальное распределение
Гамма-распределение 2 параметра: k – параметр формы θ – параметр масштаба При k = 1 получается экспоненциальное распределение, где λ = 1 / θ При k получается нормальное распределение с параметрами kθ и kθ 2
Гамма-распределение
2. Построение гистограмм плотности вероятности и интегральной функции распределения Исходный вектор значений случайной величины:
Построение гистограмм плотности вероятности и интегральной функции распределения Построение гистограммы плотности вероятности:
Построение гистограмм плотности вероятности и интегральной функции распределения Для выбора числа интервалов (бинов) у гистограммы рекомендуется использовать формулу Стерджесса Ширина каждого из интервалов Ширину интервалов рекомендуется округлять. Функция histogram выбирает ширину автоматически.
Построение гистограмм плотности вероятности и интегральной функции распределения Построение гистограммы интегральной функции распределения:
4. Вычисление математического ожидания, стандартного отклонения, дисперсии Математическое ожидание случайной величины вычисляется как её среднее значение, в mathCad вычисляется функцией mean Среднеквадратическое (стандартное) отклонение – корень из дисперсии, в mathCad вычисляется функцией stdev Обозначается σ Дисперсия – среднее значение квадрата отклонений от среднего значения (σ 2 ), в mathCad вычисляется функцией var
5. Критерии достоверности гипотез Гипотеза – предположение о виде или параметрах неизвестного распределения. Например: гипотеза «случайная величина X подчиняется нормальному закону распределения» Для каждой гипотезы есть вероятность p, что она верна, и вероятность 1 – p, что гипотеза ошибочна. При проверке гипотез заранее задают уровень значимости α = 1 – p, то есть вероятность недостоверности гипотезы.
Критерии достоверности гипотез Для проверки гипотез вычисляют значение критерия, зависящее от значений проверяемой случайной величины, и проверяют его на нахождение в области значений, соответствующей достоверности гипотезы при заданном уровне значимости. Наиболее часто используют критерий Колмогорова и критерий Пирсона (критерий «хи-квадрат» - χ 2 ).
Использование критерия Колмогорова Упорядочить случайные числа по возрастанию. Вычислить значения D i и выбрать максимальное из них D Значение критерия λ = D n Найти вероятность совпадения законов распределения P(λ).
Использование критерия Колмогорова при заданном уровне значимости Задавшись α и зная n, выбрать критическое значение критерия D кр. Упорядочить случайные числа по возрастанию. Вычислить значения критерия D i и выбрать максимальное из них D Гипотезу о принадлежности случайной величины распределению можно принять, если D < D кр
Поиск критической точки для критерия Колмогорова Для нахождения критической величины критерия D кр надо знать уровень значимости α и число опытов n Для заданного α выбираем λ кр : При больших n (n > 35) Для малых n пользоваться табличными значениями D кр
Критерий Колмогорова: пример Пассажир, приходящий в случайные моменты времени на автобусную остановку, в течение пяти поездок фиксировал своё время ожидания автобуса: 5,1; 3,7; 1,2; 9,2; 4,8 мин. Проверить гипотезу о том, что время ожидания автобуса равномерно распределено на отрезке [0; 10] на уровне значимости 0,05.
Решение
Решение задачи в MathCAD
Использование критерия Пирсона Критерий используется для дискретных величин, либо непрерывных величин, разбитых на интервалы. Например, он может быть использован, если построена гистограмма результатов эксперимента.
Использование критерия Пирсона Определить число степеней свободы k = l – r – 1, где l – число интервалов гистограммы r – число параметров предполагаемого распределения, оцениваемых по выборке (2 для нормального, 1 для экспоненциального…) Найти критическое значение критерия: χ 2 кр = qchisq(1 – α, k) Вычислить критерий χ 2 по экспериментальным данным. Гипотеза верна, если χ 2 < χ 2 кр
Использование критерия Пирсона Вычисление χ 2 : где n i – эмпирические частоты (фактическое количество попаданий случайной величины в заданный интервал гистограммы) np i – теоретические частоты (количество попаданий случайной величины в заданный интервал гистограммы, вычисленное по предполагаемому закону её распределения)
Пример Измерены интервалы в минутах между 100 поездами метро, прибывшими на станцию. Результаты измерений представлены статистическим рядом: На уровне значимости проверить гипотезу о том, что интервалы можно описать нормальным распределением.
Неравенство χ 2 < χ 2 кр выполнено, гипотезу можно принять.
6. Коэффициент линейной корреляции Коэффициент линейной корреляции – величина, показывающая наличие линейной связи между значениями двух случайных величин. Для линейно зависящих величин он равен 1 или -1, для независимых величин – 0. В MathCad вычисляется как функция от двух векторов случайных чисел.
Задание к работе 6 1. Сгенерировать случайные числа по своему варианту два раза, векторы по 50 и 500 шт. 2. Найти мат. ожидание, стандартное отклонение, дисперсию для обоих наборов случайных чисел 3. Определить параметры распределения случайной величины, предполагая, что она распределена по известному закону распределения, для каждого из рассмотренных законов. 4. Построить гистограммы плотности вероятности и интегральной функции распределения. Построить функции плотности вероятности и интегральных функций распределения с найденными параметрами на тех же графиках. 5. Найти вероятности достоверности гипотез о принадлежности случайной величины к каждому из 4 распределений из п. 4 по критерию Колмогорова. Проверить те же гипотезы по критерию Пирсона для уровня значимости 0,1. 6. Найти коэффициент корреляции между 1 вектором и первыми 50 числами второго вектора.