Распространим определения числовых характеристик дискретных величин на величины непрерывные. Математическим ожиданием непрерывной случайной величины Х, возможные значения которой xЄ[а; b], называют определенный интеграл: M (X) = x f(x) dx. Если возможные значения принадлежат всей оси Ох, то M (X) = x f(x) dx, х – М (Х) – есть отклонение величины Х. Предполагается, что несобственный интеграл сходится абсолютно, т.е. существует интеграл | x | f(x) dx b a - -
Дисперсией непрерывной случайной величины называют математическое ожидание квадрата ее отклонения. Если возможные значения Х Є [а; b], то D(X) = [x – M(X)] 2 f(x)dx. Если х Є [-; ], то D(X) = [x – M(X)] 2 f(x)dx. Среднее квадратическое отклонение непрерывной случайной величины определяется, как и для дискретных величин, равенством: σ (Х) = D (X). b а -
Замечание 1. Можно доказать, что св-ва мат. ожидания и дисперсии дискретных величин сохраняются и для непрерывных величин. Замечание 2. Легко получить для вычисления дисперсии более удобные формулы: D(X) = х 2 f(x)dx - [M(X)] 2 ; D(X) = х 2 f(x)dx - [M(X)] 2. b а -
Пример. Найти мат. ожидание и дисперсию случайной величины Х, заданной ф-ей распределения: 0 при х 0 F(x) = х при 0 < х 1 1 при х > 1. Решение. Найдем плотность распределения: 0 при х < 0 f(х) = F'(x) = 1 при 0 < х < 1 0 при х > 1.
Найдем мат. ожидание: M(X) = x ·1· dx = х 2 /2 = 1/2. Дисперсия: D(X) = х 2 ·1· dx - [1/2] 2 = х 3 /3 - 1/4 = 1/
Нормальное распределение Нормальным называется распределение вероятностей непр. случ. величины, кот. определяется плотностью f(x) = е -(х- а) 2 /2σ 2. Норм. распределение опред-ся 2-мя параметрами а и σ. Вероятностный смысл этих параметров таков: а – есть математическое ожидание, а σ – среднее квадратичное отклонение формального распределения. 1 σ 2π
Общим называют норм. распределение с произвольными параметрами а и σ (σ>0). Нормированным называют норм. распр-ие с параметрами а=0 и σ=1. Напр., если Х – нормальная величина с параметрами а и σ, то U = (Х - а)/σ – нормированная нормальная величина, причем М(U)=0, σ(U)=1. Плотность нормированного распределения φ(x) = е -х 2 /2. Эта ф-ция фигурирует в локальной теореме Лапласа и затабулирована. 1 2π2π
Локальная теорема Лапласа При больших значениях n ф-ла Бернулли неудобна, и для приближенных вычислений используют локальную теорему Лапласа: «Вероятность того, что в n независимых испытаниях, в каждом из которых вероятность появления события А равна р, событие А наступит ровно k раз, приближенно равна Р n (k) φ(x), где φ(x)= е -х 2 /2, 1 npq k-np 2π2π Х= k-np npq
Ф-ла тем точнее, чем больше n. Ф-ция φ(x) затабулирована и ее таблица для положительных х приводится в приложениях учебных пособий. Т.к. ф- ия φ(x) четная, то для отрицательных значений х можно воспользоваться формулой φ(-x) = φ(x).
Интегральная теорема Лапласа Вероятность того, что в n независимых испытаниях, в каждом из которых вероятность появления события А равна р, событие А наступит не менее k 1 раз и не более k 2 раз, приближенно равна Р n (k 1 ; k 2 ) Ф(х'') - Ф(х'), где Ф(х) = е -Z 2 /2 ·dz – ф-ия Лапласа, х'=, х''=, k 2 >k π2π k 1 -np npq k 2 -np npq Ф(-х) = Ф(х), для х>5 Ф(х)=0,5.
График плотности нормального распределения называют нормальной кривой (кривой Гаусса). Исследуем ф-ию у = е Методом дифференциального исчисления. 1. Очевидно, ф-ия определена на всей оси х. 1 σ2πσ2π (х- а) 2 2σ22σ2 - а 0 f(x)
2. у > 0, т.е. кривая расположена над осью х. 3. Lim y = 0, т.е. у=0 – ось Ох служит горизонтальной асимптотой графика. 4. Исследуем ф-ию на экстремум. у' = - е. Легко видеть, что у'=0 при х=а, у'>0 при х а. Согласно достаточному условию экстремума при х=а ф-ия имеет максимум: у max =. - (х- а) 2 2σ22σ2 σ 32π х - а 1 2π х±
5. Разность х-а содержится в аналитическом выражении ф-ии в квадрате, т.е. график симметричен относительно прямой х=а. 6. Исследуем ф-ию на точки перегиба (где график меняет характер выпуклости) у '' = - е -(х-а) 2 /2 σ 2 ·[1 - ]. 1 σ 32π (х-а) 2 σ2σ2
у ''=0 при х=а± σ, а при переходе через эти точки 2-ая производная меняет знак (в обеих этих точках значение ф-ии равно Таким образом, точки графика (а – σ; ) и (а + σ; ) являются точками перегиба. 1 σ2πeσ2πe σ2πeσ2πe 11 σ2πeσ2πe
Влияние параметров нормального распределения на форму нормальной кривой Известно, что график f(x-a) получается параллельным переносом графика f(x) на а единиц масштаба вправо, если а>0. Отсюда следует, что изменение величины параметра а (матем. ожидания) не изменяет формы нормальной кривой, а приводит лишь к ее сдвигу вдоль оси Ох: вправо, если «а» возрастает, и влево, если «а» убывает. Иное дело с σ. Максимум нормальной кривой распределения равен. 1 σ2πσ2π
Отсюда следует, что с возрастанием σ максимум убывает, а сама кривая становиться более пологой, т.е. сжимается к оси Ох; при убывании σ нормальная кривая становиться более «островершинной» и растягивается в положительном направлении оси Оу. Важно заметить, что при любых значениях а и σ площадь, ограниченная нормальной кривой и осью х остается равной 1. (В частности при σ0 получаем одно из определений дельта-функции Дирака).
0 < σ 1 < σ 2 < σ 3 ; а=0. (σ 11 кривую называют нормированной). f(x) х 0 σ1σ1 σ2σ2 σ3σ3
Вероятность попадания в заданный интервал нормальной случайной величины Как известно P (α
Вычисления вероятности заданного отклонения Часто требуется вычислить вероятность то, что отклонение нормально распределенной случайной величины Х по абсолютной величине меньше заданного положительного числа δ, т.е. требуется найти вероятность осуществления неравенства |Х-а|
В частности, при а=0 P (|Х|
Правило трех сигм В ф-ле P (|Х-а|
Другими словами, вероятность того, что абсолютная величина отклонения превысит утроенное среднее квадратичное отклонение, очень мала, а именно равна 0,0027. Т.е. в 0,27% случаев так может произойти. Такие события можно считать практически невозможными. Правило 3-х сигм: если случайная величина распределена нормально, то абсолютная величина ее отклонения от математического ожидания не превосходит утроенного среднего квадратического отклонения.
На практике, если распределение неизвестно, но выполняется условие в правиле 3-х сигм, то есть основание предполагать, что изучаемая величина распределена нормально. В противном случае она не распределена нормально.