Выравнивание статистических рядов
Во всяком статистическом распределении неизбежно присутствуют элементы случайности, связанные с тем, что число наблюдений ограничено, что произведены именно те, а не другие опыты, давшие именно те, а не другие результаты. Только при очень большом числе наблюдений эти элементы случайности сглаживаются, и случайное явление обнаруживает в полной мере присущую ему закономерность. На практике мы почти никогда не имеем дела с таким большим числом наблюдений и вынуждены считаться с тем, что любому статистическому распределению свойственны в большей или меньшей мере черты случайности. Поэтому при обработке статистического материала часто приходится решать вопрос о том, как подобрать для данного статистического ряда теоретическую кривую распределения, выражающую лишь существенные черты статистического материала, но не случайности, связанные с недостаточным объемом экспериментальных данных. Такая задача называется задачей выравнивания (сглаживания) статистических рядов.
Задача выравнивания заключается в том, чтобы подобрать теоретическую плавную кривую распределения, с той или иной точки зрения наилучшим образом описывающую данное статистическое распределение
Принципиальный вид теоретической кривой выбирается заранее из соображений, связанных с существом задачи, а в некоторых случаях просто с внешним видом статистического распределения. Аналитическое выражение выбранной кривой распределения зависит от некоторых параметров; задача выравнивания статистического ряда переходит в задачу рационального выбора тех значений параметров, при которых соответствие между статистическим и теоретическим распределениями оказывается наилучшим.
На практике для вычисления числовых характеристик случайных статистических величин применяют следующий прием: используются те же разрядамы, на которые был расклассифицирован статистический материал для построения статистического ряда или гистограммы, и считают приближенно значение случайной величины в каждом разряде постоянным и равным среднему значению, которое выступает в роли «представителя» разряда. Тогда статистические числовые характеристики будут выражаться приближенными формулами:
Критерии согласия
Определяют меру расхождения, фактически наблюденную для полученного статистического материала v. Если она достаточно велика, например 0,8-0,9 и более, то очевидно, что отличие от теоретического закона получилось только за счет малого числа испытаний п, и следовательно, гипотеза о законе распределения вероятностей, принятая ранее, правдоподобна. Если же вероятность для V = v мала (0,1-0,2 и менее), то это означает, что отличия от теоретического закона вызваны неверной гипотезой Но. Возникает вопрос: как же выбирать меру расхождения V ? Оказывается эта мера и есть критерий согласия.
Общим для всех критериев согласия является то, что по своей сущности они отрицательны, т.е. они основаны на так называемом принципе невозможности маловероятных событий. Мы говорили о нем. Если при определенных условиях вероятность появления какого-либо события очень мала, то при однократном осуществлении этого события можно быть практически уверенным, что это событие не произойдет, т.е. считать его практически невозможным. С принципом невозможности маловероятных событий тесно связано понятие уровня значимости а. Так, если а =5%, то мы считаем практически невозможным событие, которое может появиться в среднем 5 раз из 100 испытаний. Если а=1%, то практически невозможное событие - это то событие, которое теоретически возможно только в одном случае из 100. На практике в задачах электроэнергетики наиболее часто применяются следующие критерии согласия: Пирсона, Колмогорова, Романовского и критерий серий.
Критерий Пирсона