К ПРОБЛЕМЕ ОПРЕДЕЛЕНИЯ ВЕЛИЧИН АТРИБУТИВНЫХ И ТРУДНОДОСТУПНЫХ ПАРАМЕТРОВ В СОВОКУПНОСТИ РАЗНОТИПНЫХ СТАТИСТИЧЕСКИХ НАБЛЮДЕНИЙ Уткин Владимир Александрович Папуш Елена Гавриловна Филиал в г. Пятигорске ФГАОУ ВПО «Северо-Кавказский Федеральный университет» Минобрнауки РФ
АННОТАЦИЯ В дискретных многопараметрических средах с большим числом зависимых разнотипных параметров рассматривается возможность найти, восстановить или заместить утраченные или неполученные данные, а так же получить интервальные эквиваленты для атрибутивных, как правило, ранговых или номинальных параметров. В дискретных многопараметрических средах с большим числом зависимых разнотипных параметров рассматривается возможность найти, восстановить или заместить утраченные или неполученные данные, а так же получить интервальные эквиваленты для атрибутивных, как правило, ранговых или номинальных параметров.
Для труднодоступной, утраченной или неполученной переменной Уравнение линейной регрессии без свободного члена Уравнение линейной регрессии со свободным членом следует дополнить матрицу наблюдений X столбцом из единиц, т.е. X* = [1, X] И тогда
Уравнение линейной регрессии и вывод интервальных значений для атрибутивной переменной исходя из
Коэффициенты корреляции в анализируемой корреляционной матрице где – соответственно, выборочные математическое ожидание и среднеквадратическое отклонение для j-го ряда значений.
Обобщение вывода для получения значений более, чем одной атрибутивной переменной
Коэффициенты корреляции, принадлежат одной метрике, если а) зависимости между рядами интервальных переменных выражаются коэффициентами Бравайса-Пирсона; б) зависимости между рядами номинальных и ранговых переменных, а также между рядами ранговых и интервальных переменных выражаются коэффициентами τ Кендэла и приводятся к метрике коэффициентов Бравайса-Пирсона; в) и к той же метрике таким же образом приводятся зависимости между рядами номинальных переменных, выражаемые коэффициентами φ Пирсона; г) а зависимость между рядами интервальных и номинальных переменных может быть выражена точечно-бисериальными коэффициентами Пирсона: – общее среднее для интервальных переменных; x – среднеквадратическое отклонение для ряда интервальных переменных; n 1 – число случаев наличия некоторого признака n 0 - число случаев отсутствия некоторого признака; – среднее при наличии некоторого признака; – среднее при отсутствии его.
Коэффициент Фехнера a – число случаев совпадения положительных знаков; b – число случаев совпадения положительных знаков с отрицательными; c – число случаев совпадения отрицательных знаков с положительными; d – число случаев совпадения отрицательных знаков.
Точечно-бисериальный коэффициент корреляции Когда возникает необходимость установить зависимость сопряженных наблюдений, представленных в одном ряду действительными, а в другом - номинальными переменными n 1, n 0 - число случаев наличия и число случаев отсутствия некоторого признака; - среднее при наличии и при отсутствии некоторого признака; - общее среднее для действительных переменных; x - средне-квадратическое отклонение для ряда действительных переменных.
Ранговый коэффициент корреляции Спирмена n – число пар ранжируемых значений в сопоставляемых рядах; – разность рангов для i-й пары наблюдений; t k – длина группы одинаковых (связных) рангов одного ряда, q 1 – число групп связных рангов в нем; u k – длина группы одинаковых (связных) рангов другого ряда, q 2 – число групп связных рангов в нем.
Соотношение между классическим r Бравайса-Пирсона и Спирмена
Ранговый коэффициент корреляции Кендэла если пары наблюдений упорядочить по возрастанию значений в одном ряду, а для другого вычислить n – число пар ранжируемых значений в сопоставляемых рядах ; R i – ранг второго ряда, имеющий после упорядочения номер i; R j – ранг второго ряда, имеющий после упорядочения номер j;
Соотношение между классическим r Бравайса-Пирсона и τ Кендэла
Коэффициент парной корреляции Пирсона для номинальных переменных a – число случаев совпадения положительных знаков ; a – число случаев совпадения положительных знаков ; b – число случаев совпадения положительных знаков с отрицательными; b – число случаев совпадения положительных знаков с отрицательными; c – число случаев совпадения отрицательных знаков с положительными; c – число случаев совпадения отрицательных знаков с положительными; d – число случаев совпадения отрицательных знаков. d – число случаев совпадения отрицательных знаков. Принадлежит к той же метрике, что и τ Кендэла!
Рангово-бисериальный коэффициент корреляции если пары наблюдений расположить по возрастанию значений в ряду рангов, а для номинальных переменных вычислить где x i(j) – значение (нуль или единица) i-го (j-го) параметра в ряду номинальных переменных после упорядочения; n = n o + n 1 - число пар значений (соответственно, n o и n 1 – число нулей и число единиц); tk – число связных (одинаковых) рангов в k-ой из p групп связности.
Совместимые показатели зависимости разнотипных наблюдений данные / коэффициенты интервалыметкиранги интервалы Бравайса- Пирсона Точечно- бисериальный Ранговый Кендэла* метки Точечно- бисериальный Коэффициент Пирсона* Рангово- бисериальный* ранги Ранговый Кендэла* Рангово- бисериальный* Ранговый Кендэла* * показатели, требующие приведения по формуле 7.6
Факторное отображение F × F' = R где, по сути, корреляционной матрице R размерности m × m ставится в соответствие прямоугольная матрица F размерности m × k, и k < m,
Значения факторов W = B' Z, где Z – матрица стандартизованных величин наблюдений, B – матрица коэффициентов регрессии, которые не трудно выразить в транспонированном виде, исходя из величин факторных нагрузок: B' = F' R -1 W = B' Z, где Z – матрица стандартизованных величин наблюдений, B – матрица коэффициентов регрессии, которые не трудно выразить в транспонированном виде, исходя из величин факторных нагрузок: B' = F' R -1
Получение нормированных значений факторов в проекции наблюдений
ЗАКЛЮЧЕНИЕ Таким образом, в испытаниях и эксплуатации систем, где некоторые параметры или не поддаются измерению или по иным причинам не могут быть представлены в количественном выражении интервальными величинами, но определяются или как ранговые или как номинальные, оказывается возможным не только найти для них количественные эквиваленты, но и обойти ограничения на применение средств «сжатия» информации, определяя многомерные корреляции и регрессии, применяя методы факторного анализа, находя не только факторное отображение, но и вычисляя значения факторов. Таким образом, в испытаниях и эксплуатации систем, где некоторые параметры или не поддаются измерению или по иным причинам не могут быть представлены в количественном выражении интервальными величинами, но определяются или как ранговые или как номинальные, оказывается возможным не только найти для них количественные эквиваленты, но и обойти ограничения на применение средств «сжатия» информации, определяя многомерные корреляции и регрессии, применяя методы факторного анализа, находя не только факторное отображение, но и вычисляя значения факторов.
Величины коэффициентов линейной регрессии, отражающих реакцию пациентов психосоматического профиля на первый сеанс групповой суггестотерапии
Фрагмент таблицы параметров наблюдений больных, перенесших хирургическую реваскуляризацию миокарда и реабилитируемых в курортных условиях низкогорья
Результаты вычислений действительных значений атрибутивных параметров наблюдений у больных, перенесших хирургическую реваскуляризацию миокарда и реабилитируемых в курортных условиях низкогорья
Факторное отображение роли параметров наблюдений в условиях курортного лечения у больных, перенесших хирургическую реваскуляризацию миокарда
Значения факторов в проекции наблюдений у больных, перенесших хирургическую реваскуляризацию миокарда и реабилитируемых в курортных условиях низкогорья