кандидат технических наук, доцент Поляков Константин Львович Учебный курс Эконометрика: идентификация, оценивание и анализ статических моделей Лекция 4
2 Измерение – присвоение чисел или других символов характеристикам объектов по заранее определенным правилам. При измерении необходимо обеспечить взаимно-однозначное соответствие между степенью выраженности характеристики и множеством присваиваемых символов. Правила присвоения не зависят от объекта, времени и других внутренних и внешних факторов. Шкалирование – отображение множества изучаемых объектов на шкалы, т.е. системы чисел или иных элементов, принятых для оценки или измерения каких-либо величин.
3 Типология шкал (переменных)
4 Номинальная шкала (nominal scale) Символы (числа) служат только для классификации и не характеризуют степень выраженности характеристики. Города Москва Петербург Нижние Васюки Единственная допустимая операция – счет.
5 Порядковая (ранговая) шкала (ordinal scale) Числа, присваиваемые объектам, характеризуют относительную, но не абсолютную степень выраженности характеристик. Эквивалентные объекты имеют одинаковый ранг. Возможны любые преобразования шкалы, которые сохраняют отношение порядка. Кроме счета допустимы операции основанные на квантилях, а также вычисление коэффициентов неметрической корреляции. Допустимо любое сохраняющее порядок преобразование порядковой шкалы.
6 Использование номинальных и порядковых переменных в регрессионном анализе. Категория отеля Две звезды Три звезды Четыре звезды Пять звезд
7 Star Star_2 Star_3 Star_4 Star_5
8 Интервальная шкала (interval scale) Равные интервалы шкалы отображают равные интервалы между степенью выраженности характеристики. Можно сравнивать различия между объектами. ТемператураРейтинг Преобразования вида y=a+bx сохраняют свойства шкалы. Точка начала отсчета не фиксируется. Отношение значений не имеет смысла, а отношение разностей - имеет.
9 Относительная шкала (ratio scale) Определена естественная точка отсчета. Измерение роста Измерение веса Измерение количества денег Допустимы только преобразования шкалы вида y=ax
10 Предварительный анализ данных
11 Диаграммы рассеивания (scatter plot) Линейная зависимость Квадратичная зависимость
12 Только для интервальных и относительных переменных Анализ корреляционной матрицы
13 Анализ влияния не метрических переменных Диаграмма Бокса – Уискера (Box-Whisker) Нижняя квартиль Верхняя квартиль Медиана Среднее * * Верхняя квартиль+1.5 IQR Нижняя квартиль-1.5 IQR Выбросы
14 z – порядковая величина Средние (медианы) убывают с ростом z Разброс при разных значениях z разный. (Гетероскедастичность?) Распределение y асимметрично влево