Алгебра 8 Сбор и группировка статистических данных Учитель математики МБОУ СОШ 3 Карасукского района Новосибирской области 2012
Сбор и группировка статистических данных Для обобщения и систематизации данных, полученных в результате статистического наблюдения, их по какому-либо признаку разбивают на группы и результаты группировки сводят в таблицы.
Пример 1 Администрация школы решила проверить математическую подготовку восьмиклассников. С этой целью был составлен тест, содержащий 9 заданий. Работу выполняли 40 учащихся школы. При проверке каждой работы учитель отмечал число верно выполненных заданий. В результате был составлен такой ряд чисел: 6, 5, 4, 0, 4, 5, 7, 9, 1, 6, 8, 7, 9, 5, 8, 6, 7, 2, 5, 7, 6, 3, 4, 4, 5, 6, 8, 6, 7, 7, 4, 3, 5, 9, 6, 7, 8, 6, 9, 8.
Пример 1 6, 5, 4, 0, 4, 5, 7, 9, 1, 6, 8, 7, 9, 5, 8, 6, 7, 2, 5, 7, 6, 3, 4, 4, 5, 6, 8, 6, 7, 7, 4, 3, 5, 9, 6, 7, 8, 6, 9, 8 Для того чтобы удобно было анализировать полученные данные, упорядочим этот ряд: 0, 1, 2, 3, 3, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 6, б, 6, 7, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 9, 9, 9, 9.
Число верно выполенных заданий Частота Представим полученные данные в виде таблицы, в которой для каждого числа верно выполненных заданий, записанного в верхней строке, укажем в нижней строке количество появлений этого числа в ряду, т. е. частоту. 0, 1, 2, 3, 3, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 6, б, 6, 7, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 9, 9, 9, 9. Такую таблицу называют таблицей частот. Пример 1
В рассмотренном примере сумма частот равна общему числу проверяемых работ, т. е. 40. Вообще, если результат исследования представлен в виде таблицы частот, то сумма частот равна общему числу данных в ряду.
Анализ статистических данных При проведении статистического исследования после сбора и группировки данных переходят к их анализу, используя для этого различные обобщающие показатели. Простейшими из них являются такие известные вам статистические характеристики, как среднее арифметическое, мода, медиана, размах.
Таблица частот по результатам тестирования восьмиклассников по математике Число верно выполненных заданий Частота среднее арифметическое Чтобы найти среднее арифметическое, надо общее число верно выполненных заданий разделить на число учащихся, т. е. 40. Получаем (0*1+1*1+2*1+3*2+4*5+5*6 + 6*8+7*7 + 8*5 + 9*4)= 232 : 40 = 5,8 Значит, в среднем учащиеся выполнили по 5,8 заданий, т. е. примерно две трети общего объема работы.
Таблица частот по результатам тестирования восьмиклассников по математике Число верно выполненных заданий Частота размах рассматриваемого ряда данных Наибольшее число верно выполненных учащимися заданий равно 9, а наименьшее равно 0. Значит, размах рассматриваемого ряда данных равен 9-0=9, т. е. различие в числе верно выполненных заданий достаточно велико.
Таблица частот по результатам тестирования восьмиклассников по математике Число верно выполненных заданий Частота Из таблицы видно, что чаще всего встречаются работы, в которых верно выполнено 6 заданий, т. е. мода ряда равна 6 мода
Таблица частот по результатам тестирования восьмиклассников по математике Число верно выполненных заданий Частота Так как в ряду всего 40 чисел, то медиана равна среднему арифметическому 20-го и 21-го членов соответствующего упорядоченного ряда. Значит, медиана ряда равна (6 + 6): 2 = 6. 0, 1, 2, 3, 3, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 6, б, 6, 7, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 9, 9, 9, 9.
Таблица частот по результатам тестирования восьмиклассников по математике Число верно выполненных заданий Частота Таблица относительных частот ряда Иногда составляют таблицу, в которой для каждого данного указывается не частота, а отношение частоты к общему числу данных в ряду. Это отношение, выраженное в процентах, называют относительной частотой, а саму таблицу таблицей относительных частот. В нашем примере общая численность данных это число учащихся, писавших работу, т. е. 40. Например, относительная частота данного в ряду, характеризующая количество учащихся, набравших 9 баллов, будет вычисляться 4 : 40*100=0,1*100=10 (Смотри следующий слайд)
Таблица относительных частот ряда Число верно выполненных заданий Относительная частота в % (n:40*100) 2,5 512, ,512,510 Нетрудно убедиться, что сумма относительных частот составляет 100%. Вообще, если по результатам исследования составлена таблица относительных частот, то сумма относительных частот равна 100%.
интервальный ряд Заметим, что если в ряду имеется большое число данных и одинаковые значения встречаются редко, то таблицы частот или относительных частот теряют наглядность и становятся излишне громоздкими. В таких случаях для анализа данных строят интервальный ряд. Для этого разность между наибольшим и наименьшим значениями делят на несколько равных частей (примерно 510) и, округляя полученный результат, определяют длину интервала. За начало первого интервала часто выбирают наименьшее данное или ближайшее к нему целое число, его не превосходящее. Для каждого интервала указывают число данных, попадающих в этот интервал, или выраженное в процентах отношение этого числа к общей численности данных. При этом граничное число обычно считают относящимся к последующему интервалу
Пример интервального ряда Пусть, например, на партии из 50 электроламп изучали продолжительность их горения (в часах). По результатам составили такую таблицу: Продолжительность горения, чЧастота До
Пример интервального ряда Пользуясь составленной таблицей, найдем среднюю продолжительность горения. Для этого составим новую таблицу частот, заменив каждый интервал числом, которое является его серединой Продолжительность горения, чЧастота
средняя продолжительность горения ( *2): 50 ~ 870 (с точностью до десятков). Значит, средняя продолжительность горения электроламп приближенно равна 870 ч Продолжительность горения, чЧастота
В рассмотренном в начале пункта примере были проанализированы результаты выполнения теста восьмиклассниками одной школы. Тот же тест можно было бы использовать для более широкой проверки математической подготовки учащихся, например предложить его восьмиклассникам всех школ города или региона. Заметим, что организация такой проверки связана с серьезными трудностями по пересылке текстов заданий в школы, сбору и проверке работ учащихся, обработке полученных результатов. Вообще проведение любого массового исследования требует больших организационных усилий и финансовых затрат. Например, перепись населения страны связана с подготовкой разнообразной документации, выделением и инструктажем переписчиков, сбором информации, обработкой собранных сведений Выборочное исследование
В тех случаях, когда бывает сложно или даже невозможно провести сплошное исследование, его заменяют выборочным. При выборочном исследовании из всей изучаемой совокупности данных, называемой генеральной совокупностью, выбирается определенная ее часть, т. е. составляется выборочная совокупность (выборка), которая подвергается исследованию. При этом выборка должна быть представительной, или, как говорят, репрезентативной, т. е. достаточной по объему и отражающей характерные особенности исследуемой генеральной совокупности.
Выборочное исследование Пусть, например, в ходе кампании по выборам мэра в городе со стотысячным населением хотят узнать, кто из кандидатов имеет наибольшие шансы на успех. Для этого проводят опрос, например, полутора тысяч избирателей, в ходе которого выясняется, за кого они собираются голосовать. При этом нельзя опрашивать только молодых избирателей или только пенсионеров, так как это может привести к неправильным выводам. Необходимо, чтобы среди опрашиваемых было примерно одинаковое число мужчин и женщин. Кроме того, должны быть представлены люди с разным социальным положением и образованием.
Выборочное исследование Выборочное исследование проводят также и тогда, когда проведение сплошного исследования связано с порчей или уничтожением продукции. Например, при исследовании продолжительности горения партии электроламп, выпущенных заводом, невозможно проверить всю партию, так как это привело бы просто к ее уничтожению
Решение упражнений по теме: «Сбор и группировка данных»
Упражнения На выборах мэра города будут баллотироваться три кандидата: Алексеев, Иванов, Карпов (обозначим их буквами А, И, К). Проводя опрос 50 избирателей, выяснили, за кого из кандидатов они собираются голосовать. Получили следующие данные: И, А, И, И, К, К, И, И, И, А, К, А, А, А, К, К, И, К, А, А, И, К, И, И, К, И, К, А, И, И, И, А, И, И, К, И, А, И, К, К, И, К, А, И, И, И, А, А, К, И. Представьте эти данные в виде таблицы частот. Достаточно ли этих данных, чтобы сделать вывод о предстоящих результатах голосования?
Упражнения На выборах мэра города будут баллотироваться три кандидата: Алексеев, Иванов, Карпов (обозначим их буквами А, И, К). Проводя опрос 50 избирателей, выяснили, за кого из кандидатов они собираются голосовать. Получили следующие данные: Упорядоченный ряд А, А, А, А, А, А, А, А, А, А, А, А, А, И, И, И, И, И, И, И, И, И, И, И, И, И, И, И, И, И, И, И, И, И, И, И, К, К, К, К, К, К, К, К, К, К, К, К, К, К.
Упражнения На выборах мэра города будут баллотироваться три кандидата: Алексеев, Иванов, Карпов (обозначим их буквами А, И, К). Проводя опрос 50 избирателей, выяснили, за кого из кандидатов они собираются голосовать. Получили следующие данные: Упорядоченный ряд А, А, А, А, А, А, А, А, А, А, А, А, А, И, И, И, И, И, И, И, И, И, И, И, И, И, И, И, И, И, И, И, И, И, И, И, К, К, К, К, К, К, К, К, К, К, К, К, К, К. Таблица частот Фамилия кандидатаАИК Частота132314
Упражнения Решение. (Образец записи решения в тетради учащегося) Упорядоченный ряд А, А, А, А, А, А, А, А, А, А, А, А, А, И, И, И, И, И, И, И, И, И, И, И, И, И, И, И, И, И, И, И, И, И, И, И, К, К, К, К, К, К, К, К, К, К, К, К, К, К. Таблица частот Мода статистического ряда равна 23. Это значит, что больше всего голосов при опросе отдано за кандидата по фамилии Иванов. Но этих данных недостаточно, чтобы сделать вывод о результатах предстоящего голосования на выборах мэра города, т.к. выборка из 50 человек не является представительной, т. е. достаточной по объему, чтобы сделать правильный вывод. Фамилия кандидатаАИК Частота132314
Упражнения 1029 В ходе опроса 40 учащихся школы было выяснено, сколько времени (с точностью до 0,5 ч) в неделю они затрачивают на занятия в кружках и спортивных секциях. Получили следующие данные: 5, 1,5, 0, 2,5, 1, 0, 0, 2, 2,5, 3,5, 4, 5, 3,5, 2,5, 0, 1,5, 4,5, 3, 3, 5, 3,5, 4, 3,5, 3, 2,5, 2, 1, 2, 2, 4,5, 4, 3,5, 2, 5, 4, 2, 2,5, 0, 0, 3. Представьте этот ряд данных в виде таблицы частот.
1029 5, 1,5, 0, 2,5, 1, 0, 0, 2, 2,5, 3,5, 4, 5, 3,5, 2,5, 0, 1,5, 4,5, 3, 3, 5, 3,5, 4, 3,5, 3, 2,5, 2, 1, 2, 2, 4,5, 4, 3,5, 2, 5, 4, 2, 2,5, 0, 0, 3. Представьте этот ряд данных в виде таблицы частот. Решение. Упорядоченный ряд 0, 0, 0, 0, 0, 0, 1, 1, 1.5, 1.5, 2, 2, 2, 2, 2, 2, 2.5, 2.5, 2.5, 2.5, 2.5, 3, 3, 3, 3, 3.5, 3.5, 3.5, 3.5, 3.5, 4, 4, 4, 4, 4.5, 4.5, 5, 5, 5, 5 К-во часов в неделю, ч. 011,522,533,544,55 Частота
1029 Решение(Продолжение) Представьте этот ряд данных в виде таблицы частот. Найдите среднее арифметическое, размах, моду и медиану ряда. 0, 0, 0, 0, 0, 0, 1, 1, 1.5, 1.5, 2, 2, 2, 2, 2, 2, 2.5, 2.5, 2.5, 2.5, 2.5, 3, 3, 3, 3, 3.5, 3.5, 3.5, 3.5, 3.5, 4, 4, 4, 4, 4.5, 4.5, 5, 5, 5, 5 Таблица частот 1) Среднее арифметическое. (0*6+1*2+1.5*2+2*6+2.5*5+3*4+3.5*5+4*4+4.5*2+5*4):40=( ):40=104:40=2.6 К-во часов в неделю, ч. 011,522,533,544,55 Частота
1029 Решение (продолжение 1) Представьте этот ряд данных в виде таблицы частот. 0, 0, 0, 0, 0, 0, 1, 1, 1.5, 1.5, 2, 2, 2, 2, 2, 2, 2.5, 2.5, 2.5, 2.5, 2.5, 3, 3, 3, 3, 3.5, 3.5, 3.5, 3.5, 3.5, 4, 4, 4, 4, 4.5, 4.5, 5, 5, 5, 5. Таблица частот 2) Размах. 5-0=5 К-во часов в неделю, ч. 011, 5 22,533,544,55 Частота
1029 Решение (продолжение 2) Представьте этот ряд данных в виде таблицы частот. 0, 0, 0, 0, 0, 0, 1, 1, 1.5, 1.5, 2, 2, 2, 2, 2, 2, 2.5, 2.5, 2.5, 2.5, 2.5, 3, 3, 3, 3, 3.5, 3.5, 3.5, 3.5, 3.5, 4, 4, 4, 4, 4.5, 4.5, 5, 5, 5, 5 Таблица частот 3) Мода. Моды две: 0 и 2 К-во часов в неделю, ч. 011,522,533,544,55 Частота
1029 Решение (Продолжение 3) Представьте этот ряд данных в виде таблицы частот. 0, 0, 0, 0, 0, 0, 1, 1, 1.5, 1.5, 2, 2, 2, 2, 2, 2, 2.5, 2.5, 2.5, 2.5, 2.5, 3, 3, 3, 3, 3.5, 3.5, 3.5, 3.5, 3.5, 4, 4, 4, 4, 4.5, 4.5, 5, 5, 5, 5 Таблица частот 4) Медиана. ( ):2=2.5 К-во часов в неделю, ч. 011,522,533,544,55 Частота
1029 Решение (Образец записи решения в тетради ученика) Представьте этот ряд данных в виде таблицы частот. Упорядоченный ряд 0, 0, 0, 0, 0, 0, 1, 1, 1.5, 1.5, 2, 2, 2, 2, 2, 2, 2.5, 2.5, 2.5, 2.5, 2.5, 3, 3, 3, 3, 3.5, 3.5, 3.5, 3.5, 3.5, 4, 4, 4, 4, 4.5, 4.5, 5, 5, 5, 5 Таблица частот К-во часов в неделю, ч. 011,522,533,544,55 Частота ) Среднее арифметическое. (0*6+1*2+1.5*2+2*6+2.5*5+3*4+3.5*5+4*4+4.5*2+5*4):40=( ):40=104:40=2.6 2) Размах. 5-0=5 3) Мода. Моды две: 0 и 2 4) Медиана. ( ):2=2.5