Скачать презентацию
Идет загрузка презентации. Пожалуйста, подождите
Презентация была опубликована 9 лет назад пользователемЛев Бобринский
1 Основи математичної статистики Розділ 9 Підготувала учитель інформатики Слівіна Л.І
2 Зміст 1.Основні визначення 2.Вибірка та генеральна сукупність 3.Статистичні характеристики вибірки 4.Статистичні функції табличного процесора та їх використання 5.Практичні завдання, практичні роботи
3 Урок 1 1.Основні поняття: статистика, статистичні дані, генеральна сукупність, вибірка, об'єм вибірки, якість вибірки. 2.Практичне завдання1 3.Узагальнення отриманих знань і результатів виконання завдання1
4 Основні поняття Математична статистика - це розділ математики, присвячений методам збору, аналізу і опрацювання статистичних даних для наукових и практичних цілей. В науку термін «статистика » ввів німецький учений Готфрід Ахенваль у 1746 році. Математична статистика досліджує масові явища, застосовується в соціології, економіці, психології на виробництві і т.д. Статистичні дані це дані, отримані в результаті обстеження великої кількості об'єктів чи явищ. Приклад кількість днів, які учень пропустив у школі із-за хвороби надає можливість визначити, яка категорія учнів хворіє частіше і т.д.
5 Завдання 1 Набір з начен ь – числ а, текст, малюнк и, яке опису ють властив ос т і досліджуваного об'єкту або об'єктів. Числові значення будуть називатися статистичні дані. Можна також аналізувати текстові дані, але в меншій мірі. об'єктширинадовжинаколірматеріал 1 Стіл учнівський жовтий дерево 2 Стіл учнівський 89109синійдерево 3 Стіл учнівський 91111блакитнийпластик 4дошка110150чорнийзалізо 5дошка111151білийскло 6дошка119152білийелектронна 7дошка112148білийпластик 8дошка118149брунатнийдерево Статистичні дані яких об'єктів описані у цій таблиці?? Дайте узагальнену інформацію про об'єкти УЧНІВСЬКИЙ СТІЛ та ДОШКА на основі набору значень таблиці. Поясніть як ви отримали ці значення. Чи змінились би суттєво статистичні дані про ці об'єкт и, якби ми мали статистичні дані про всі столи і дошки школи? Чому?
6 Генеральна сукупність, вибірка Генеральна сукупность - це об'єкт дослідження, за територією, за виробництвом, за віком, за заняттям. Приклад 1 Все населення України, Київської області, робітники підприємства «Південьмаш», читачі бібліотеки N і т.д. Вибірка - відібрана по конкретному правилу кількість об'єктів генеральної сукупності. Приклад 2 Статистичні дані про всі існуючі учнівські столи в школі буде генеральна сукупність. А статистичні дані про учнівські столи з таблиці будемо називати вибіркою. Кожне значення вибірки називають варіантою Приклад 3 Якщо зі ста тисяч упаковок деяких ліків (генеральна сукупність) для контролю якості відібрали сто упаковок (вибірка), то об'єм генеральної сукупності складає , а об'єм вибірки – 100.
7 Як визначити об'єм вибірки Якщо для дослідження надаються статистичні дані про 50 однотипних об'єктів, то проводять дослідження над усіма об'єктами. Якщо для дослідження надаються статистичні дані про значно більшу кількість>=1000, для вибірки беруть 2-5% випадкових статистичних даних. Для дослідження 200 повітряних куль, які використовуються у змаганнях можна вибрати 20. Дослідити такі статистичні дані середню швидкість, об'єм, висоту підйому.
8 Генеральна сукупність, вибірка об'єкт 1Населення міста Населення області 2Машини Audi Машини легкові 3ліс Змішаний ліс 4Мобільні телефони Мобільні телефониSamsung 5монітори Монітори Sony Завдання 2 Поясніть, які об'єкти будуть відноситися до генеральної сукупності і які до вибірки і вкажіть приблизно їх обсяг? Чи може обсяг генеральної сукупності об'єкта дослідження бути більше обсягу вибірки? Поясніть відповідь.
9 Завдання 3 Поясніть, які пари об'єктів можна віднести до генеральної сукупності і вибірки, які ні? Поясніть свою відповідь. об'єкт Зріст дорослих людейЗріст дітей Машини КАМАЗв автопаркуМашини вантажні Літнє взуттяЗимове взуття Миші комп'ютерніМиші звичайні Зошити учнівськіЗошити у клітинку одного учня
10 Якість вибірки Зауваження Не треба вибирати дуже багато даних для дослідження – буде складно опрацьовувати отримані дані. Не треба обмежуватись вибіркою декількох сусідніх даних. Краще врахувати випадкові значення вибірки. Репрезентативність вибірки (якщо вона за своєю структурою максимально повторює структуру генеральної сукупності) Приклад Частина жінок і чоловіків серед населення міста складає відповідно 48% и 52%. Ці ж пропорції треба виконувати при вибірці дослідження. Якщо вони будуть порушені і на питання анкети відповіли 55% жінок и 45% чоловіків, то результати дослідження будуть мати суттєві помилки вибірки.
11 Практичне завдання 1 У місті провели опитування серед 100 жінок і серед 100 чоловіків про використання комп'ютера на роботі. Результати опитування наведені в таблиці Визначте, яку помилку зробили опитувачі? Скільки жінок і чоловіків потрібно було опитати, щоб помилка вибірки не погіршувала б результати дослідження. Частина жінок і чоловіків серед населення міста складає відповідно 48% и 52%. Для обчислення скоригованих даних так і ні використовуйте функцію ОКРУГЛ Порівняйте кількість жінок і чоловіків при опитуванні і при корегуванні. Визначте абсолютну і відносну похибку для чоловіків і жінок. Підказка При обчисленні корегованих значень кількість жінок і чоловіків, яку потрібно було опитати і кореговані відповіді використовуйте функцію ОКРУГЛ
12 Узагальнення отриманих знань і результатів виконання завдання1 1.Дослідження якого об'єкту проводили? До якої галузі можна його віднести. 2.Які статистичні дані збиралися? 3.Вкажіть генеральну сукупність, вибірку, об'єм вибірки об'єкту дослідження. 4.Як ви визначали відсоток опитаних, як це значення допомогло вам отримати скориговані значення по категоріям. 5.Де ви тримали абсолютну і відносну похибки. Поясніть причину їх появи. 6.Як запобігти появи цих похибок?
13 Домашнє завдання 1.Вивчити основні поняття. Вміти наводити приклади. 2.Провести дослідження. Серед 100 іспитів визначити кількість випадань Орел і Рішка для монет. Перевірити гіпотезу, що ця кількість буде однаковою
14 Урок 2 1.Бліц – опитування 2.Етапи статистичного дослідження 3.Розбір прикладів 1,2, завдання1. 4.Статистичні показники вибірки: показники центру, показники варіації 5.Обчислення показників центру середнє, мода, медіана. 6.Виконання завдання 2
15 Бліц – опитування Пояснити поняття і терміни 1.Математична статистика це… 2.Термін статистика ввів … 3.Статистичні дані це… 4.Які з наведених значень можна віднести до статистичних даних мореокеан36,6 111вологість1900тепло Генеральна сукупність це … 6. Вибірка це … 7. Варіанта це … 8. Поясніть, які пари об'єктів можна віднести до генеральної сукупності і вибірки, які ні? Поясніть чому. об'єкт овочіфрукти відеокартакомп'ютер папкафайл
16 Створення генеральної сукупності за домашніми іспитами ОР ОР = = Чи можемо ми за отриманими результатами зробити висновок, що наша гіпотеза вірна? 2.Чи зміниться співвідношення наших результатів, якщо зменшити кількість іспитів? 3.Як це вплине на подальші дослідження?
17 Етапи статистичного дослідження 1.Статистичне спостереження ( Збір даних - процес, як правило, трудомісткий і дорогий. Як ви знаєте, цим займаються сьогодні цілі наукові інститути та фонди). Статистичні дані можна збирати не тільки прямими опитуваннями або вимірами, але і за допомогою сучасних засобів ІКТ з мережі Інтернет. 2.Групування первинних статистичних даних (якщо досліджуються декілька ознак об'єкту) 3.Аналіз статистичної інформації (обчислення середнього, найбільшого, найменшого, рангу, і т.д. і зробити висновки за триманими результатами). Приклад1 Нехай середня кількість дітей ясельного віку в місті оцінена вибірковим методом і склала 1,2 людини. Якщо в місті 1000 молодих сімей, то число необхідних місць в дитячих яслах отримують множенням цієї середньої на чисельність генеральної сукупності N = 1000, тобто складе 1200 місць. Приклад2 Дослідження якості запису і зберігання інформації на носіях. 1.Які носії ви будете досліджувати? 2.Як будете формувати вибірку? Як врахувати репрезентативність вибірки? 3.Як на основі отриманих результатів пояснити, чому деякі носії інформації виходять зі вжитку? Поясніть на власному прикладі.
18 Завдання 1 Користувачі соціальної мережі ВКонтакте Для побудови графіку було вибрано 5 тисяч профілів людей старше 17 років. З урахуванням того, що генеральна сукупність вибірки або, простіше кажучи, кількість профілів в базі мережі "В контакті", налічує більш як 13 млн. Вважаємо, що в анкетах зазначена більш-менш актуальна інформація.. Які вибірки потрібні були для отримання таких даних? Які висновки ми могли б зробити та такими діаграмами?
19 Статистичні характеристики вибірки Середнє значення медіана мода Стандартне відхилення Асиметрія варіаційний розмах вибірки 19 Показники центруПоказники варіації
20 Показники центру Мода (елемент вибірки, що зустрічається найчастіше) Середнє значення (середнє арифметичне) Медіана - таке значення, яке ділить упорядковану в порядку зростання або спадання вибірку навпіл. 20
21 Середнє арифметичне Середнє арифметичне представляє собою таке значення ознаки, сума відхилень від якого вибіркових значень ознаки дорівнює нулю. де n - обсяг вибірки; xi - варіанти вибірки. Приклад 1 N=5, маємо зріст учнів класу (145, 137, 147, 136, 144) Хср=( )= 141,8 см Але за отриманим значенням ми не можемо сказати чи є учні такого росту у класі. А на яке питання нам допоможе відповісти це значення? Приклад 2 N=6, маємо ціну ноутбуків (3450, 4600, 6670, 5650, 6400, 4300) Хср=( )= 5178,33грн Знов за отриманим значенням ми не можемо сказати чи є у магазині ноутбук за такою ціною. А на яке питання нам допоможе відповісти це значення?
22 Середнє арифметичне або вибіркове середнє Приклад 3 Вивчаючи тему з інформатики учень отримав наступні відмітки N=6, відмітки(5, 7, 4, 5, 6, 4) Хср=( )= 31/6=5,16 Поясніть на яке питання нам допоможе відповісти це значення? Приклад 4 За робочі дні тижня до окуліста звернулися хворі відповідно за днями N=6 (20, 18, 22, 15, 17, 16). Обчисліть вибіркове середнє. Хср= Поясніть на яке питання нам допоможе відповісти це значення? Приклад 5 На пошті вранці були відправлені посилки N=10, маємо їхню вагу (3, 4, 4, 5, 7, 6, 5, 6, 7, 3). Обчисліть вибіркове середнє. Хср= Знов за отриманим значенням ми не можемо сказати чи є у магазині ноутбук за такою ціною. Поясніть на яке питання нам допоможе відповісти це значення? 18 5
23 Медіана - Позначається буквою M з індексом e. При непарній кількості випадкових величин за медіану приймається безпосередньо центральне значення. Якщо число значень у вибірці парне, то медіана виявляється між двома значеннями. У цьому випадку значення медіани розраховується як середнє арифметичне між ними. Приклад 1 N=5, маємо зріст учнів класу (145, 160, 167, 156, 164) 1.Упорядкуємо значення вибірки за зростанням. 145, 156, 160, 164, Визначимо чи є об'єм вибірки непарним числом. N=5 – непарне. 3.Ділимо об'єм вибірки навпіл і округлюємо тримане число у більшу сторону 5/2=2,5=3 4.Третя варіанта у вибірці =160 –це і буде медіана Ме=160см Приклад 2 N=6, маємо ціну ноутбуків (3450, 4600, 6670, 5650, 6400, 4300) 1. Відсортована вибірка (3450, 4300, 4600, 5650, 6400, 6670) 2. N=6 – парне 3. Визначаємо сусідні варіанти 4600 і Знаходимо між ними середнє значення Ме=5125грн.
24 Медіана Приклад 3 Обчислити медіану N=6, маємо наступні статистичні дані - значення температури (18, 20, 22, 20, 19, 22) Приклад 4 Обчислити медіану N=8, маємо наступні статистичні дані - вартість відеокарт (450, 600, 670, 950, 1000, 530, 850, 740) Приклад 5 Обчислити медіану N=7, маємо наступні статистичні дані - вартість товарів, яку придбала сімя на протязі тижня (230, 156, 670, 400, 1000, 130, 220, 140) Приклад 6 Обчислити медіану N=9, маємо наступні статистичні дані – кількість опадів на протязі 9 місяців. (10, 25, 26, 24, 10, 30, 22, 13)
25 Мода це таке значення у вибірці, яке зустрічається найчастіше. хmod. Приклад: 4, 2, 8, 8, 4, 8, 10. У даному випадку хmod = 8, тому що 8 зустрічається найчастіше у всій вибірці. 1 ситуація. У випадку, коли всі значення вибірки зустрічаються однаково часто, то прийнято вважати, що вибірка не має моди. 4, 2, 6, 7, 5, 10 - не має моди. 4, 2, 4, 2, 4, 2, 6, 6, 6 - не має моди. 4, 2, 4, 2, 4, 2, - не має моди. 4, 4, 4, 4, 4 - мода дорівнює 4 хmod = 4. 2 ситуація. Коли два сусідніх значення в упорядкованій вибірці зустрічаються однаково часто і частіше, ніж всі інші значення, то в цьому випадку мода дорівнює середньому значенню цих двох сусідніх величин. 1, 4, 3, 3, 6, 2, 8, 2, 10 1, 2, 2, 3, 3, 4, 6, 8, 10 - упорядкована вибірка. Хmod = (2 +3): 2 = 2,5 1, 2, 2, 5, 5, 7, 9 (якщо між ними немає інших значень - то сусідні значення) хmod = (2 +5): 2 = 3,5 1, 4, 3, 3, 6, 6, 8, 2, 10 - це не друга ситуація, а третя. Вибірка тут не впорядкована.
26 Мода 3 ситуація. Якщо два не сусідніх значення в упорядкованій вибірці зустрічаються однаково часто і частіше, ніж всі інші значення, то в цьому випадку говорять, що вибірка має дві моди і називають вибірку бімодальною. Приклад: 4, 2, 3, 6, 4, 2 2, 2, 3, 4, 4, 6 4, 2, 3, 6, 4, 2, 6 2, 2, 3, 4, 4, 6, 6 хmod1 = 2; xmod2 = (4 +6): 2 = 5 2, 2, 4, 4, 6, 6, 10, 12 хmod = ( ): 3 = 4 4, 4, 4, 8, 8, 8, 11, 11 xmod = (4 +8): 2 = 6 Наприклад: xmod = 108 (IQ). Значить, у цій групі найбільш часто зустрічається 108, але не йдеться скільки. 4, 4, 4, 2, 6, 7 - хmod = 4
27 Статистичні функції табличного процесора МЕДИАНА і МОДА МЕДИАНА МЕДИАНА(число1;число2;...) А Дані Формула =МЕДИАНА(A2:A6) =МЕДИАНА(A2:A7) A Дані 5, Формула =МОДА(A2:A7) МОДА(число1;число2;...) Якщо варінти не повторюються, то функція МОДА повертає значення помилки #Н/Д.
28 Випадки, коли EXCEL обчислює моду невірно Результат невірний, мода =2,5. Дві сусідні варіанти повторюються двічі. Треба обчислювати їх середнє. Результат невірний. Тут дві моди. Одна мода =2,5. Друга мода=5.
29 Статистична функція табличного процесора Ранг Ранг числа - це його місце щодо інших значень у списку. (Якщо список відсортувати, то ранг числа буде його позицією.) РАНГ (число; посилання; порядок) A Дані 7 3,5 1 2 Формула =РАНГ(A3;A3:A7;1) =РАНГ(A4;A3:A7;1) Можна обчислювати моду без використання спеціальних функцій, але перед застосуванням для обчислення моди статистичні дані треба упорядкувати. Визначити ранг для упорядкованих чисел і самостійно підрахувати кількість однакових чисел. Визначити, яке з них зустрічається частіше. (для невеликих об'ємів вибірки і при помилці обчислення в EXCEL)
30 Статистична функція табличного процесора СЧЕТЕСЛИ Для значних об'ємів вибірки часто буває потрібно визначити кількість однакових варіант у вибірці або кількість варіант вибірки, які задовольняють певним умовам тоді застосовують цю функцію. А також у випадках, коли статистична функція МОДА невірно обчислює значення моди вибірки. AB Дані Яблука32 Апельсини54 Персики75 Яблука86 Формуларезультат =СЧЕТЕСЛИ(A2:A5;"Яблука") (2) =СЧЕТЕСЛИ(B2:B5;">55") (2) 55") (2)">
31 Обчислення моди у складних випадках засобами EXCEL Для використання функції СЧЕТЕСЛИ створіть нову додаткову таблицю і перенесіть в неї по одному значенню ті варіанти, які повторюються в першій таблиці. Підрахуйте скільки разів ці значення повторювалися серед варіант першої таблиці. Відсортуйте отримані значення у порядку зростання. Клітинка у останньому рядку і першому стовпчику буде модою. варіанти, які повторюються Кількість повторень На аркуші Завдання2 спробуйте знайти значення моди описаним способом. =СЧЁТЕСЛИ($B$2:$B$45;D19) Варіанта 1 ст. таб.2 Вибірка у таб.1 варіанти, які повторюються кількість повторень мода
32 Приклади варіанти, які повторюються кількість повторень Визначити моду за такими даними, які отримані після застосування СЧЕТЕСЛИ і сортування. варіанти, які повторюються кількість повторень
33 Завдання 2 У результаті дослідження віку батьків десятикласників були отримані наступні статистичні дані. Обчислити середнє арифметичне, моду і медіану для цих не групованих статистичних даних Зауваження Спочатку упорядкуйте варіанти вибірки. Для обчислення моди у першому випадку можете використовувати функції РАНГ або СЧЕТЕСЛИ. РАНГ застосовуйте для невеликої кількості варіант. А СЧЕТЕСЛИ для значно більшої кількості варіант. середнє значеннямедіанамода без використання статистичних функцій з використанням статистичних функцій
34 Ситуації використання різних середніх характеристик
35 Узагальнення отриманих знань і результатів виконання завдання2 1.Дослідження якого об'єкту проводили? До якої галузі можна його віднести. 2.Які статистичні дані збиралися? 3.Вкажіть генеральну сукупність, вибірку, об'єм вибірки об'єкту дослідження. 4.Як ви визначали моду, медіану, середнє без застосувань статистичних функцій і з ними. 5.Чи відрізняються ці результати? 6.Які проблеми можуть виникнути при обчисленні моди в EXCEL і як їх подолати? 7.Які висновки ми можемо зробити завдяки отриманим результатам?
36 Урок3 1.Бліц – опитування 2.Основні поняття: варіація, показники варіації. 3.Показники варіації в Excel. 4.Обчислення показників варіації Завдання2. 5.Аналіз отриманих статистичних значень. 6.Практична робота 9
37 Бліц – опитування Пояснити поняття і терміни 1.Математична статистика це… 2.Генеральна сукупність це … 3. Вибірка це … 4. Варіанта це … 5.Вкажіть статистичні показники вибірки. 6.Поясніть показники центру: середнє, медіана, мода. 7.Обчисліть середнє, медіана, мода для наступної вибірки
38 Варіація 38 Варіація - це відмінність індивідуальних значень варіанти всередині досліджуваної вибірки, тобто коливання, різноманіття, змінність у окремих варіант вибірки. Для всіх показників варіації загальним є наступні: якщо показник варіації близький до нуля (тобто варіанти мало відрізняються одна від одної), то середня арифметична буде досить показовою (надійної) характеристикою даної вибірки; якщо ж отримаємо значне розсіювання (величина показника варіації сильно відрізняється від нуля, є великий), то середня арифметична буде ненадійною і її практичне застосування буде обмежено.
39 Показники варіації Основними показниками розсіювання є варіаційний розмах, стандартне відхилення, асиметрія. 1.Варіаційний розмах (інтервал, амплітуда) – різниця між максимальним і мінімальним значеннями вибірки. 2.Асиметрія – величина, яка характеризує ступінь несиметричності розподілу відносно його середнього значення. (формула досить складна) Додатна асиметріяя вказує на відхилення розподілу в бік більших середнього значень. Від'ємна асиметріяя вказує на відхилення розподілу в бік менших середнього значень. 3.Стандартне відхилення ступінь розкиду значень вибірки відносно середнього значення визначається за формулою: Середнє квадратичне відхилення показує, на скільки в середньому відхиляються варіанти від його середнього значення.
40 Показники варіації в Excel 1.ДИСП – обчислює дисперсію 2.СТАНДОТКЛОН – стандартне відхилення 3.СКОС- асиметрія 4.МИН, МАКС найменше і найбільше значення для обчислення варіаційного розмаху. СТАНДОТКЛОН( число1; число2;...) СКОС( число1;число2;...) де число1; число2;... – варіанти вибірки для дослідження
41 Обчислення показників варіації Завдання
42 Аналіз отриманих статистичних значень Отримані результати дають зробити припущення, що середній вік батьків старшокласників приблизно 41 рік, і що поява дітей у батьків вкладається у середньостатистичний вік (21-28 років). Це може свідчити про достатньо стабільну економічну ситуацію в країні, коли старшокласники були народжені.
43 Вправа 9.1 Порівняння двох вибірок Виконати обчислення і зробити аналіз отриманих результатів, порівняти з аналізом у підручнику с. 219.
44 Практична робота 9 для профілю Б Виконати обчислення і зробити аналіз отриманих результатів. Які місяці є найбільш чи найменш засушливими? Чи можна вважати розподіл кількості опадів за місяцями рівномірним? Який показник дозволяє це зробити? Які місяці - найбільш чи найменш засушливі – є рідшими у цій вибірці?
45 Узагальнення отриманих знань і результатів виконання практичної роботи 1.Дослідження якого об'єкту проводили? До якої галузі можна його віднести. 2.Які статистичні дані збиралися? 3.Вкажіть генеральну сукупність, вибірку, об'єм вибірки об'єкту дослідження. 4.Як ви визначали моду, медіану, середнє без застосувань статистичних функцій і з ними. 5.Чи відрізняються ці результати? 6.Які проблеми можуть виникнути при обчисленні моди в EXCEL і як їх подолати? 7.Які висновки ми можемо зробити завдяки отриманим результатам?
46 Домашнє завдання 1.Вивчити основні поняття. 2.Виконати самостійну роботу зі с Підготуватися до захисту самостійної роботи. 46
Еще похожие презентации в нашем архиве:
© 2024 MyShared Inc.
All rights reserved.