Главная Обратная связь

Дисциплины:

Архитектура (936)
Биология (6393)
География (744)
История (25)
Компьютеры (1497)
Кулинария (2184)
Культура (3938)
Литература (5778)
Математика (5918)
Медицина (9278)
Механика (2776)
Образование (13883)
Политика (26404)
Правоведение (321)
Психология (56518)
Религия (1833)
Социология (23400)
Спорт (2350)
Строительство (17942)
Технология (5741)
Транспорт (14634)
Физика (1043)
Философия (440)
Финансы (17336)
Химия (4931)
Экология (6055)
Экономика (9200)
Электроника (7621)


 

 

 

 



Основні поняття вибіркового методу



Вибірка. Емпірична функція розподілу. Математична статистика вивчає методи збору і обробки результатів спостережень для одержання наукових і практичних висновків. Методи розв’язування задач в теорії ймовірностей вимагають знання різних ймовірнісних характеристик. При розв’язуванні практичних задач ці характеристики не можуть бути відомими. Математична статистика розглядає методи знаходження необхідних ймовірнісних характеристик за статистичними даними. Тобто, основним предметом дослідження в математичній статистиці є випадкові величини, але висновки про властивості цих випадкових величин робляться на основі статистичних даних.

Одна із важливих задач математичної статистики пов’язана із знаходженням розподілу випадкової величини за статистичними даними. До цієї задачі зводяться багато інших задач. Основними задачами математичної статистики є розробка методів знаходження оцінок (знайдених на основі статистичних даних характеристик досліджуваної величини), дослідження їх точності, розробка методів перевірки гіпотез, аналіз зв’язку між величинами.

Нехай задано сукупність об’єктів, що об’єднані спільною ознакою (кількісною або якісною, якою характеризуються однорідні об’єкти). Її значення для кожного об’єкту передбачити неможливо, тому досліджувана ознака є випадковою величиною. Вивчення властивостей величини пов’язане із проведенням статистичних спостережень – знаходження значень величини для деяких об’єктів. Таким чином можна обстежити всю сукупність або деяку її частину. Обстеження всієї сукупності не завжди доцільне, а інколи просто неможливе. Таким методом, зокрема, здійснюють контроль за якістю продукції, проводять соціологічні дослідження. У всіх таких випадках проводиться обстеження тільки частини об’єктів і по його результатах роблять висновки про всю сукупність. Такий метод називається вибірковим.

Множина значень величини , що одержані в результаті експериментів, називається вибіркою обсягу . Множину всіх значень величини ми будемо називати генеральноюсукупністю. Поняття вибірки вживається і більш широко – як n-вимірна випадкова величина. Вибірка є єдиним джерелом інформації про досліджувану величину. Ми будемо розглядати вибірку організовану методом випадкового відбору. При цьому кожен об’єкт сукупності має однакову ймовірність бути відібраним, така вибірка буде правильно відображати властивості всієї сукупності. На практиці частіше всього використовується вибір без повернення (безповторна вибірка), коли кожен відібраний об’єкт, перед вибором наступних, назад до сукупності не повертається. Вибір з поверненням розглядається частіше в теоретичних дослідженнях. Якщо обсяг вибірки значно менший обсягу досліджуваної сукупності, то обидві вибірки дають практично однакові результати.

При одночасному дослідженні двох (або більшої кількості) ознак вибірка буде складатись із упорядкованих пар (або упорядкованих наборів) чисел.

Для розв’язування багатьох задач важливо знати розподіл досліджуваної випадкової величини, бо на його основі приймають ті чи інші рішення.

Нехай задано вибірку (статистичні дані) для величини . Безпосередньо із вибірки важко зробити якісь висновки про властивості досліджуваної величини, тому необхідно провести первинну обробку результатів спостережень.

Статистичні дані , що записані у порядку зростання ( ), називають варіаційним рядом, а його члени – варіантами.

У варіаційному ряді значення можуть повторюватись. Якщо ми будемо записувати тільки різні значення і, якщо значення зутрічається у вибірці раз, то число називають частотою, а – відносною частотою значення .

Перелік різних варіант і відповідних їм частот (відносних частот) називають емпіричнимабостатистичнимрозподілом (статистичним рядом). Його можна подати у вигляді такої таблиці (надалі дужки в індексах будемо опускати):

 

Варіанти
Частоти

 

Відзначимо, що – обсяг вибірки. Такий розподіл називають дискретним.

Для графічного зображення дискретного розподілу використовують полігон частот (або відносних частот) – це ламана із вершинами в точках (або ).

Якщо досліджується дискретна випадкова величина, кількість можливих значень якої досить велике, або досліджується неперервна випадкова величина, то будують інтервальний статистичний ряд або інтервальний розподіл. Для цього множину всіх значень , від найменшого ( ) до найбільшого ( ), розбивають на певну кількість інтервалів і для кожного із інтервалів вказують число статистичних даних, які в нього попадають. Інтервали можуть мати однакову або різну довжину. При розбитті на нерівні інтервали їх необхідно підбирати так, щоб розподіл в кожному із них був приблизно рівномірним. Кількість інтервалів залежить від мети дослідження. Інтервальний розподіл можна подати у вигляді такої таблиці:

 

Інтервали ...
Частоти ...

 

Тут кількість статистичних даних, що належать i-му інтервалу, а . Якщо замість поставити , то будемо мати емпіричний розподіл відносних частот. Для подальшої обробки результатів спостережень від інтервального розподілу переходять до дискретного, замінюючи кожен інтервал його серединою.

Графічним зображенням інтервального розподілу є гістограма – сукупність прямокутників, основами яких є інтервали групування, а висоти дорівнюють відношенню частоти інтервалу до його довжини . Якщо висоти рівні , то таку сукупність прямокутників називають гістограмою відносних частот. Площа i-го прямокутника дорівнює відносній частоті , яка при збігається за ймовірністю до ймовірності попадання значень випадкової величини у відповідний інтервал. Якщо довжина інтервалу мала, то ця ймовірність приблизно рівна , де – щільність. Отже, верхню межу гістограми можна розглядати як статистичний аналог щільності розподілу досліджуваної випадкової величини.

Визначимо для кожного дійсного x випадкову величину , яка дорівнює числу елементів вибірки, що менші за x, і покладемо . Функція називається емпіричною функцією розподілу. Функцію розподілу , досліджуваної випадкової величини , називають теоретичною функцією розподілу. Емпіричну функцію розподілу можна визначити рівністю . Емпірична функція розподілу є однією із найважливіших характеристик вибірки.

Таким чином, при великих n емпірична функція розподілу в кожній точці є наближеним значенням теоретичної функції розподілу.

 

Вибіркові характеристики. Будь-які характеристики, які знаходяться на основі статистичний даних, називаються емпіричними або статистичними характеристиками, а характеристики, які знаходяться на основі розподілу досліджуваної величини, називаються теоретичними характеристиками.

Використання всіх статистичних даних для аналізу ознаки не завжди доцільно. Для аналізу властивостей досліджуваної ознаки на основі статистичних даних використовують числові характеристики вибірки (статистичні характеристики). До основних характеристик вибірки відносять величини, які характеризують середнє значення та розсіювання можливих значень досліджуваної величини.

Однією із основних характеристик середнього значення є вибіркова середня середнє арифметичне результатів спостережень:

. (1)

Попередню уяву про розсіювання статистичних даних дає розмахваріювання , але ця величина є досить грубою характеристикою розсіювання.

До основних характеристик розсіювання статистичних даних відносять вибірковудисперсію :(середнєарифметичне квадратів відхилень результатів спостережень від вибіркової середньої)

(2)

і вибіркове середнє квадратичне відхилення

.

Для незгрупованих даних вибіркова середня і вибіркова дисперсія знаходяться за формулами (1) і (2). Якщо ж статистичні дані згруповані, то

, , (3)

де – різні результати спостережень випадкової величини , а – відповідні частоти.

Для вибіркової середньої і вибіркової дисперсії для довільних і справедливі формули

, , (4)

де , , а .

При ми дістанемо:

, ,

а якщо , то

,

де .

Нехай статистичні дані розбиті на груп. Обсяг -ї групи позначимо , середнє арифметичне -ї групи позначимо , а дисперсію – . Обсяг всієї сукупності . Тоді справедливі формули:

, .

У останній формулі перший доданок називають внутрігруповою дисперсією, а другий – міжгруповою дисперсією.

Для характеристики середнього значення розглядають також середнє геометричне, середнє гармонійне, моду, медіану, квантилі тощо. Розглянемо емпіричну функцію розподілу . Число називається емпіричною - квантиллю. Можна записати таку формулу: де – член варіаційного ряду із номером [ ]. Медіана– це квантиль . Мода це член варіаційного ряду із найбільшою частотою.

Для більш детального вивчення властивостей розподілу досліджуваної величини використовують емпіричні моменти і центральні емпіричні моменти. Емпіричним моментом r - го порядку (r>0) називають величину

,

а центральним емпіричним моментом r - го порядку –

.

Розглянемо приклад обчислення вибіркової середньої і вибіркової дисперсії.

Приклад. Знайти вибіркову середню і вибіркову дисперсію за заданим емпіричним розподілом

18,4 18,9 19,3 19,6

Розв’язування. Використаємо формули (4) , , де , , а . Покладемо c = 19,3, h = 1. У відповідності до вибраних формул складемо розрахункову таблицю

 

18,4 -0,9 -4,5 4,05
18,9 -0,4 -4 1,6
19,3
19,6 0,3 4,5 1,35
n=50   =4 =7

 

При заповненні третього стовпчика ( ) знаходимо різниці чисел першого і другого стовпчиків, при заповненні четвертого стовпчика знаходимо добуток чисел другого і третього стовпчиків, при заповненні п’ятого стовпчика знаходимо добуток чисел третього і четвертого стовпчиків, що розміщені в одному рядку. В самому нижньому рядку записуємо суми чисел відповідних стовпчиків. Підставляємо одержані значення у формули (4). Тоді = -0,08; . Отже,

= -0,08+19,3 = 19,22; .

 

 



Просмотров 946

Эта страница нарушает авторские права




allrefrs.su - 2024 год. Все права принадлежат их авторам!