Встановити кореляцію. Кореляційний аналіз. Лінійний коефіцієнт кореляції, коефіцієнт кореляції рангів. Коефіцієнт зв'язку якісних ознак. Тема: Кореляційний аналіз

При вивченні громадського здоров'я та охорони здоров'я в наукових та практичних цілях досліднику часто доводиться проводити статистичний аналіз зв'язків між факторними та результативними ознаками статистичної сукупності (причинно-наслідковий зв'язок) або визначення залежності паралельних змін кількох ознак цієї сукупності від якоїсь третьої величини (від загальної їх причини ). Необхідно вміти вивчати особливості цього зв'язку, визначати його розміри та напрямок, а також оцінювати його достовірність. І тому використовуються методи кореляції.

  1. Види прояву кількісних зв'язків між ознаками
    • функціональний зв'язок
    • кореляційний зв'язок
  2. Визначення функціонального та кореляційного зв'язку

    Функціональний зв'язок- такий вид співвідношення між двома ознаками, коли кожному значення одного з них відповідає строго певне значення іншого (площа кола залежить від радіуса кола і т.д.). Функціональний зв'язок характерний для фізико-математичних процесів.

    Кореляційний зв'язок- такий зв'язок, при якому кожному певному значенню однієї ознаки відповідає кілька значень іншої взаємопов'язаної з ним ознаки (зв'язок між зростанням і масою тіла людини; зв'язок між температурою тіла та частотою пульсу та ін.). Кореляційний зв'язок характерний для медико-біологічних процесів.

  3. Практичне значення встановлення кореляційного зв'язку. Виявлення причинно-наслідкової між факторними та результативними ознаками (при оцінці фізичного розвитку, для визначення зв'язку між умовами праці, побуту та станом здоров'я, при визначенні залежності частоти випадків хвороби від віку, стажу, наявності виробничих шкідливостей та ін.)

    Залежність паралельних змін кількох ознак від якоїсь третьої величини. Наприклад, під впливом високої температури в цеху відбуваються зміни кров'яного тиску, в'язкості крові, частоти пульсу та ін.

  4. Величина, що характеризує напрям та силу зв'язку між ознаками. Коефіцієнт кореляції, який одним числом дає уявлення про спрямування та силу зв'язку між ознаками (явами), межі його коливань від 0 до ± 1
  5. Способи подання кореляційного зв'язку
    • графік (діаграма розсіювання)
    • коефіцієнт кореляції
  6. Напрямок кореляційного зв'язку
    • пряма
    • зворотна
  7. Сила кореляційного зв'язку
    • сильна: ±0,7 до ±1
    • середня: ±0,3 до ±0,699
    • слабка: 0 до ±0,299
  8. Методи визначення коефіцієнта кореляції та формули
    • метод квадратів (метод Пірсона)
    • ранговий метод (метод Спірмена)
  9. Методичні вимоги щодо використання коефіцієнта кореляції
    • вимір зв'язку можливий тільки в якісно однорідних сукупностях (наприклад, вимірювання зв'язку між зростанням і вагою в сукупностях, однорідних за статтю та віком)
    • розрахунок може здійснюватися з використанням абсолютних чи похідних величин
    • для обчислення коефіцієнта кореляції використовуються не згруповані варіаційні ряди (ця вимога застосовується лише при обчисленні коефіцієнта кореляції за методом квадратів)
    • кількість спостережень не менше 30
  10. Рекомендації щодо застосування методу рангової кореляції (метод Спірмена)
    • коли немає необхідності в точному встановленні сили зв'язку, а достатньо орієнтовних даних
    • коли ознаки представлені не лише кількісними, а й атрибутивними значеннями
    • коли ряди розподілу ознак мають відкриті варіанти (наприклад, стаж роботи до 1 року та ін.)
  11. Рекомендації щодо застосування методу квадратів (метод Пірсона)
    • коли потрібне точне встановлення сили зв'язку між ознаками
    • коли ознаки мають лише кількісний вираз
  12. Методика та порядок обчислення коефіцієнта кореляції

    1) Метод квадратів

    2) Ранговий метод

  13. Схема оцінки кореляційного зв'язку за коефіцієнтом кореляції
  14. Обчислення помилки коефіцієнта кореляції
  15. Оцінка достовірності коефіцієнта кореляції, отриманого методом рангової кореляції та методом квадратів

    Спосіб 1
    Достовірність визначається за такою формулою:

    Критерій t оцінюється за таблицею значень t з урахуванням числа ступенів свободи (n – 2), де n – число парних варіантів. Критерій t повинен дорівнювати або більше табличного, що відповідає ймовірності р ≥99%.

    Спосіб 2
    Достовірність оцінюється за спеціальною таблицею стандартних коефіцієнтів кореляції. При цьому достовірним вважається такий коефіцієнт кореляції, коли за певної кількості ступенів свободи (n - 2) він дорівнює або більше табличного, відповідного ступеня безпомилкового прогнозу р ≥95%.

на застосування методу квадратів

Завдання:обчислити коефіцієнт кореляції, визначити напрямок і силу зв'язку між кількістю кальцію у воді та жорсткістю води, якщо відомі такі дані (табл. 1). Оцінити достовірність зв'язку. Зробити висновок.

Таблиця 1

Обґрунтування вибору методу.Аби вирішити завдання обрано метод квадратів (Пірсона), т.к. кожна з ознак (жорсткість води та кількість кальцію) має числове вираження; немає відкритих варіантів.

Рішення.
Послідовність розрахунків викладена у тексті, результати представлені у таблиці. Побудувавши ряди з парних ознак, позначити їх через х (жорсткість води в градусах) і через у (кількість кальцію у воді в мг/л).

Жорсткість води
(у градусах)
Кількість кальцію у воді
(в мг/л)
d х d у d х х d у d x 2 d y 2
4
8
11
27
34
37
28
56
77
191
241
262
-16
-12
-9
+7
+14
+16
-114
-86
-66
+48
+98
+120
1824
1032
594
336
1372
1920
256
144
81
49
196
256
12996
7396
4356
2304
9604
14400
М х = Σ х / n М у = Σ у / n Σ d х x d у =7078 Σ d х 2 = 982 Σ d y 2 = 51056
М х = 120/6 = 20 М y = 852/6 = 142
  1. Визначити середні величини M x ряду варіант "х" і М у ряду варіант "у" за формулами:
    М х = Σх/n (графа 1) та
    М у = Σу/n (графа 2)
  2. Знайти відхилення (d х і d у) кожної варіанти від величини обчисленої середньої в ряду "x" та в ряді "у"
    d х = х – М х (графа 3) та d y = у – М у (графа4).
  3. Знайти добуток відхилень d x х d y та підсумувати їх: Σ d х х d у (графа 5)
  4. Кожне відхилення d x і d у звести в квадрат і підсумовувати їх значення по ряду "х" і по ряду "у": d x 2 = 982 (графа 6) і d y 2 = 51056 (графа 7).
  5. Визначити добуток Σ d x 2 х Σ d y 2 і з цього твору витягти квадратний корінь
  6. Отримані величини Σ (d x x d y) та √ (Σd x 2 x Σd y 2)підставляємо у формулу розрахунку коефіцієнта кореляції:
  7. Визначити достовірність коефіцієнта кореляції:
    1-й спосіб. Знайти помилку коефіцієнта кореляції (mr xy) та критерій t за формулами:

    Критерій t = 14,1, що відповідає ймовірності безпомилкового прогнозу р> 99,9%.

    2-й спосіб. Достовірність коефіцієнта кореляції оцінюється за таблицею " Стандартні коефіцієнти кореляції " (див. додаток 1). При числі ступенів свободи (n - 2) = 6 - 2 = 4 наш розрахунковий коефіцієнт кореляції r xу = + 0,99 більше табличного (r табл = + 0,917 при р = 99%).

    Висновок.Чим більше кальцію у воді, тим він жорсткіший (зв'язок пряма, сильна та достовірна: r ху = + 0,99, р> 99,9%).

    на застосування рангового методу

    Завдання:методом рангів встановити напрямок і силу зв'язку між стажем роботи у роках та частотою травм, якщо отримані такі дані:

    Обґрунтування вибору методу:на вирішення завдання можна вибрати лише метод рангової кореляції, т.к. Перший ряд ознаки "стаж роботи у роках" має відкриті варіанти (стаж роботи до 1 року та 7 і більше років), що не дозволяє використовувати для встановлення зв'язку між зіставлюваними ознаками більш точний метод - метод квадратів.

    Рішення. Послідовність розрахунків викладено у тексті, результати представлені у табл. 2.

    Таблиця 2

    Стаж роботи у роках Число травм Порядкові номери (ранги) Різниця рангів Квадрат різниці рангів
    X Y d(х-у) d 2
    До 1 року 24 1 5 -4 16
    1-2 16 2 4 -2 4
    3-4 12 3 2,5 +0,5 0,25
    5-6 12 4 2,5 +1,5 2,25
    7 і більше 6 5 1 +4 16
    Σ d 2 = 38,5

    Стандартні коефіцієнти кореляції, які вважаються достовірними (за Л.С. Камінським)

    Число ступенів свободи - 2 Рівень ймовірності р (%)
    95% 98% 99%
    1 0,997 0,999 0,999
    2 0,950 0,980 0,990
    3 0,878 0,934 0,959
    4 0,811 0,882 0,917
    5 0,754 0,833 0,874
    6 0,707 0,789 0,834
    7 0,666 0,750 0,798
    8 0,632 0,716 0,765
    9 0,602 0,885 0,735
    10 0,576 0,858 0,708
    11 0,553 0,634 0,684
    12 0,532 0,612 0,661
    13 0,514 0,592 0,641
    14 0,497 0,574 0,623
    15 0,482 0,558 0,606
    16 0,468 0,542 0,590
    17 0,456 0,528 0,575
    18 0,444 0,516 0,561
    19 0,433 0,503 0,549
    20 0,423 0,492 0,537
    25 0,381 0,445 0,487
    30 0,349 0,409 0,449

    1. Власов В.В. Епідеміологія. – М.: ГЕОТАР-МЕД, 2004. – 464 с.
    2. Лісіцин Ю.П. Громадське здоров'я та охорона здоров'я. Підручник для вишів. – М.: ГЕОТАР-МЕД, 2007. – 512 с.
    3. Медик В.А., Юр'єв В.К. Курс лекцій з громадського здоров'я та охорони здоров'я: Частина 1. Суспільне здоров'я. – К.: Медицина, 2003. – 368 с.
    4. Міняєв В.А., Вишняков Н.І. та ін Соціальна медицина та організація охорони здоров'я (Керівництво у 2 томах). – СПб, 1998. –528 с.
    5. Кучеренко В.З., Агарков Н.М. та ін. Соціальна гігієна та організація охорони здоров'я (Навчальний посібник) – Москва, 2000. – 432 с.
    6. С. Гланц. Медико-біологічна статистика Пер з англ. – М., Практика, 1998. – 459 с.

При вивченні різних соціально-економічних явищ виділяють функціональний зв'язок та стохастичну залежність. Функціональна зв'язок - це такий вид зв'язку, коли деякому взятому значенню факторного показника відповідає лише одне значення результативного показника. Функціональний зв'язок проявляється у всіх випадках дослідження та для кожної певної одиниці аналізованої сукупності.

Розміщено на www.сайт

У тому випадку, коли причинна залежність діє не в кожному конкретному випадку, а загалом для всієї спостережуваної сукупності, середньому при значній кількості спостережень, така залежність є стохастичною. Окремим випадком стохастичної залежності виступає кореляційний зв'язок, при якому зміна середньої величини результативного показника викликана зміною значень факторних показників. Розрахунок ступеня тісноти та напрями зв'язку виступає значним завданням дослідження та кількісної оцінки взаємозв'язку різних соціально-економічних явищ. Визначення ступеня тісноти зв'язку між різними показниками вимагає визначення рівня співвідношення зміни результативної ознаки від зміни однієї (у разі дослідження парних залежностей) або варіації кількох (у разі дослідження множинних залежностей) ознак-факторів. Для визначення рівня використовується коефіцієнт кореляції.

Лінійний коефіцієнт кореляції було вперше введено на початку 90-х років. ХІХ ст. Пірсоном і показує ступінь тісноти та напрями зв'язку між двома корелюваними факторами у разі, якщо між ними є лінійна залежність. При інтерпретації отримуваного значення лінійного коефіцієнта кореляції ступінь тісноти зв'язку між ознаками оцінюється за шкалою Чеддока, один з варіантів цієї шкали наведено в таблиці нижче:

Шкала Чеддока кількісної оцінки ступеня тісноти зв'язку

Розмір показника тісноти зв'язку

Характер зв'язку

Практично відсутня

Помірна

При інтерпретації значення коефіцієнта лінійної кореляції у напрямку зв'язку виділяють пряму та зворотну. У разі прямого зв'язку з підвищенням чи зниженням величини факторного ознаки відбувається підвищення чи зниження показників результативного ознаки, тобто. зміна фактора та результату відбувається в одному напрямку. Наприклад, підвищення величини прибутку сприяє зростанню показників рентабельності. За наявності зворотний зв'язок значення результативного ознаки змінюються під впливом факторного, але у протилежному напрямі проти динамікою факторного ознаки. Наприклад, з підвищенням продуктивності праці зменшується собівартість одиниці продукції і т.п.

Коефіцієнт кореляції- Це величина, яка може варіювати в межах від +1 до -1. У разі повної позитивної кореляції цей коефіцієнт дорівнює плюс 1 (говорять про те, що при збільшенні значення однієї змінної збільшується значення іншої змінної), а при повній негативній – мінус 1 (свідчать про зворотний зв'язок, тобто При збільшенні значень однієї змінної, значення іншої зменшуються).

Пр1.:

Графік залежності сором'язливості та дипресивності. Як бачимо, точки (випробувані) розташовані не хаотично, а вишиковуються навколо однієї лінії, причому, дивлячись на цю лінію можна сказати, що чим у людини виражена сором'язливість, тим більше депресивність, тобто ці явища взаємопов'язані.

Пр2.: Графік для Сором'язливості та Комунікабельності. Ми бачимо, що зі збільшенням сором'язливості товариськість зменшується. Їхній коефіцієнт кореляції -0,43. Таким чином, коефіцієнт кореляції більший від 0 до 1 говорить про прямопропорційний зв'язок (що більше… тим більше…), а коефіцієнт від -1 до 0 про зворотно-пропорційний (що більше… тим менше…)

Якщо коефіцієнт кореляції дорівнює 0, обидві змінні повністю незалежні один від одного.

Кореляційний зв'язок- це зв'язок, де вплив окремих чинників проявляється лише як тенденція (загалом) при масовому спостереженні фактичних даних. Прикладами кореляційної залежності можуть бути залежності між розмірами активів банку та сумою прибутку банку, зростанням продуктивності праці та стажем роботи працівників.

Використовується дві системи класифікації кореляційних зв'язків за їх силою: загальна та приватна.

Загальна класифікація кореляційних зв'язків: 1) сильна або тісна при коефіцієнті кореляції r> 0,70; 2) середня при 0,500,70, а не просто кореляція високого рівня значущості.

У наведеній нижче таблиці написані назви коефіцієнтів кореляції для різних типів шкал.

Дихотомічна шкала (1/0) Рангова (порядкова) шкала
Дихотомічна шкала (1/0) Коефіцієнт асоціації Пірсона, коефіцієнт чотириклітинної сполученості Пірсона. Бісеріальна кореляція
Рангова (порядкова) шкала Рангово-бісеріальна кореляція. Ранговий коефіцієнт кореляції Спірмена чи Кендала.
Інтервальна та абсолютна шкала Бісеріальна кореляція Значення інтервальної шкали перетворюються на ранги і використовується ранговий коефіцієнт Коефіцієнт кореляції Пірсона (коефіцієнт лінійної кореляції)

При r=0 лінійний кореляційний зв'язок відсутній. У цьому групові середні змінних збігаються зі своїми загальними середніми, а лінії регресії паралельні осям координат.

Рівність r=0 говорить лише про відсутність лінійної кореляційної залежності (некорелювання змінних), але не взагалі про відсутність кореляційної, а тим більше, статистичної залежності.

Іноді висновок про відсутність кореляції важливіше за наявність сильної кореляції. Нульова кореляція двох змінних може свідчити, що жодного впливу однієї змінної іншу немає, за умови, що ми довіряємо результатам вимірів.

У SPSS: 11.3.2 Коефіцієнти кореляції

Досі ми з'ясовували лише сам факт існування статистичної залежності між двома ознаками. Далі ми спробуємо з'ясувати, які висновки можна зробити про силу чи слабкість цієї залежності, а також про її вид та спрямованість. Критерії кількісної оцінки залежності між змінними називаються коефіцієнтами кореляції чи заходами зв'язаності. Дві змінні корелюють між собою позитивно, якщо між ними існує пряме, односпрямоване співвідношення. При односпрямованому співвідношенні малі значення однієї змінної відповідають малим значенням іншої змінної, більші значення – більшим. Дві змінні корелюють між собою негативно, якщо між ними існує зворотне, різноспрямоване співвідношення. При різноспрямованому співвідношенні малі значення однієї змінної відповідають більшим значенням іншої змінної та навпаки. Значення коефіцієнтів кореляції завжди лежать у діапазоні від -1 до +1.

Як коефіцієнт кореляції між змінними, що належать порядковій шкалі, застосовується коефіцієнт Спірмена, а для змінних, що належать до інтервальної шкали - коефіцієнт кореляції Пірсона (момент творів). При цьому слід врахувати, що кожну дихотомічну змінну, тобто змінну, що належить до номінальної шкали та має дві категорії, можна розглядати як порядкову.

Для початку ми перевіримо, чи існує кореляція між змінними sex і psyche з файлу studium.sav. При цьому ми врахуємо, що дихотомічну змінну sex можна вважати порядковою. Виконайте такі дії:

· Виберіть у меню команди Analyze (Аналіз) Descriptive Statistics (Дескриптивні статистики) Crosstabs... (Таблиці сполучення)

· Перенесіть змінну sex до списку рядків, а змінну psyche – до списку стовпців.

· Натисніть кнопку Statistics... (Статистика). У діалозі Crosstabs: Statistics встановіть прапорець Correlations (Кореляції). Виберіть кнопкою Continue.

· У діалозі Crosstabs відмовтеся від виведення таблиць, встановивши прапорець Supress tables (Пригнічувати таблиці). Натисніть кнопку ОК.

Буде обчислено коефіцієнти кореляції Спірмена та Пірсона, а також проведено перевірку їх значущості:

/ СПСС 10

Завдання №10 Кореляційний аналіз

Поняття кореляції

Кореляція чи коефіцієнт кореляції – це статистичний показник імовірніснийзв'язку між двома змінними, виміряними за кількісними шкалами. На відміну від функціонального зв'язку, при якому кожному значенню однієї змінної відповідає суворо визначенезначення іншої змінної, імовірнісний зв'язокхарактеризується тим, що кожному значенню однієї змінної відповідає безліч значеньІншою змінною, Прикладом імовірнісного зв'язку є зв'язок між зростанням і вагою людей. Зрозуміло, що те саме зростання може бути у людей різної ваги і навпаки.

Кореляція є величиною, укладеною в межах від -1 до + 1, і позначається буквою r. Причому, якщо значення знаходиться ближче до 1, це означає наявність сильного зв'язку, а якщо ближче до 0, то слабкої. Значення кореляції менше 0,2 сприймається як слабка кореляція, понад 0,5 – висока. Якщо коефіцієнт кореляції негативний, це означає наявність зворотний зв'язок: що стоїть значення однієї змінної, то нижче значення інший.

Залежно від значень коефіцієнта r, що приймаються, можна виділити різні види кореляції:

Сувора позитивна кореляціявизначається значенням r = 1. Термін «строга» означає, що значення однієї змінної однозначно визначаються значеннями іншої змінної, а термін « позитивна» -що зі зростанням значень однієї змінної значення інший змінної також зростають.

Сувора кореляція є математичною абстракцією і мало зустрічається у реальних дослідженнях.

Позитивна кореляціявідповідає значенням 0

Відсутність кореляціївизначається значенням r = 0. Нульовий коефіцієнт кореляції свідчить, що значення змінних не пов'язані між собою.

Відсутність кореляції H o : 0 r xy =0 формулюється як відображення нульовийгіпотези у кореляційному аналізі.

Негативна кореляція: -1

Сувора негативна кореляціявизначається значенням r = -1. Вона також, як і сувора позитивна кореляція, є абстракцією і не знаходить вираження у практичних дослідженнях.

Таблиця 1

Види кореляції та їх визначення

Метод обчислення коефіцієнта кореляції залежить від виду шкали, за якою виміряно значення змінної.

Коефіцієнт кореляції rПірсонає основним і може використовуватися для змінних з номінальною та частково впорядкованою, інтервальною шкалою, розподіл значень за якими відповідає нормальному (кореляція моментів твору). Коефіцієнт кореляції Пірсона дає досить точні результати у випадках анормальних розподілів.

Для розподілів, які не є нормальними, краще користуватися коефіцієнтами рангової кореляції Спірмена і Кендала. Ранговими вони є тому, що програма попередньо ранжирує змінні, що корелюються.

Кореляцію rСпірмена програмаSPSS обчислює наступним чином: спочатку змінні переводяться в ранги, а потім до рангів застосовується формулаrПірсона.

В основі кореляції, запропонованої М. Кендал, лежить ідея про те, що про напрям зв'язку можна судити, попарно порівнюючи між собою піддослідних. Якщо у пари змінюються по Х збігаються у напрямку зі зміною по Yзбігається, то це свідчить про позитивний зв'язок. Якщо не збігається – то про негативний зв'язок. Цей коефіцієнт застосовується переважно психологами, які працюють із малими вибірками. Оскільки соціологи працюють із великими масивами даних, то перебір пар, виявлення різниці відносних частот та інверсій всіх пар випробуваних у вибірці скрутний. Найбільш поширеним є коеф. Пірсона.

Оскільки коефіцієнт кореляції rПірсона є основним і може використовуватися (з деякою похибкою залежно від типу шкали та рівня анормальності у розподілі) для всіх змінних, виміряних за кількісними шкалами, розглянемо приклади його використання та порівняємо отримані результати з результатами вимірювань за іншими коефіцієнтами кореляції.

Формула обчислення коефіцієнта r- Пірсона:

r xy = ∑ (Xi-Xср)∙(Yi-Yср) / (N-1)∙σ x ∙σ y ∙

Де: Xi, Yi- Значення двох змінних;

Xср, Yср-середні значення двох змінних;

σ x , σ y – стандартні відхилення,

N-кількість спостережень.

Парні кореляції

Наприклад, ми хотіли б з'ясувати, як співвідносяться відповіді між різними видами традиційних цінностей у уявленнях студентів про ідеальне місце роботи (змінні: а9.1, а9.3, а9.5, а9.7), а потім про співвідношення ліберальних цінностей (а9 .2, а9.4. Дані змінні виміряні за 5 – членними впорядкованими шкалами.

Використовуємо процедуру: «Аналіз», «Кореляції», «Парні». За замовчуванням коеф. Пірсона встановлений у діалоговому вікні. Використовуємо коеф. Пірсона

У вікно відбору переносяться змінні, що тестуються: а9.1, а9.3, а9.5, а9.7

Шляхом натискання ОК отримуємо розрахунок:

Кореляції

а9.1.т. Наскільки важливо мати достатньо часу для сім'ї та особистого життя?

Кореляція Пірсона

Знч.(2-сторон)

а9.3.т. Наскільки важливо не боятися втратити свою роботу?

Кореляція Пірсона

Знч.(2-сторон)

а9.5.т. Наскільки важливо мати такого начальника, який радитиметься з Вами, приймаючи те чи інше рішення?

Кореляція Пірсона

Знч.(2-сторон)

а9.7.т. Наскільки важливо працювати у злагодженому колективі, відчувати себе його частиною?

Кореляція Пірсона

Знч.(2-сторон)

** Кореляція значуща лише на рівні 0.01 (2-сторон.).

Таблиця кількісних значень побудованої кореляційної матриці

Приватні кореляції:

Для початку збудуємо парну кореляцію між зазначеними двома змінними:

Кореляції

с8. Відчувають близькість із тими, хто живе поруч із вами, сусідами

Кореляція Пірсона

Знч.(2-сторон)

с12. Відчувають близькість зі своєю родиною

Кореляція Пірсона

Знч.(2-сторон)

**. Кореляція значуща лише на рівні 0.01 (2-сторон.).

Потім використовуємо процедуру побудови приватної кореляції: «Аналіз», «Кореляції», «Приватні».

Припустимо, що цінність «Важливо самостійно визначати та змінювати порядок своєї роботи» у взаємозв'язку із зазначеними змінними виявиться тим вирішальним фактором, під вплив якого раніше виявлений зв'язок зникне, або виявиться малозначимим.

Кореляції

Виключені змінні

с8. Відчувають близькість із тими, хто живе поруч із вами, сусідами

с12. Відчувають близькість зі своєю родиною

с16. Відчувають близькість з людьми, які мають той самий достаток, що й ви

с8. Відчувають близькість із тими, хто живе поруч із вами, сусідами

Кореляція

Значимість (2-сторон.)

с12. Відчувають близькість зі своєю родиною

Кореляція

Значимість (2-сторон.)

Як очевидно з таблиці під впливом контрольної змінної зв'язок дещо знизилася: з 0, 120 до 0, 102. Проте, це зниження зниження дозволяє стверджувати, що рані виявлена ​​зв'язок є відбитком хибної кореляції, т.к. вона залишається досить високою і дозволяє із нульовою похибкою спростовувати нульову гіпотезу.

Коефіцієнт кореляції

Найбільш точний спосіб визначення тісноти та характеру кореляційного зв'язку - знаходження коефіцієнта кореляції. Коефіцієнт кореляції є число, що визначається за формулою:


де r ху – коефіцієнт кореляції;

x i -значення першої ознаки;

у i-значення другої ознаки;

Середня арифметична значень першої ознаки

Середня арифметична значень другої ознаки

Для користування формулою (32) побудуємо таблицю, яка забезпечить необхідну послідовність у підготовці чисел для знаходження чисельника та знаменника коефіцієнта кореляції.

Як видно з формули (32), послідовність дій така: знаходимо середні арифметичні обох ознак х і у, знаходимо різницю між значеннями ознаки та її середньої (х і -) і у і -), потім знаходимо їх добуток (х і -) ( у і - ) – сума останніх дає чисельник коефіцієнта кореляції. Для знаходження його знаменника слід різниці (x i -) і (у і -) звести в квадрат, знайти їх суми і витягти корінь квадратний з їхнього твору.

Так для прикладу 31 знаходження коефіцієнта кореляції відповідно до формули (32) можна подати наступним чином (табл. 50).

Отримана кількість коефіцієнта кореляції дає змогу встановити наявність, тісноту та характер зв'язку.

1. Якщо коефіцієнт кореляції дорівнює нулю, зв'язок між ознаками відсутній.

2. Якщо коефіцієнт кореляції дорівнює одиниці, зв'язок між ознаками настільки великий, що перетворюється на функціональну.

3. Абсолютна величина коефіцієнта кореляції не виходить за межі інтервалу від нуля до одиниці:

Це дає можливість орієнтуватися на тісноту зв'язку: чим величина коефіцієнта ближче до нуля, тим зв'язок слабший, а чим ближче до одиниці, тим більше зв'язок.

4. Знак коефіцієнта кореляції "плюс" означає пряму кореляцію, знак "мінус"-зворотну.

Таблиця 50

х і у і (х і -) (у і -) (х і -) (у і -) (х і -) 2 (у і - )2
14,00 12,10 -1,70 -2,30 +3,91 2,89 5,29
14,20 13,80 -1,50 -0,60 +0,90 2,25 0,36
14,90 14,20 -0,80 -0,20 +0,16 0,64 0,04
15,40 13,00 -0,30 -1,40 +0,42 0,09 1,96
16,00 14,60 +0,30 +0,20 +0,06 0,09 0,04
17,20 15,90 +1,50 +2,25 2,25
18,10 17,40 +2,40 +2,00 +4,80 5,76 4,00
109,80 101,00 12,50 13,97 13,94


Таким чином, обчислений прикладі 31 коефіцієнт кореляції r xy = +0,9. дозволяє зробити такі висновки: існує кореляційний зв'язок між величиною м'язової сили правої та лівої кистей у досліджуваних школярів (коефіцієнт r xy =+0,9 відмінний від нуля), зв'язок дуже тісний (коефіцієнт r xy =+0,9 близький до одиниці), кореляція пряма (коефіцієнт r xy = +0,9 позитивний), т. Е. Зі збільшенням м'язової сили однієї з кистей збільшується сила іншого кисті.

При обчисленні коефіцієнта кореляції та користуванні його властивостями слід врахувати, що висновки дають коректні результати в тому випадку, коли ознаки розподілені нормально і розглядається взаємозв'язок між великою кількістю значень обох ознак.

У розглянутому прикладі 31 аналізовано лише 7 значень обох ознак, що, звичайно, недостатньо для подібних досліджень. Нагадуємо тут ще раз, що приклади, у цій книзі взагалі й у цьому розділі зокрема, мають характер ілюстрації методів, а чи не докладного викладу будь-яких наукових експериментів. Внаслідок цього розглянуто невелику кількість значень ознак, виміри округлені - все це робиться для того, щоб громіздкими обчисленнями не затемнювати ідею методу.

Особливу увагу слід звернути на істоту взаємозв'язку, що розглядається. Коефіцієнт кореляції неспроможна призвести до правильних результатів дослідження, якщо аналіз взаємозв'язку між ознаками проводиться формально. Повернемося ще раз до прикладу 31. Обидві розглянуті ознаки являли собою значення м'язової сили правої та лівої кистей. Уявімо, що під ознакою x i у прикладі 31 (14,0; 14,2; 14,9... ...18,1) ми розуміємо довжину випадково спійманих риб у сантиметрах, а під ознакою у і (12,1 ; 13,8; 14,2... ...17,4) -вага приладів у лабораторії в кілограмах. Формально скориставшись апаратом обчислень знаходження коефіцієнта кореляції і отримавши у разі також r xy =+0>9, ми мали укласти, що з довжиною риб і вагою приладів існує тісний зв'язок прямого характеру. Безглуздість такого висновку очевидна.

Щоб уникнути формального підходу до користування коефіцієнтом кореляції, слід будь-яким іншим методом – математичним, логічним, експериментальним, теоретичним – виявити можливість існування кореляційного зв'язку між ознаками, тобто виявити органічну єдність ознак. Тільки після цього можна приступати до користування кореляційним аналізом та встановлювати величину та характер взаємозв'язку.

У математичній статистиці існує ще поняття множинної кореляції- взаємозв'язку між трьома та більше ознаками. У цих випадках користуються коефіцієнтом множинної кореляції, що складається з парних коефіцієнтів кореляції, описаних вище.

Наприклад, коефіцієнт кореляції трьох ознак-х і , у і , z і - є:

де R xyz -коефіцієнт множинної кореляції, що виражає, як ознака х i залежить від ознак у і і z i;

r xy -коефіцієнт кореляції між ознаками x i та y i;

r xz -коефіцієнт кореляції між ознаками Xi та Zi;

r yz - коефіцієнт кореляції між ознаками y i , z i

Кореляційний аналіз це:

Кореляційний аналіз

Кореляція- статистична взаємозв'язок двох чи кількох випадкових величин (чи величин, які можна з деякою допустимою мірою точності вважати такими). При цьому зміни однієї або декількох з цих величин призводять до систематичної зміни іншої або інших величин. Математичною мірою кореляції двох випадкових величин є коефіцієнт кореляції.

Кореляція може бути позитивною та негативною (можлива також ситуація відсутності статистичного взаємозв'язку - наприклад, для незалежних випадкових величин). Негативна кореляція - кореляція, при якій збільшення однієї змінної пов'язане із зменшенням іншої змінної, при цьому коефіцієнт кореляції негативний. Позитивна кореляція - кореляція, при якій збільшення однієї змінної пов'язане зі збільшенням іншої змінної, при цьому коефіцієнт кореляції є позитивним.

Автокореляція - Статистичний взаємозв'язок між випадковими величинами з одного ряду, але взятих зі зрушенням, наприклад, для випадкового процесу - зі зрушенням за часом.

Метод обробки статистичних даних, що полягає у вивченні коефіцієнтів (кореляції) між змінними, називається кореляційним аналізом.

Коефіцієнт кореляції

Коефіцієнт кореляціїабо парний коефіцієнт кореляціїтеоретично ймовірностей і статистиці - це показник характеру зміни двох випадкових величин. Коефіцієнт кореляції позначається латинською літерою R і може набувати значень між -1 і +1. Якщо значення по модулю знаходиться ближче до 1, це означає наявність сильного зв'язку (при коефіцієнті кореляції рівному одиниці говорять про функціональний зв'язок), а якщо ближче до 0, то слабкої.

Коефіцієнт кореляції Пірсона

Для метричних величин застосовується коефіцієнт кореляції Пірсона, точна формула якого була введена Френсісом Гальтоном:

Нехай X,Y- Дві випадкові величини, визначені на одному імовірнісному просторі. Тоді їхній коефіцієнт кореляції задається формулою:

,

де cov позначає коваріацію, а D - дисперсію, або, що те саме,

,

де символ означає математичне очікування.

Для графічного уявлення подібного зв'язку можна використовувати прямокутну систему координат з осями, які відповідають обох змінних. Кожна пара значень маркується за допомогою певного символу. Такий графік називається "діаграмою розсіювання".

Метод обчислення коефіцієнта кореляції залежить від виду шкали, до якої належать змінні. Так, для вимірювання змінних з інтервальною та кількісною шкалами необхідно використовувати коефіцієнт кореляції Пірсона (кореляція моментів творів). Якщо щонайменше одна з двох змінних має порядкову шкалу або не є нормально розподіленою, необхідно використовувати рангову кореляцію Спірмена або τ (тау) Кендалу. У разі коли одна з двох змінних є дихотомічною, використовується точкова дворядна кореляція, а якщо обидві змінні є дихотомічними: чотирипольова кореляція. Розрахунок коефіцієнта кореляції між двома недихотомічними змінними не позбавлений сенсу лише тоді, коли зв'язок між ними лінійний (односпрямований).

Коефіцієнт кореляції Кенделл

Використовується для виміру взаємної невпорядкованості.

Коефіцієнт кореляції Спірмена

Властивості коефіцієнта кореляції

  • Нерівність Коші – Буняковського:
якщо прийняти як скалярний добуток двох випадкових величин коваріацію, то норма випадкової величини дорівнюватиме , і наслідком нерівності Коші - Буняковського буде: . де . Більше того в цьому випадку знаки та kзбігаються: .

Кореляційний аналіз

Кореляційний аналіз- метод обробки статистичних даних, що полягає у вивченні коефіцієнтів ( кореляції) між змінними. При цьому порівнюються коефіцієнти кореляції між однією парою або безліччю пар ознак для встановлення між ними статистичних взаємозв'язків.

Ціль кореляційного аналізу- Забезпечити отримання деякої інформації про одну змінну за допомогою іншої змінної. У випадках, коли можливе досягнення мети, кажуть, що змінні корелюють. У самому загальному вигляді прийняття гіпотези про наявність кореляції означає, що зміна значення змінної А, відбудеться одночасно з пропорційною зміною значення Б: якщо обидві змінні зростають то кореляція позитивнаякщо одна змінна зростає, а друга зменшується, кореляція негативна.

Кореляція відбиває лише лінійну залежність величин, але з відбиває їх функціональної зв'язності. Наприклад, якщо обчислити коефіцієнт кореляції між величинами A = sin(x) та B = cos(x), він буде близький до нуля, т. е. залежність між величинами відсутня. Тим часом, величини A та B очевидно пов'язані функціонально за законом sin 2(x) + cos 2(x) = 1.

Обмеження кореляційного аналізу



Графіки розподілу пар (x,y) з відповідними коефіцієнтами кореляцій x та y для кожного з них. Зверніть увагу, що коефіцієнт кореляції відображає лінійну залежність (верхній рядок), але не описує криву залежності (середній рядок) і зовсім не підходить для опису складних, нелінійних залежностей (нижній рядок).
  1. Застосування можливе у разі достатньої кількості випадків для вивчення: для конкретного виду коефіцієнта кореляції становить від 25 до 100 пар спостережень.
  2. Друге обмеження випливає з гіпотези кореляційного аналізу, на яку закладено лінійна залежність змінних. У багатьох випадках, коли достовірно відомо, що залежність існує, кореляційний аналіз може не дати результатів просто через те, що залежність нелінійна (виражена, наприклад, у вигляді параболи).
  3. Сам собою факт кореляційної залежності не дає підстави стверджувати, яка зі змінних передує або є причиною змін, або що змінні взагалі причинно пов'язані між собою, наприклад, через дії третього фактора.

Область застосування

Даний метод обробки статистичних даних дуже популярний в економіці та соціальних науках (зокрема в психології та соціології), хоча сфера застосування коефіцієнтів кореляції велика: контроль якості промислової продукції, металознавство, агрохімія, гідробіологія, біометрія та інші.

Популярність методу обумовлена ​​двома моментами: коефіцієнти кореляції щодо прості у підрахунку, їх застосування вимагає спеціальної математичної підготовки. У поєднанні з простотою інтерпретації, простота застосування коефіцієнта призвела до його поширення у сфері аналізу статистичних даних.

Хибна кореляція

Часто приваблива простота кореляційного дослідження підштовхує дослідника робити помилкові інтуїтивні висновки про наявність причинно-наслідкового зв'язку між парами ознак, тоді як коефіцієнти кореляції встановлюють лише статистичні взаємозв'язки.

У сучасній кількісній методології соціальних наук, фактично, відбулася відмова від спроб встановити причинно-наслідкові зв'язки між змінними емпіричними методами, що спостерігаються. Тому, коли дослідники в соціальних науках говорять про встановлення взаємозв'язків між змінними, що вивчаються, мається на увазі або загальнотеоретичне припущення, або статистична залежність.

також

  • Автокореляційна функція
  • Взаємнокореляційна функція
  • Коваріація
  • Коефіцієнт детермінації
  • Регресійний аналіз

Wikimedia Foundation. 2010 року.

Етап 3. Знаходження взаємозв'язку між даними

Лінійна кореляція

Останній етап завдання вивчення зв'язків між явищами – оцінка тісноти зв'язку за показниками кореляційного зв'язку. Цей етап дуже важливий для виявлення залежностей між факторними та результативними ознаками, а отже, для можливості здійснення діагнозу та прогнозу досліджуваного явища.

Діагноз(Від грец. diagnosis розпізнавання) – визначення істоти та особливостей стану будь-якого об'єкта чи явища на основі його всебічного дослідження.

Прогноз(від грец. prognosis передбачення, передбачення) – будь-яке конкретне передбачення, судження про стан будь-якого явища в майбутньому (прогноз погоди, результату виборів тощо). Прогноз - це науково обґрунтована гіпотеза про ймовірний майбутній стан системи, що вивчається, об'єкта або явища і характеризують цей стан показники. Прогнозування – розробка прогнозу, спеціальні наукові дослідження конкретних перспектив розвитку будь-якого явища.

Згадаймо визначення кореляції:

Кореляція- Залежність між випадковими величинами, що виражається в тому, що розподіл однієї величини залежить від значення іншої величини.

Кореляційний зв'язок спостерігається як між кількісними, а й якісними ознаками. Існують різні способи та показники оцінки тісноти зв'язків. Ми зупинимося лише на лінійному коефіцієнті парної кореляції що використовується за наявності лінійного зв'язку між випадковими величинами. На практиці часто виникає необхідність визначити рівень зв'язку між випадковими величинами неоднакової розмірності, тому бажано мати якусь безрозмірну характеристику цього зв'язку. Такою характеристикою (заходом зв'язку) є коефіцієнт лінійної кореляції r xy, який визначається за формулою

де , .

Позначивши і можна отримати наступне вираз для розрахунку коефіцієнта кореляції

.

Якщо ввести поняття нормованого відхилення , яке виражає відхилення значень, що корелюються, від середнього в частках середнього квадратичного відхилення:



той вираз для коефіцієнта кореляції набуде вигляду

.

Якщо проводити розрахунок коефіцієнта кореляції за підсумковими значеннями вихідних випадкових величин із розрахункової таблиці, то коефіцієнт кореляції можна обчислити за формулою

.

Властивості коефіцієнта лінійної кореляції:

1). Коефіцієнт кореляції – безрозмірна величина.

2). |r| £ 1 або .

3). , a,b= const - величина коефіцієнта кореляції не зміниться, якщо всі значення випадкових величин X і Y помножити (або розділити) на константу.

4). , a,b= const - величина коефіцієнта кореляції не зміниться, якщо всі значення випадкових величин X і Y збільшити (або зменшити) на константу.

5). Між коефіцієнтом кореляції та коефіцієнтом регресії існує зв'язок:

Інтерпретувати значення коефіцієнтів кореляції можна так:

Кількісні критерії оцінки тісноти зв'язку:

У прогностичних цілях зазвичай використовують величини з | r | >0.7.

Коефіцієнт кореляції дозволяє зробити висновок про існування лінійної залежності між двома випадковими величинами, але не вказує, яка з величин обумовлює зміну іншої. Насправді зв'язок між двома випадковими величинами може існувати без причинно-наслідкового зв'язку між самими величинами, т.к. зміна обох випадкових величин може бути викликана зміною (впливом) третьої.

Коефіцієнт кореляції r xyє симетричним по відношенню до аналізованих випадкових величин Xі Y. Це означає, що з визначення коефіцієнта кореляції абсолютно байдуже, яка з величин є незалежною, яка – залежною.

Значення коефіцієнта кореляції

Навіть для незалежних величин коефіцієнт кореляції може виявитися відмінним від нуля внаслідок випадкового розсіювання результатів вимірювань або внаслідок невеликої вибірки випадкових величин. Тому слід перевіряти значущість коефіцієнта кореляції.

Значимість лінійного коефіцієнта кореляції перевіряється з урахуванням t-критерію Стьюдента :

.

Якщо t > t кр(P, n-2), то лінійний коефіцієнт кореляції значимий, отже, значима і статистична зв'язок Xі Y.

.

Для зручності обчислень створено таблиці значень довірчих меж коефіцієнтів кореляції для різного числа ступенів свободи f = n–2 (двосторонній критерій) та різних рівнів значимості a= 0,1; 0,05; 0,01 та 0,001. Вважається, що кореляція значуща, якщо розрахований коефіцієнт кореляції перевищує значення довірчої межі коефіцієнта кореляції для заданих fі a.

Для великих nі a= 0,01 значення довірчої межі коефіцієнта кореляції можна обчислити за наближеною формулою

.

При вивченні кореляційнамагаються встановити, чи існує якийсь зв'язок між двома показниками в одній вибірці (наприклад, між зростанням та вагою дітей чи між рівнем IQі шкільною успішністю) або між двома різними вибірками (наприклад, при порівнянні пар близнюків), і якщо цей зв'язок існує, то супроводжується збільшення одного показника зростанням (позитивна кореляція) або зменшенням (негативна кореляція) іншого.

Іншими словами, кореляційний аналіз допомагає встановити, чи можна пророкувати можливі значення одного показника, знаючи величину іншого.

Досі при аналізі результатів нашого досвіду вивчення дії марихуани ми свідомо ігнорували такий показник, як час реакції. Тим часом було б цікаво перевірити, чи існує зв'язок між ефективністю реакцій та їхньою швидкістю. Це дозволило б, наприклад, стверджувати, що чим людина повільніша, тим точніше і ефективнішими будуть її дії і навпаки.

З цією метою можна використовувати два різні способи: параметричний метод розрахунку коефіцієнта Браве – Пірсона (r)та обчислення коефіцієнта кореляції рангів Спірмена (r s ), який застосовується до порядкових даних, тобто є непараметричним. Однак спочатку розберемося в тому, що таке коефіцієнт кореляції.

Коефіцієнт кореляції

Коефіцієнт кореляції - це величина, яка може варіювати в межах від -1 до 1. У разі повної позитивної кореляції цей коефіцієнт дорівнює плюс 1, а за повної негативної - мінус 1. На графіці цьому відповідає пряма лінія, що проходить через точки перетину значень кожної пари даних:

Змінна

У разі якщо ці точки не вишиковуються по прямій лінії, а утворюють «хмару», коефіцієнт кореляції по абсолютній величині стає менше одиниці і в міру округлення цієї хмари наближається до нуля:

Якщо коефіцієнт кореляції дорівнює 0, обидві змінні повністю незалежні один від одного.

У гуманітарних науках кореляція вважається сильною, якщо її коефіцієнт вищий за 0,60; якщо він перевищує 0,90, то кореляція вважається дуже сильної. Однак для того, щоб можна було робити висновки про зв'язки між змінними, велике значення має обсяг вибірки: чим більша вибірка, тим достовірніша величина отриманого коефіцієнта кореляції. Існують таблиці з критичними значеннями коефіцієнта кореляції Браве-Пірсона і Спірмена для різного числа ступенів свободи (воно дорівнює числу пар за вирахуванням 2, тобто. n-2). Тільки тому випадку, якщо коефіцієнти кореляції більше цих критичних значень, можуть вважатися достовірними. Так, для того, щоб коефіцієнт кореляції 0,70 був достовірним, в аналіз має бути взято не менше 8 пар даних ( = п - 2 = 6) при обчисленні r(табл. В.4) та 7 пар даних (= п - 2 = 5) при обчисленні r s (Табл. 5 у додатку Б. 5).

Коефіцієнт Браве – Пірсона

Для обчислення цього коефіцієнта застосовують таку формулу (у різних авторів вона може виглядати по-різному):

де  XY - сума творів даних із кожної пари;

n - Число пар;

- середня для даних змінної X;

Середня для даних змінної Y;

S Х - x;

s Y - стандартне відхилення для розподілу у.

Тепер ми можемо використовувати цей коефіцієнт для того, щоб встановити, чи існує зв'язок між часом реакції випробуваних та ефективністю їх дій. Візьмемо, наприклад, рівень фону контрольної групи.

n= 15  15,8  13,4 = 3175,8;

(n 1)S x S y = 14  3,07  2,29 = 98,42;

r =

Негативне значення коефіцієнта кореляції може означати, що чим більший час реакції, тим нижча ефективність. Однак величина його занадто мала для того, щоб можна було говорити про достовірний зв'язок між цими двома змінними.

nXY=………

(n- 1) S X S Y = ……

Який висновок можна зробити із цих результатів? Якщо ви вважаєте, що між змінними є зв'язок, то який він - прямий чи зворотний? Чи вірна вона [див. табл. 4 (у додатку Б. 5) з критичними значеннями r]?

Коефіцієнт кореляції рангів Спірменаr s

Цей коефіцієнт розраховувати простіше, проте результати виходять менш точними, ніж під час використання r.Це з тим, що з обчисленні коефіцієнта Спірмена використовують порядок слідування даних, а чи не їх кількісні характеристики та інтервали між класами.

Справа в тому, що при використанні коефіцієнта кореляції рангів Спірмена(r s ) перевіряють тільки, чи буде ранжування даних для будь-якої вибірки таким же, як і в ряді інших даних для цієї вибірки, попарно пов'язаних з першими (наприклад, чи однаково «ранжуватимуться» студенти при проходженні ними як психології, так і математики, або навіть за двох різних викладачів психології?). Якщо коефіцієнт близький до + 1, це означає, що обидва ряду практично збігаються, а якщо цей коефіцієнт близький до - 1, можна говорити про повну зворотну залежність.

Коефіцієнт r s обчислюють за формулою

де d-різницю між рангами сполучених значень ознак (незалежно від її знака), а n-Кількість пар.

Зазвичай цей непараметричний тест використовується в тих випадках, коли потрібно зробити якісь висновки не так про інтервалахміж даними, скільки про них рангах,а також тоді, коли криві розподіли надто асиметричні і не дозволяють використовувати такі параметричні критерії, як коефіцієнт r(У цих випадках буває необхідно перетворити кількісні дані на порядкові).

Оскільки саме така ситуація з розподілом значень ефективності та часу реакції в експериментальній групі після впливу, можна повторити розрахунки, які ви вже зробили для цієї групи, тільки тепер не для коефіцієнта r, а для показника r s . Це дозволить подивитися, наскільки розрізняються ці два показники.

* Слід пам'ятати, що

1) для числа попадань 1-й ранг відповідає найвищій, а 15-й-найнижчій результативності, тоді як для часу реакції 1-й ранг відповідає найкоротшому часу, а 15-й-найдовшому;

2) даним ex aequo надається середній ранг.

Таким чином, як і у разі коефіцієнта r,отримано позитивний, хоч і недостовірний, результат. Який із двох результатів правдоподібніший: r =-0,48 або r s = +0,24? Таке питання може стати лише в тому випадку, якщо результати є достовірними.

Хотілося б ще раз наголосити, що сутність цих двох коефіцієнтів дещо різна. Негативний коефіцієнт rвказує на те, що ефективність найчастіше тим вища, чим час реакції менший, тоді як при обчисленні коефіцієнта r s потрібно перевірити, чи завжди швидші випробувані реагують точніше, а повільніші - менш точно.

Оскільки в експериментальній групі після дії було отримано коефіцієнт r s , рівний 0,24, подібна тенденція тут, очевидно, не простежується. Спробуйте самостійно розібратися в даних для контрольної групи після дії, знаючи, що  d 2 = 122,5:

; чи достовірно?

Який ваш висновок?………………………………… ……………………………………………………………

…………………………………………………………………………………………………………………….

Отже, ми розглянули різні параметричні та непараметричні статистичні методи, що використовуються у психології. Наш огляд був дуже поверховим, і головне завдання його полягало в тому, щоб читач зрозумів, що статистика не така страшна, як здається, і вимагає в основному здорового глузду. Нагадуємо, що дані «досвіду», з якими ми тут мали справу, - вигадані і не можуть бути основою будь-яких висновків. Втім, подібний експеримент варто було б справді провести. Оскільки для цього досвіду було вибрано суто класичну методику, такий самий статистичний аналіз можна було б використати в безлічі різних експериментів. У будь-якому разі нам здається, що ми намітили якісь головні напрямки, які можуть виявитися корисними для тих, хто не знає, з чого розпочати статистичний аналіз отриманих результатів.

Існують три основні розділи статистики: описова статистика, індуктивна статистика та кореляційний аналіз.



Поділитися