Stabiliți o corelație. Analiza corelației. Coeficient de corelație liniară, coeficient de corelație de rang. Coeficientul de conectare al caracteristicilor calitative. Tema: Analiza corelației

Atunci când studiază sănătatea publică și asistența medicală în scopuri științifice și practice, cercetătorul trebuie adesea să efectueze o analiză statistică a relațiilor dintre factorii și caracteristicile de performanță ale unei populații statistice (relație cauzală) sau să determine dependența modificărilor paralele în mai multe caracteristici ale acestei populații. pe o a treia valoare (pe cauza lor comună). Este necesar să se poate studia caracteristicile acestei conexiuni, să se determine dimensiunea și direcția acesteia și, de asemenea, să se evalueze fiabilitatea acesteia. În acest scop, se folosesc metode de corelare.

  1. Tipuri de manifestare a relaţiilor cantitative dintre caracteristici
    • conexiune funcțională
    • conexiunea de corelare
  2. Definiții ale conexiunii funcționale și corelaționale

    Conexiune funcțională- acest tip de relație între două caracteristici atunci când fiecare valoare a uneia dintre ele corespunde unei valori strict definite a celeilalte (aria unui cerc depinde de raza cercului etc.). Conexiunea funcțională este caracteristică proceselor fizice și matematice.

    Corelație- o astfel de relație în care fiecare valoare specifică a unei caracteristici corespunde mai multor valori ale altei caracteristici interconectate cu aceasta (relația dintre înălțimea și greutatea unei persoane; relația dintre temperatura corpului și frecvența pulsului etc.). Corelația este tipică pentru procesele medicale și biologice.

  3. Semnificația practică a stabilirii unei conexiuni de corelare. Identificarea relațiilor cauză-efect între factor și caracteristicile rezultate (la evaluarea dezvoltării fizice, pentru a determina relația dintre condițiile de muncă, condițiile de viață și starea de sănătate, atunci când se determină dependența frecvenței cazurilor de boală de vârstă, vechime, prezența riscurilor profesionale etc.)

    Dependența modificărilor paralele ale mai multor caracteristici de o a treia valoare. De exemplu, sub influența temperaturii ridicate din atelier, apar modificări ale tensiunii arteriale, ale vâscozității sângelui, ale pulsului etc.

  4. O valoare care caracterizează direcția și puterea relației dintre caracteristici. Coeficientul de corelație, care într-un număr oferă o idee despre direcția și puterea conexiunii dintre semne (fenomene), limitele fluctuațiilor sale de la 0 la ± 1
  5. Metode de prezentare a corelaţiilor
    • grafic (diagrama de dispersie)
    • coeficient de corelație
  6. Direcția de corelare
    • Drept
    • verso
  7. Puterea corelației
    • puternic: ±0,7 până la ±1
    • medie: ±0,3 până la ±0,699
    • slab: de la 0 la ±0,299
  8. Metode de determinare a coeficientului de corelație și formule
    • metoda pătratelor (metoda Pearson)
    • metoda rangului (metoda Spearman)
  9. Cerințe metodologice pentru utilizarea coeficientului de corelație
    • măsurarea relației este posibilă numai în populații omogene calitativ (de exemplu, măsurarea relației dintre înălțime și greutate în populații omogene după sex și vârstă)
    • calculul se poate face folosind valori absolute sau derivate
    • pentru calcularea coeficientului de corelație se folosesc serii de variații negrupate (această cerință se aplică numai la calcularea coeficientului de corelație folosind metoda pătratelor)
    • numărul de observații cel puțin 30
  10. Recomandări pentru utilizarea metodei de corelare a rangului (metoda Spearman)
    • atunci când nu este nevoie să se stabilească cu exactitate puterea conexiunii, dar datele aproximative sunt suficiente
    • când caracteristicile sunt reprezentate nu numai prin valori cantitative, ci și atributive
    • când seria de distribuție a caracteristicilor are opțiuni deschise (de exemplu, experiență de muncă de până la 1 an etc.)
  11. Recomandări pentru utilizarea metodei pătratelor (metoda Pearson)
    • când este necesară o determinare precisă a forței conexiunii între caracteristici
    • când semnele au doar expresie cantitativă
  12. Metodologia si procedura de calcul al coeficientului de corelatie

    1) Metoda pătratelor

    2) Metoda rangului

  13. Schemă de evaluare a relației de corelație folosind coeficientul de corelație
  14. Calculul erorii coeficientului de corelare
  15. Estimarea fiabilității coeficientului de corelație obținut prin metoda corelației de rang și metoda pătratelor

    Metoda 1
    Fiabilitatea este determinată de formula:

    Criteriul t este evaluat folosind un tabel de valori t, luând în considerare numărul de grade de libertate (n - 2), unde n este numărul de opțiuni pereche. Criteriul t trebuie să fie egal sau mai mare decât cel din tabel, corespunzător unei probabilități p ≥99%.

    Metoda 2
    Fiabilitatea este evaluată folosind un tabel special de coeficienți de corelație standard. În acest caz, un coeficient de corelație este considerat de încredere atunci când, cu un anumit număr de grade de libertate (n - 2), acesta este egal sau mai mare decât cel tabelar, corespunzător gradului de predicție fără erori p ≥95% .

a folosi metoda pătratelor

Exercițiu: se calculează coeficientul de corelație, se determină direcția și rezistența relației dintre cantitatea de calciu din apă și duritatea apei, dacă se cunosc următoarele date (Tabelul 1). Evaluați fiabilitatea relației. Trage o concluzie.

tabelul 1

Justificarea alegerii metodei. Pentru rezolvarea problemei s-a ales metoda pătratelor (Pearson), deoarece fiecare dintre semne (duritatea apei și cantitatea de calciu) are o expresie numerică; nicio optiune deschisa.

Soluţie.
Secvența calculelor este descrisă în text, rezultatele sunt prezentate în tabel. După ce au construit serii de caracteristici comparabile pereche, notați-le cu x (duritatea apei în grade) și cu y (cantitatea de calciu din apă în mg/l).

Duritatea apei
(în grade)
Cantitatea de calciu din apă
(în mg/l)
d x d y d x x d y d x 2 d y 2
4
8
11
27
34
37
28
56
77
191
241
262
-16
-12
-9
+7
+14
+16
-114
-86
-66
+48
+98
+120
1824
1032
594
336
1372
1920
256
144
81
49
196
256
12996
7396
4356
2304
9604
14400
M x =Σ x / n M y =Σ y / n Σ d x x d y =7078 Σ d x 2 =982 Σ d y 2 =51056
M x =120/6=20 M y =852/6=142
  1. Determinați valorile medii ale lui M x în opțiunea de rând „x” și M y în opțiunea de rând „y” folosind formulele:
    M x = Σх/n (coloana 1) și
    M y = Σу/n (coloana 2)
  2. Găsiți abaterea (d x și d y) a fiecărei opțiuni de la media calculată din seria „x” și din seria „y”
    d x = x - M x (coloana 3) și d y = y - M y (coloana 4).
  3. Aflați produsul abaterilor d x x d y și însumați-le: Σ d x x d y (coloana 5)
  4. Patratează fiecare abatere d x și d y și însumează valorile lor de-a lungul seriei „x” și seriei „y”: Σ d x 2 = 982 (coloana 6) și Σ d y 2 = 51056 (coloana 7).
  5. Determinați produsul Σ d x 2 x Σ d y 2 și extrageți rădăcina pătrată din acest produs
  6. Valorile rezultate Σ (d x x d y) și √ (Σd x 2 x Σd y 2)înlocuiți în formula de calcul al coeficientului de corelație:
  7. Determinați fiabilitatea coeficientului de corelație:
    1a metoda. Găsiți eroarea coeficientului de corelație (mr xy) și criteriul t folosind formulele:

    Criteriul t = 14,1, care corespunde probabilității unei prognoze fără erori p > 99,9%.

    a 2-a metoda. Fiabilitatea coeficientului de corelație este evaluată folosind tabelul „Coeficienți de corelație standard” (vezi Anexa 1). Cu numărul de grade de libertate (n - 2)=6 - 2=4, coeficientul nostru de corelație calculat r xу = + 0,99 este mai mare decât cel tabelat (r tabel = + 0,917 la p = 99%).

    Concluzie. Cu cât este mai mult calciu în apă, cu atât este mai greu (conexiune direct, puternic și autentic: rxy = + 0,99, p > 99,9%).

    pentru a utiliza metoda de clasare

    Exercițiu: Folosind metoda rangului, stabiliți direcția și puterea relației dintre anii de experiență în muncă și frecvența accidentărilor dacă se obțin următoarele date:

    Justificarea alegerii metodei: Pentru a rezolva problema se poate alege doar metoda de corelare a rangului, deoarece Primul rând al atributului „experiență de muncă în ani” are opțiuni deschise (experiență de muncă de până la 1 an și 7 sau mai mulți ani), care nu permite utilizarea unei metode mai precise - metoda pătratelor - pentru a stabili o conexiune între caracteristicile comparate.

    Soluţie. Secvența calculelor este prezentată în text, rezultatele sunt prezentate în tabel. 2.

    masa 2

    Experiență de muncă în ani Numărul de răni Numere ordinale (ranguri) Diferența de rang Diferența pătratului de ranguri
    X Y d(x-y) d 2
    Până la 1 an 24 1 5 -4 16
    1-2 16 2 4 -2 4
    3-4 12 3 2,5 +0,5 0,25
    5-6 12 4 2,5 +1,5 2,25
    7 sau mai mult 6 5 1 +4 16
    Σ d 2 = 38,5

    Coeficienți de corelație standard care sunt considerați de încredere (conform L.S. Kaminsky)

    Numărul de grade de libertate - 2 Nivel de probabilitate p (%)
    95% 98% 99%
    1 0,997 0,999 0,999
    2 0,950 0,980 0,990
    3 0,878 0,934 0,959
    4 0,811 0,882 0,917
    5 0,754 0,833 0,874
    6 0,707 0,789 0,834
    7 0,666 0,750 0,798
    8 0,632 0,716 0,765
    9 0,602 0,885 0,735
    10 0,576 0,858 0,708
    11 0,553 0,634 0,684
    12 0,532 0,612 0,661
    13 0,514 0,592 0,641
    14 0,497 0,574 0,623
    15 0,482 0,558 0,606
    16 0,468 0,542 0,590
    17 0,456 0,528 0,575
    18 0,444 0,516 0,561
    19 0,433 0,503 0,549
    20 0,423 0,492 0,537
    25 0,381 0,445 0,487
    30 0,349 0,409 0,449

    1. Vlasov V.V. Epidemiologie. - M.: GEOTAR-MED, 2004. - 464 p.
    2. Lisitsyn Yu.P. Sănătate publică și asistență medicală. Manual pentru universități. - M.: GEOTAR-MED, 2007. - 512 p.
    3. Medic V.A., Yuryev V.K. Curs de prelegeri despre sănătatea publică și sănătatea: Partea 1. Sănătatea publică. - M.: Medicină, 2003. - 368 p.
    4. Minyaev V.A., Vishnyakov N.I. şi altele.Medicina socială şi organizarea sănătăţii (Manual în 2 volume). - Sankt Petersburg, 1998. -528 p.
    5. Kucherenko V.Z., Agarkov N.M. și altele.Organizarea de igienă socială și asistență medicală (Tutorial) - Moscova, 2000. - 432 p.
    6. S. Glanz. Statistica medicala si biologica. Traducere din engleză - M., Praktika, 1998. - 459 p.

La studierea diferitelor fenomene socio-economice se disting conexiunea funcțională și dependența stocastică. O conexiune funcțională este un tip de conexiune în care o singură valoare a indicatorului rezultat corespunde unei valori date a unui indicator de factor. Legătura funcţională se manifestă în toate cazurile de cercetare şi pentru fiecare unitate specifică a populaţiei analizate.

Postat pe www.site

În cazul în care o dependență cauzală nu operează în fiecare caz specific, ci în general pentru întreaga populație observată, în medie pentru un număr semnificativ de observații, atunci o astfel de dependență este stocastică. Un caz special de dependență stocastică este o relație de corelare, în care o modificare a valorii medii a unui indicator de performanță este cauzată de o modificare a valorilor indicatorilor factorilor. Calcularea gradului de apropiere și direcție a comunicării este o sarcină semnificativă în studiul și evaluarea cantitativă a relației dintre diversele fenomene socio-economice. Determinarea gradului de apropiere a relației dintre diverși indicatori necesită determinarea nivelului de corelație dintre modificarea caracteristicii rezultate dintr-o modificare a uneia (în cazul studierii dependențelor pereche) sau variației mai multor (în cazul studierii dependențelor multiple). ) factori caracteristici. Pentru determinarea acestui nivel se folosește coeficientul de corelație.

Coeficientul de corelație liniară a fost introdus pentru prima dată la începutul anilor '90. al XIX-lea Pearson și arată gradul de apropiere și direcția relației dintre doi factori corelați dacă există o relație liniară între ei. La interpretarea valorii rezultate a coeficientului de corelație liniară, gradul de apropiere a relației dintre caracteristici este evaluat folosind scala Chaddock; una dintre variantele acestei scale este prezentată în tabelul de mai jos:

Scala Chaddock pentru evaluarea cantitativă a gradului de apropiere a conexiunii

Valoarea indicatorului de apropiere a conexiunii

Natura comunicării

Practic absent

Moderat

La interpretarea valorii coeficientului de corelație liniară în direcția conexiunii, se disting direct și invers. Dacă există o legătură directă cu o creștere sau scădere a valorii unei caracteristici a factorilor, are loc o creștere sau scădere a indicatorilor caracteristicii rezultate, i.e. modificarea factorului și rezultatul are loc în aceeași direcție. De exemplu, o creștere a marjelor de profit contribuie la o creștere a indicatorilor de profitabilitate. În prezența feedback-ului, valorile caracteristicii rezultate se modifică sub influența caracteristicii factorului, dar în direcția opusă în comparație cu dinamica caracteristicii factorului. De exemplu, cu o creștere a productivității muncii, costul pe unitatea de producție scade etc.

Coeficient de corelație este o valoare care poate varia de la +1 la –1. În cazul unei corelații pozitive complete, acest coeficient este egal cu plus 1 (se spune că atunci când valoarea unei variabile crește, valoarea altei variabile crește), iar în cazul unei corelații complet negative, este minus 1. (indicând feedback, adică atunci când valorile unei variabile cresc, valorile celeilalte scad).

Ex.1:

Graficul relației dintre timiditate și depresie. După cum putem vedea, punctele (subiecții) nu sunt localizate haotic, ci se aliniază în jurul unei linii și, privind această linie, putem spune că cu cât timiditatea unei persoane este mai mare, cu atât depresia este mai mare, adică aceste fenomene sunt interconectate.

Ex2: Tabel pentru timiditate și sociabilitate. Vedem că pe măsură ce timiditatea crește, sociabilitatea scade. Coeficientul lor de corelare este -0,43. Astfel, un coeficient de corelație mai mare de 0 la 1 indică o relație direct proporțională (cu cât mai mult... cu atât mai mult...), iar un coeficient de la -1 la 0 indică o relație invers proporțională (cu cât mai mult... cu atât mai puțin. ..)

Dacă coeficientul de corelație este 0, ambele variabile sunt complet independente una de cealaltă.

Corelație- aceasta este o relație în care impactul factorilor individuali apare doar ca o tendință (în medie) în timpul observării în masă a datelor reale. Exemple de dependențe de corelare pot fi dependențele dintre mărimea activelor băncii și valoarea profitului băncii, creșterea productivității muncii și vechimea în muncă a angajaților.

Două sisteme sunt utilizate pentru a clasifica corelațiile în funcție de puterea lor: general și specific.

Clasificarea generală a corelațiilor: 1) puternică, sau apropiată cu un coeficient de corelație r>0,70; 2) medie cu 0,500,70, și nu doar o corelație de un nivel ridicat de semnificație.

Următorul tabel prezintă denumirile coeficienților de corelație pentru diferite tipuri de scale.

Scară dihotomică (1/0) Scala de rang (ordinal).
Scară dihotomică (1/0) Coeficientul de asociere al lui Pearson, coeficientul de contingență cu patru celule al lui Pearson. Corelație biserială
Scala de rang (ordinal). Corelația rang-biseriala. Coeficientul de corelare a rangului Spearman sau Kendall.
Interval și scară absolută Corelație biserială Valorile scalei intervalului sunt convertite în ranguri și se folosește coeficientul de rang Coeficientul de corelație Pearson (coeficientul de corelație liniară)

La r=0 Nu există o corelație liniară. În acest caz, mediile de grup ale variabilelor coincid cu mediile lor generale, iar liniile de regresie sunt paralele cu axele de coordonate.

Egalitatea r=0 vorbește doar despre absența unei dependențe de corelație liniară (variabile necorelate), dar nu în general despre absența unei corelații și, cu atât mai mult, a unei dependențe statistice.

Uneori, constatarea lipsei unei corelații este mai importantă decât prezența unei corelații puternice. O corelație zero între două variabile poate indica că nu există nicio influență a unei variabile asupra celeilalte, cu condiția să avem încredere în rezultatele măsurătorii.

În SPSS: 11.3.2 Coeficienți de corelație

Până acum am clarificat doar faptul existenței unei relații statistice între două caracteristici. În continuare, vom încerca să aflăm ce concluzii se pot trage despre puterea sau slăbiciunea acestei dependențe, precum și despre tipul și direcția ei. Criteriile de cuantificare a relației dintre variabile se numesc coeficienți de corelație sau măsuri de conectivitate. Două variabile sunt corelate pozitiv dacă există o relație directă, unidirecțională între ele. Într-o relație unidirecțională, valorile mici ale unei variabile corespund unor valori mici ale altei variabile, iar valorile mari corespund unor valori mari. Două variabile se corelează negativ între ele dacă există o relație inversă, multidirecțională. Cu o relație multidirecțională, valorile mici ale unei variabile corespund unor valori mari ale altei variabile și invers. Valorile coeficienților de corelație se află întotdeauna în intervalul de la -1 la +1.

Coeficientul Spearman este utilizat ca coeficient de corelație între variabilele aparținând unei scale ordinale, iar coeficientul de corelație Pearson (momentul produselor) este utilizat pentru variabilele aparținând unei scale de interval. Trebuie avut în vedere că fiecare variabilă dihotomică, adică o variabilă aparținând unei scale nominale și având două categorii, poate fi considerată ordinală.

În primul rând, vom verifica dacă există o corelație între variabilele sex și psihic din fișierul studium.sav. În același timp, vom ține cont de faptul că variabila dihotomică sex poate fi considerată ordinală. Urmați acești pași:

· Selectați din meniul de comandă Analizați tabele încrucișate cu statistici descriptive...

· Mutați variabila sex în lista de rânduri și variabila psihic în lista de coloane.

· Faceți clic pe butonul Statistici.... În caseta de dialog Crosstabs: Statistics, bifați caseta de validare Corelations. Confirmați selecția cu butonul Continuare.

· În dialogul Tabele încrucișate, dezactivați afișarea tabelelor bifând caseta de selectare Suprimare tabele. Faceți clic pe OK.

Se vor calcula coeficienții de corelație Spearman și Pearson și se va testa semnificația lor:

/ SPSS 10

Sarcina nr. 10 Analiza corelației

Conceptul de corelare

Corelația sau coeficientul de corelație este un indicator statistic probabilistică relaţiile dintre două variabile măsurate pe scale cantitative. Spre deosebire de o relație funcțională, în care fiecare valoare a unei variabile corespunde strict definite valoarea unei alte variabile, conexiune probabilistică caracterizată prin faptul că fiecare valoare a unei variabile corespunde sensuri multiple o alta variabila.Un exemplu de relatie probabilistica este relatia dintre inaltimea si greutatea oamenilor. Este clar că oamenii de greutăți diferite pot avea aceeași înălțime și invers.

Corelația este o valoare care variază de la -1 la + 1 și este notă cu litera r. În plus, dacă valoarea este mai aproape de 1, atunci aceasta înseamnă prezența unei conexiuni puternice, iar dacă este mai aproape de 0, atunci este slabă. O valoare de corelație mai mică de 0,2 este considerată o corelație slabă, iar o valoare mai mare de 0,5 este considerată o corelație ridicată. Dacă coeficientul de corelație este negativ, înseamnă că există feedback: cu cât valoarea unei variabile este mai mare, cu atât valoarea celeilalte este mai mică.

În funcție de valorile acceptate ale coeficientului r, se pot distinge diferite tipuri de corelații:

Corelație pozitivă strictă determinată de valoarea r=1. Termenul „strict” înseamnă că valoarea unei variabile este determinată în mod unic de valorile altei variabile, iar termenul „ pozitiv" - că pe măsură ce cresc valorile unei variabile, cresc și valorile altei variabile.

Corelația strictă este o abstractizare matematică și practic nu apare niciodată în cercetarea reală.

Corelație pozitivă corespunde valorilor 0

Fără corelație determinată de valoarea r=0. Un coeficient de corelație zero indică faptul că valorile variabilelor nu sunt în niciun fel legate între ele.

Fără corelație H o : 0 r X y =0 formulată ca o reflecție nul ipoteze în analiza corelaţiei.

Corelație negativă: -1

Corelație negativă strictă determinată de valoarea r= -1. Ea, ca o corelație pozitivă strictă, este o abstractizare și nu își găsește expresie în cercetarea practică.

tabelul 1

Tipuri de corelație și definițiile acestora

Metoda de calcul al coeficientului de corelație depinde de tipul de scară pe care sunt măsurate valorile variabilelor.

Coeficient de corelație rPearson este de bază și poate fi utilizată pentru variabile cu scale de interval nominale și parțial ordonate, distribuția valorilor pe care corespunde normalului (corelația momentului produs). Coeficientul de corelație Pearson oferă rezultate destul de precise în cazurile de distribuții anormale.

Pentru distribuțiile care nu sunt normale, este de preferat să folosiți coeficienții de corelare a rangului Spearman și Kendall. Ele sunt clasate deoarece programul pre-clasifică variabilele corelate.

Programul SPSS calculează corelația r-Spearman după cum urmează: mai întâi, variabilele sunt convertite în ranguri, iar apoi formula Pearson este aplicată rangurilor.

La baza corelației propuse de M. Kendall se află ideea că direcția conexiunii poate fi judecată prin compararea subiecților în perechi. Dacă pentru o pereche de subiecți schimbarea în X coincide în direcția cu schimbarea în Y, atunci aceasta indică o conexiune pozitivă. Dacă nu se potrivește, atunci există o conexiune negativă. Acest coeficient este folosit în primul rând de către psihologii care lucrează cu mostre mici. Deoarece sociologii lucrează cu cantități mari de date, enumerarea perechilor și identificarea diferenței de frecvențe relative și inversiuni ale tuturor perechilor de subiecți din eșantion este dificilă. Cel mai comun este coeficientul. Pearson.

Deoarece coeficientul de corelație Pearson r este de bază și poate fi utilizat (cu o anumită eroare în funcție de tipul de scară și de nivelul de anomalie în distribuție) pentru toate variabilele măsurate pe scale cantitative, vom lua în considerare exemple de utilizare a acestuia și vom compara rezultatele. obţinute cu rezultatele măsurătorilor folosind alţi coeficienţi de corelaţie.

Formula de calcul al coeficientului r- Pearson:

r xy = ∑ (Xi-Xavg)∙(Yi-Yavg) / (N-1)∙σ x ∙σ y ∙

Unde: Xi, Yi - Valorile a două variabile;

Xavg, Yavg - valori medii a două variabile;

σ x, σ y – abateri standard,

N este numărul de observații.

Corelații în perechi

De exemplu, am dori să aflăm cum se corelează răspunsurile între diferitele tipuri de valori tradiționale în ideile elevilor despre un loc ideal de muncă (variabile: a9.1, a9.3, a9.5, a9.7) , iar apoi despre corelația dintre valorile liberale (a9 .2, a9.4, a9.6, a9.8) . Aceste variabile sunt măsurate pe scale ordonate cu 5 articole.

Folosim procedura: „Analiză”,  „Corelații”,  „Pereche”. Coeficient implicit Pearson este setat în caseta de dialog. Folosim coeficientul. Pearson

Variabilele testate sunt transferate în fereastra de selecție: a9.1, a9.3, a9.5, a9.7

Făcând clic pe OK obținem calculul:

Corelații

a9.1.t. Cât de important este să ai timp suficient pentru viața de familie și personală?

corelația Pearson

Valoare (2 părți)

a9.3.t. Cât de important este să nu-ți fie frică de a-ți pierde locul de muncă?

corelația Pearson

Valoare (2 părți)

a9.5.t. Cât de important este să ai un șef care să te consulte atunci când iei una sau alta decizie?

corelația Pearson

Valoare (2 părți)

a9.7.t. Cât de important este să lucrezi într-o echipă bine coordonată și să te simți ca parte a ei?

corelația Pearson

Valoare (2 părți)

** Corelația este semnificativă la nivelul 0,01 (cu două fețe).

Tabelul valorilor cantitative ale matricei de corelație construite

Corelații parțiale:

Mai întâi, să construim o corelație pe perechi între aceste două variabile:

Corelații

s8. Simțiți-vă aproape de cei care locuiesc lângă voi, vecini

corelația Pearson

Valoare (2 părți)

s12. Simțiți-vă aproape de familia lor

corelația Pearson

Valoare (2 părți)

**. Corelația este semnificativă la nivelul 0,01 (2 fețe).

Apoi folosim procedeul de construire a unei corelații parțiale: „Analiză”,  „Corelații”,  „Parțială”.

Să presupunem că valoarea „Este important să determinați și să schimbați în mod independent ordinea muncii dumneavoastră” în raport cu variabilele specificate se dovedește a fi factorul decisiv sub influența căruia relația identificată anterior va dispărea sau se va dovedi a fi nesemnificativ.

Corelații

Variabile excluse

s8. Simțiți-vă aproape de cei care locuiesc lângă voi, vecini

s12. Simțiți-vă aproape de familia lor

p16. Simte-te aproape de oameni care au aceleași venituri ca tine

s8. Simțiți-vă aproape de cei care locuiesc lângă voi, vecini

Corelație

Semnificație (cu două fețe)

s12. Simțiți-vă aproape de familia lor

Corelație

Semnificație (cu două fețe)

După cum se poate observa din tabel, sub influența variabilei de control, relația a scăzut ușor: de la 0,120 la 0,102.Totuși, această scădere ușoară nu ne permite să afirmăm că relația identificată anterior este o reflectare a unei corelații false, deoarece rămâne destul de mare și ne permite să respingem ipoteza nulă cu eroare zero.

Coeficient de corelație

Cea mai precisă modalitate de a determina apropierea și natura corelației este găsirea coeficientului de corelație. Coeficientul de corelație este un număr determinat de formula:


unde r xy este coeficientul de corelație;

x i - valorile primei caracteristici;

y i sunt valorile celui de-al doilea atribut;

Media aritmetică a valorilor primei caracteristici

Media aritmetică a valorilor celei de-a doua caracteristici

Pentru a folosi formula (32), vom construi un tabel care va oferi consistența necesară în pregătirea numerelor pentru a găsi numărătorul și numitorul coeficientului de corelație.

După cum se poate vedea din formula (32), succesiunea acțiunilor este următoarea: găsim mediile aritmetice ale ambelor caracteristici x și y, găsim diferența dintre valorile atributului și media acestuia (x i - ) și y i - ), atunci găsim produsul lor (x i - ) ( y i - ) – suma acestora din urmă dă numărătorul coeficientului de corelație. Pentru a-și găsi numitorul, diferențele (x i - ) și (y i - ) trebuie să fie pătrate, trebuie găsite sumele lor și trebuie luată rădăcina pătrată a produsului lor.

Deci, de exemplu 31, găsirea coeficientului de corelație în conformitate cu formula (32) poate fi reprezentată după cum urmează (Tabelul 50).

Numărul rezultat al coeficientului de corelație face posibilă stabilirea prezenței, proximității și naturii conexiunii.

1. Dacă coeficientul de corelație este zero, nu există nicio legătură între caracteristici.

2. Dacă coeficientul de corelație este egal cu unu, legătura dintre caracteristici este atât de mare încât se transformă într-una funcțională.

3. Valoarea absolută a coeficientului de corelație nu depășește intervalul de la zero la unu:

Acest lucru face posibilă concentrarea asupra strângerii conexiunii: cu cât coeficientul este mai aproape de zero, cu atât conexiunea este mai slabă și cu cât este mai aproape de unitate, cu atât este mai apropiată.

4. Semnul „plus” al coeficientului de corelare înseamnă corelație directă, semnul „minus” înseamnă corelație inversă.

Masa 50

x i y eu (x i - ) (u i - ) (x i - )(y i - ) (x i - )2 (у i - )2
14,00 12,10 -1,70 -2,30 +3,91 2,89 5,29
14,20 13,80 -1,50 -0,60 +0,90 2,25 0,36
14,90 14,20 -0,80 -0,20 +0,16 0,64 0,04
15,40 13,00 -0,30 -1,40 +0,42 0,09 1,96
16,00 14,60 +0,30 +0,20 +0,06 0,09 0,04
17,20 15,90 +1,50 +2,25 2,25
18,10 17,40 +2,40 +2,00 +4,80 5,76 4,00
109,80 101,00 12,50 13,97 13,94


Astfel, coeficientul de corelație calculat în exemplul 31 este r xy = +0,9. ne permite să tragem următoarele concluzii: există o corelație între mărimea forței musculare a mâinii drepte și stângi la școlarii studiați (coeficientul r xy =+0,9 este diferit de zero), relația este foarte strânsă (coeficientul r xy =+0,9 este apropiat de unu) , corelația este directă (coeficientul r xy = +0,9 este pozitiv), adică odată cu creșterea forței musculare a uneia dintre mâini, puterea celeilalte mâini crește.

Atunci când se calculează coeficientul de corelație și se utilizează proprietățile acestuia, trebuie să se țină seama de faptul că concluziile dau rezultate corecte atunci când caracteristicile sunt distribuite normal și când se ia în considerare relația dintre un număr mare de valori ale ambelor caracteristici.

În exemplul considerat 31, au fost analizate doar 7 valori ale ambelor caracteristici, ceea ce, desigur, nu este suficient pentru astfel de studii. Vă reamintim aici încă o dată că exemplele din această carte în general și din acest capitol în special sunt de natura metodelor ilustrative și nu o prezentare detaliată a unor experimente științifice. Ca urmare, au fost luate în considerare un număr mic de valori ale caracteristicilor, măsurătorile au fost rotunjite - toate acestea au fost făcute astfel încât calculele greoaie să nu ascundă ideea metodei.

O atenție deosebită trebuie acordată esenței relației luate în considerare. Coeficientul de corelație nu poate conduce la rezultate corecte ale cercetării dacă relația dintre caracteristici este analizată formal. Să revenim încă o dată la exemplul 31. Ambele semne luate în considerare au fost valorile forței musculare ale mâinii drepte și stângi. Să ne imaginăm că prin semnul x i în exemplul 31 (14,0; 14,2; 14,9... ...18,1) înțelegem lungimea peștelui prins accidental în centimetri, iar prin semn y i (12,1 ; 13,8; 14,2... ... 17.4) - greutatea instrumentelor din laborator în kilograme. După ce am folosit formal aparatul de calcul pentru a găsi coeficientul de corelație și în acest caz, am obținut și r xy =+0>9, a trebuit să concluzionăm că există o relație strânsă directă între lungimea peștelui și greutatea instrumentelor. Inutilitatea unei astfel de concluzii este evidentă.

Pentru a evita o abordare formală a utilizării coeficientului de corelație, ar trebui să se folosească orice altă metodă - matematică, logică, experimentală, teoretică - pentru a identifica posibilitatea existenței unei corelații între caracteristici, adică pentru a descoperi unitatea organică a caracteristicilor. Abia după aceasta se poate începe să se utilizeze analiza corelației și să se stabilească amploarea și natura relației.

În statistica matematică există și conceptul corelație multiplă- relaţii între trei sau mai multe caracteristici. În aceste cazuri, se utilizează un coeficient de corelație multiplă, constând din coeficienții de corelație perechi descriși mai sus.

De exemplu, coeficientul de corelație a trei caracteristici - x i, y i, z i - este:

unde R xyz este coeficientul de corelație multiplă, exprimând modul în care caracteristica x i depinde de caracteristicile y i și z i;

r xy - coeficientul de corelație între caracteristicile x i și y i;

r xz - coeficientul de corelație între caracteristicile Xi și Zi;

r yz - coeficient de corelație între caracteristicile y i , z i

Analiza corelației este:

Analiza corelației

Corelație- relația statistică între două sau mai multe variabile aleatoare (sau variabile care pot fi considerate ca atare cu un grad acceptabil de acuratețe). Mai mult, modificările uneia sau mai multor dintre aceste cantități conduc la o modificare sistematică a unei alte cantități sau a altor cantități. O măsură matematică a corelației dintre două variabile aleatoare este coeficientul de corelație.

Corelația poate fi pozitivă și negativă (de asemenea, este posibil să nu existe o relație statistică - de exemplu, pentru variabile aleatoare independente). Corelație negativă - corelație, în care o creștere a unei variabile este asociată cu o scădere a unei alte variabile, iar coeficientul de corelație este negativ. Corelație pozitivă - corelație, în care o creștere a unei variabile este asociată cu o creștere a unei alte variabile, iar coeficientul de corelație este pozitiv.

Autocorelare - relație statistică între variabile aleatoare din aceeași serie, dar luate cu o schimbare, de exemplu, pentru un proces aleator - cu o schimbare în timp.

Metoda de prelucrare a datelor statistice, care constă în studierea coeficienților (corelației) dintre variabile, se numește analiza corelației.

Coeficient de corelație

Coeficient de corelație sau coeficient de corelație de perecheîn teoria probabilității și statistică, este un indicator al naturii modificării a două variabile aleatoare. Coeficientul de corelație este notat cu litera latină R și poate lua valori între -1 și +1. Dacă valoarea absolută este mai aproape de 1, atunci aceasta înseamnă prezența unei conexiuni puternice (dacă coeficientul de corelație este egal cu unu, vorbim de o conexiune funcțională), iar dacă este mai aproape de 0, atunci este slab.

Coeficientul de corelație Pearson

Pentru mărimile metrice se folosește coeficientul de corelație Pearson, a cărui formulă exactă a fost introdusă de Francis Galton:

Lăsa X,Y- două variabile aleatoare definite pe același spațiu de probabilitate. Atunci coeficientul lor de corelare este dat de formula:

,

unde cov denotă covarianță și D este varianță sau echivalent,

,

unde simbolul denotă așteptarea matematică.

Pentru a reprezenta grafic o astfel de relație, puteți utiliza un sistem de coordonate dreptunghiular cu axe care corespund ambelor variabile. Fiecare pereche de valori este marcată cu un simbol specific. Acest grafic se numește „scatterplot”.

Metoda de calcul al coeficientului de corelație depinde de tipul de scară căreia îi aparțin variabilele. Astfel, pentru măsurarea variabilelor cu scale de interval și cantitative, este necesar să se utilizeze coeficientul de corelație Pearson (corelația momentului produsului). Dacă cel puțin una dintre cele două variabile este pe o scară ordinală sau nu este distribuită normal, trebuie utilizată corelația de rang a lui Spearman sau τ (tau) a lui Kendal. În cazul în care una dintre cele două variabile este dihotomică, se utilizează o corelație punct-biserială, iar dacă ambele variabile sunt dihotomice: o corelație cu patru câmpuri. Calcularea coeficientului de corelație dintre două variabile nedihotomice are sens numai atunci când relația dintre ele este liniară (unidirecțională).

Coeficientul de corelație Kendell

Folosit pentru a măsura dezordinea reciprocă.

Coeficientul de corelație Spearman

Proprietățile coeficientului de corelație

  • Inegalitatea Cauci-Bunyakovsky:
dacă luăm covarianța ca produs scalar a două variabile aleatoare, atunci norma variabilei aleatoare va fi egală cu , iar consecinţa inegalităţii Cauci-Bunyakovsky va fi: . , Unde . Mai mult, în acest caz semnele și k potrivire: .

Analiza corelației

Analiza corelației- metoda de prelucrare a datelor statistice, care consta in studierea coeficientilor ( corelații) între variabile. În acest caz, se compară coeficienții de corelație între o pereche sau mai multe perechi de caracteristici pentru a stabili relații statistice între ele.

Ţintă analiza corelației- furnizați câteva informații despre o variabilă folosind o altă variabilă. În cazurile în care este posibilă atingerea unui scop, se spune că variabilele sunt corela. În forma sa cea mai generală, acceptarea ipotezei unei corelații înseamnă că o modificare a valorii variabilei A va avea loc concomitent cu o modificare proporțională a valorii lui B: dacă ambele variabile cresc, atunci corelația este pozitivă, dacă o variabilă crește și cealaltă scade, corelația este negativă.

Corelația reflectă doar dependența liniară a valorilor, dar nu reflectă conectivitatea lor funcțională. De exemplu, dacă calculați coeficientul de corelație dintre cantități A = sin(X) Și B = cos(X), atunci va fi aproape de zero, adică nu există nicio dependență între cantități. Între timp, mărimile A și B sunt în mod evident legate funcțional conform legii sin 2(X) + cos 2(X) = 1.

Limitările analizei corelației



Grafice ale distribuțiilor de perechi (x,y) cu coeficienții de corelație x și y corespunzători pentru fiecare dintre ele. Rețineți că coeficientul de corelație reflectă o relație liniară (linia de sus), dar nu descrie o curbă de relație (linia de mijloc) și nu este deloc potrivit pentru a descrie relații complexe, neliniare (linia de jos).
  1. Aplicarea este posibilă dacă există un număr suficient de cazuri pentru studiu: pentru un anumit tip, coeficientul de corelație variază de la 25 la 100 de perechi de observații.
  2. A doua limitare rezultă din ipoteza analizei corelației, care include dependența liniară a variabilelor. În multe cazuri, când se știe în mod sigur că există o relație, analiza corelației poate să nu dea rezultate pur și simplu pentru că relația este neliniară (exprimată, de exemplu, ca o parabolă).
  3. Simplul fapt de corelare nu oferă motive pentru a afirma care dintre variabile precede sau provoacă modificări sau că variabilele sunt în general legate între ele cauzal, de exemplu, datorită acțiunii unui al treilea factor.

Zona de aplicare

Această metodă de prelucrare a datelor statistice este foarte populară în științe economice și sociale (în special în psihologie și sociologie), deși sfera de aplicare a coeficienților de corelare este extins: controlul calității produselor industriale, metalurgie, agrochimie, hidrobiologie, biometrie și altele.

Popularitatea metodei se datorează a doi factori: coeficienții de corelație sunt relativ ușor de calculat, iar utilizarea lor nu necesită pregătire matematică specială. Combinată cu ușurința sa de interpretare, ușurința în aplicare a coeficientului a condus la utilizarea pe scară largă în domeniul analizei datelor statistice.

Falsă corelație

Adesea, simplitatea tentantă a cercetării de corelație încurajează cercetătorul să tragă concluzii intuitive false despre prezența unei relații cauză-efect între perechile de caracteristici, în timp ce coeficienții de corelație stabilesc doar relații statistice.

Metodologia cantitativă modernă a științelor sociale a abandonat, de fapt, încercările de a stabili relații cauză-efect între variabilele observate folosind metode empirice. Prin urmare, atunci când cercetătorii din științe sociale vorbesc despre stabilirea unor relații între variabilele studiate, este implicată fie o presupunere teoretică generală, fie o dependență statistică.

Vezi si

  • Funcția de autocorelare
  • Funcția de corelație încrucișată
  • Covarianta
  • Coeficient de determinare
  • Analiza de regresie

Fundația Wikimedia. 2010.

Etapa 3. Găsirea relațiilor dintre date

Corelație liniară

Ultima etapă a sarcinii de studiu a legăturilor dintre fenomene este evaluarea strângerii conexiunii folosind indicatori de corelație. Această etapă este foarte importantă pentru identificarea dependențelor dintre factori și caracteristicile de performanță și, în consecință, pentru posibilitatea de a realiza un diagnostic și prognostic al fenomenului studiat.

Diagnostic(din recunoașterea diagnosticului grecesc) - determinarea esenței și a caracteristicilor stării unui obiect sau fenomen pe baza studiului său cuprinzător.

Prognoza(din prognoza greacă previziune, predicție) - orice predicție specifică, judecată despre starea oricărui fenomen în viitor (prognoză meteo, rezultatul alegerilor etc.). O prognoză este o ipoteză bazată științific despre starea viitoare probabilă a sistemului, obiectului sau fenomenului studiat și indicatorii care caracterizează această stare. Prognoza este elaborarea unei prognoze, cercetare științifică specială a perspectivelor specifice de dezvoltare a unui fenomen.

Să ne amintim definiția corelației:

Corelație– dependența dintre variabile aleatoare, exprimată în faptul că distribuția unei valori depinde de valoarea altei valori.

Se observă o corelație nu numai între caracteristicile cantitative, ci și calitative. Există diverse metode și indicatori pentru evaluarea strângerii legăturilor. Ne vom opri doar la coeficientul de corelație liniar pereche , care este folosit atunci când există o relație liniară între variabile aleatoare. În practică, este adesea necesar să se determine nivelul de conexiune dintre variabile aleatoare de dimensiuni inegale, deci este de dorit să existe un fel de caracteristică adimensională a acestei conexiuni. O astfel de caracteristică (măsura conexiunii) este coeficientul de corelație liniară r xy, care este determinat de formula

Unde , .

Notând și , putem obține următoarea expresie pentru calcularea coeficientului de corelație

.

Dacă introducem conceptul abatere normalizată , care exprimă abaterea valorilor corelate de la media în fracții din abaterea standard:



atunci expresia pentru coeficientul de corelare va lua forma

.

Dacă calculați coeficientul de corelație folosind valorile finale ale variabilelor aleatoare originale din tabelul de calcul, atunci coeficientul de corelație poate fi calculat folosind formula

.

Proprietățile coeficientului de corelație liniară:

1). Coeficientul de corelație este o mărime adimensională.

2). |r| 1 GBP sau .

3). , a,b= const, – valoarea coeficientului de corelație nu se va modifica dacă toate valorile variabilelor aleatoare X și Y sunt înmulțite (sau împărțite) cu o constantă.

4). , a,b= const, – valoarea coeficientului de corelație nu se va modifica dacă toate valorile variabilelor aleatoare X și Y sunt mărite (sau micșorate) cu o constantă.

5). Există o relație între coeficientul de corelație și coeficientul de regresie:

Valorile coeficienților de corelație pot fi interpretate astfel:

Criterii cantitative pentru evaluarea gradului de apropiere a comunicării:

În scopuri de prognostic, valorile cu |r| > 0,7.

Coeficientul de corelație ne permite să concluzionăm că există o relație liniară între două variabile aleatoare, dar nu indică care dintre variabile provoacă modificarea celeilalte. De fapt, o conexiune între două variabile aleatoare poate exista fără o relație cauză-efect între valorile înseși, deoarece o modificare a ambelor variabile aleatoare poate fi cauzată de o modificare (influență) a celei de-a treia.

Coeficient de corelație r xy este simetric în raport cu variabilele aleatoare luate în considerare XȘi Y. Aceasta înseamnă că pentru a determina coeficientul de corelație este complet indiferent care dintre cantități este independentă și care este dependentă.

Semnificația coeficientului de corelație

Chiar și pentru variabile independente, coeficientul de corelație poate fi diferit de zero datorită împrăștierii aleatorii a rezultatelor măsurătorilor sau datorită unui eșantion mic de variabile aleatoare. Prin urmare, trebuie verificată semnificația coeficientului de corelație.

Se verifică semnificația coeficientului de corelație liniară pe baza Testul t al elevului :

.

Dacă t > t cr(P,n-2), atunci coeficientul de corelație liniară este semnificativ și, prin urmare, relația statistică este de asemenea semnificativă XȘi Y.

.

Pentru ușurința calculelor, au fost create tabele cu valorile limitelor de încredere ale coeficienților de corelație pentru diferite numere de grade de libertate f = n–2 (test cu două cozi) și diferite niveluri de semnificație A= 0,1; 0,05; 0,01 și 0,001. Corelația este considerată semnificativă dacă coeficientul de corelație calculat depășește valoarea limitei de încredere a coeficientului de corelație pentru data dată. fȘi A.

Pentru cei mari nȘi A= 0,01 valoarea limitei de încredere a coeficientului de corelație poate fi calculată folosind formula aproximativă

.

Când studiezi corelațiiîncearcă să determine dacă există vreo relație între doi indicatori din același eșantion (de exemplu, între înălțimea și greutatea copiilor sau între nivelul de IQși performanța școlară) sau între două eșantioane diferite (de exemplu, când se compară perechi de gemeni), și dacă această relație există, atunci dacă o creștere a unui indicator este însoțită de o creștere (corelație pozitivă) sau o scădere (corelație negativă) a celălalt.

Cu alte cuvinte, analiza corelației ajută la stabilirea dacă este posibil să se prezică valorile posibile ale unui indicator, cunoscând valoarea altuia.

Până acum, când analizăm rezultatele experienței noastre în studierea efectelor marijuanei, am ignorat în mod deliberat un astfel de indicator precum timpul de reacție. Între timp, ar fi interesant să verificăm dacă există o legătură între eficacitatea reacțiilor și viteza lor. Acest lucru ar permite, de exemplu, să se afirme că cu cât o persoană este mai lentă, cu atât acțiunile sale vor fi mai precise și mai eficiente și invers.

În acest scop, se pot folosi două metode diferite: metoda parametrică de calcul al coeficientului Bravais-Pearson (r)și calculul coeficientului de corelare a rangului Spearman (r s ), care se aplică datelor ordinale, adică este neparametrică. Cu toate acestea, să înțelegem mai întâi ce este un coeficient de corelație.

Coeficient de corelație

Coeficientul de corelație este o valoare care poate varia de la -1 la 1. În cazul unei corelații pozitive complete, acest coeficient este plus 1, iar în cazul unei corelații complet negative, este minus 1. Pe grafic, acest corespunde unei linii drepte care trece prin punctele de intersecție a valorilor fiecărei perechi de date:

Variabil

Dacă aceste puncte nu se aliniază într-o linie dreaptă, ci formează un „nor”, ​​coeficientul de corelație în valoare absolută devine mai mic de unu și, pe măsură ce acest nor este rotunjit, se apropie de zero:

Dacă coeficientul de corelație este 0, ambele variabile sunt complet independente una de cealaltă.

În științe umaniste, o corelație este considerată puternică dacă coeficientul ei este mai mare de 0,60; dacă depășește 0,90, atunci corelația este considerată foarte puternică. Cu toate acestea, pentru a putea trage concluzii despre relațiile dintre variabile, dimensiunea eșantionului este de mare importanță: cu cât eșantionul este mai mare, cu atât valoarea coeficientului de corelație obținut este mai fiabilă. Există tabele cu valori critice ale coeficientului de corelație Bravais-Pearson și Spearman pentru diferite numere de grade de libertate (este egal cu numărul de perechi minus 2, adică n-2). Numai în cazul în care coeficienții de corelație sunt mai mari decât aceste valori critice pot fi considerați de încredere. Deci, pentru ca coeficientul de corelație de 0,70 să fie fiabil, trebuie luate în analiză cel puțin 8 perechi de date. ( = P - 2 = 6) la calcul r(Tabelul B.4) și 7 perechi de date (= n - 2 = 5) la calcul r s (Tabelul 5 din Anexa B. 5).

Coeficientul Bravais-Pearson

Pentru a calcula acest coeficient, utilizați următoarea formulă (poate arăta diferit pentru diferiți autori):

unde  X Y - suma produselor datelor din fiecare pereche;

n - numărul de perechi;

- medie pentru variabila dată X;

Medie pentru date variabile Y;

S X - X;

s Y - abaterea standard pentru distribuție u.

Acum putem folosi acest coeficient pentru a determina dacă există o relație între timpul de reacție al subiecților și eficacitatea acțiunilor lor. Luați, de exemplu, nivelul de fundal al grupului de control.

n= 15  15,8  13,4 = 3175,8;

(n 1)S X S y = 14  3,07  2,29 = 98,42;

r =

Un coeficient de corelație negativ poate însemna că cu cât timpul de reacție este mai lung, cu atât performanța este mai mică. Cu toate acestea, valoarea sa este prea mică pentru a ne permite să vorbim despre o relație de încredere între aceste două variabile.

nXY=………

(n- 1) S X S Y = ……

Ce concluzie se poate trage din aceste rezultate? Dacă credeți că există o relație între variabile, este directă sau inversă? Este de încredere [vezi masa 4 (în plus B. 5) cu valori critice r]?

Coeficientul de corelare a rangului lui Spearmanr s

Acest coeficient este mai ușor de calculat, dar rezultatele sunt mai puțin precise decât atunci când se utilizează r. Acest lucru se datorează faptului că la calcularea coeficientului Spearman se folosește ordinea datelor, și nu caracteristicile cantitative și intervalele dintre clase ale acestora.

Ideea este că atunci când se utilizează coeficientul de corelație de rang Spearman(r s ) ei verifică doar dacă clasarea datelor pentru orice eșantion va fi aceeași ca și într-un număr de alte date pentru acest eșantion, în perechi legate de primul (de exemplu, elevii vor fi „clasați” în mod egal atunci când iau atât psihologie, cât și matematică, sau chiar cu doi profesori de psihologie diferiti?). Dacă coeficientul este aproape de + 1, atunci aceasta înseamnă că ambele serii sunt practic identice, iar dacă acest coeficient este aproape de - 1, putem vorbi despre o relație inversă completă.

Coeficient r s calculate prin formula

Unde d- diferența dintre rândurile valorilor caracteristicilor conjugate (indiferent de semnul acesteia) și n-numar de perechi

De obicei, acest test neparametric este utilizat în cazurile în care este necesar să se tragă niște concluzii nu atât de mult intervaleîntre date, cât despre ele grade,și, de asemenea, atunci când curbele de distribuție sunt prea asimetrice și nu permit utilizarea unor criterii parametrice, cum ar fi coeficientul r(în aceste cazuri poate fi necesară convertirea datelor cantitative în date ordinale).

Deoarece acesta este cazul distribuției valorilor de eficiență și timp de reacție în grupul experimental după expunere, puteți repeta calculele pe care le-ați făcut deja pentru acest grup, doar că acum nu pentru coeficient r, iar pentru indicator r s . Acest lucru vă va permite să vedeți cât de diferite sunt cele două*.

*Trebuie amintit că

1) pentru numărul de lovituri, rangul 1 corespunde celui mai mare, iar 15 celui mai scăzut performanță, în timp ce pentru timpul de reacție, rangul 1 corespunde celui mai scurt timp, iar 15 celui mai lung;

2) datele ex aequo au un rang mediu.

Astfel, ca și în cazul coeficientului r, s-a obținut un rezultat pozitiv, deși nesigur. Care dintre cele două rezultate este mai plauzibil: r =-0,48 sau r s = +0,24? Această întrebare poate apărea numai dacă rezultatele sunt de încredere.

Aș dori să subliniez încă o dată că esența acestor doi coeficienți este oarecum diferită. Coeficient negativ r indică faptul că eficiența este adesea mai mare, cu cât timpul de reacție este mai scurt, în timp ce la calcularea coeficientului r s a fost necesar să se verifice dacă subiecții mai rapidi răspund întotdeauna mai precis, iar cei mai lenți - mai puțin precis.

Deoarece în lotul experimental după expunere s-a obţinut un coeficient r s , egal cu 0,24, o tendință similară nu este evident vizibilă aici. Încercați să înțelegeți datele pentru grupul de control după intervenție pe cont propriu, știind că  d 2 = 122,5:

; Este de încredere?

Care este concluzia ta?………………………………………………………………………………………………………………………

…………………………………………………………………………………………………………………….

Deci, ne-am uitat la diferite metode statistice parametrice și neparametrice utilizate în psihologie. Recenzia noastră a fost foarte superficială, iar sarcina sa principală a fost de a face cititorul să înțeleagă că statisticile nu sunt atât de înfricoșătoare pe cât par și necesită în mare parte bun simț. Vă reamintim că datele „experienței” cu care ne-am ocupat aici sunt fictive și nu pot servi drept bază pentru nicio concluzie. Cu toate acestea, un astfel de experiment ar merita cu adevărat efectuat. Deoarece pentru acest experiment a fost aleasă o tehnică pur clasică, aceeași analiză statistică ar putea fi utilizată în multe experimente diferite. În orice caz, ni se pare că am conturat câteva direcții principale care pot fi utile celor care nu știu de unde să înceapă cu o analiză statistică a rezultatelor obținute.

Există trei ramuri principale ale statisticii: statistica descriptivă, statistica inductivă și analiza corelației.

Acțiune