Uspostavite korelaciju. Korelacijska analiza. Koeficijent linearne korelacije, koeficijent korelacije ranga. Koeficijent povezanosti kvalitativnih karakteristika. Tema: Korelacijska analiza

Proučavajući javno zdravlje i zdravstvenu zaštitu u znanstvene i praktične svrhe, istraživač često mora provesti statističku analizu odnosa između čimbenika i karakteristika izvedbe statističke populacije (uzročna veza) ili utvrditi ovisnost paralelnih promjena u nekoliko karakteristika te populacije. na nekoj trećoj vrijednosti (na njihovom zajedničkom uzroku). Potrebno je moći proučiti značajke ove veze, odrediti njezinu veličinu i smjer, kao i procijeniti njegovu pouzdanost. U tu svrhu koriste se korelacijske metode.

  1. Vrste očitovanja kvantitativnih odnosa između obilježja
    • funkcionalna povezanost
    • korelacijski spoj
  2. Definicije funkcionalne i korelacijske povezanosti

    Funkcionalna veza- ova vrsta odnosa između dvije karakteristike kada svaka vrijednost jedne od njih odgovara strogo definiranoj vrijednosti druge (područje kruga ovisi o polumjeru kruga, itd.). Funkcionalna povezanost karakteristična je za fizikalne i matematičke procese.

    Poveznica- takav odnos u kojem svaka određena vrijednost jedne karakteristike odgovara nekoliko vrijednosti druge karakteristike međusobno povezane s njom (odnos između visine i težine osobe; odnos između tjelesne temperature i pulsa itd.). Korelacija je tipična za medicinske i biološke procese.

  3. Praktični značaj uspostavljanja korelacijske veze. Utvrđivanje uzročno-posljedičnih veza između faktorskih i posljedičnih obilježja (pri ocjeni tjelesne razvijenosti, za utvrđivanje odnosa između uvjeta rada, uvjeta života i zdravstvenog stanja, pri utvrđivanju ovisnosti učestalosti bolesti o dobi, radnom stažu, prisutnost profesionalnih opasnosti, itd.)

    Ovisnost paralelnih promjena nekoliko karakteristika o nekoj trećoj vrijednosti. Na primjer, pod utjecajem visoke temperature u radionici dolazi do promjena krvnog tlaka, viskoznosti krvi, pulsa itd.

  4. Vrijednost koja karakterizira smjer i snagu odnosa između karakteristika. Koeficijent korelacije, koji u jednom broju daje ideju o smjeru i snazi ​​veze između znakova (fenomena), granice njegovih fluktuacija od 0 do ± 1
  5. Metode prikaza korelacija
    • grafikon (raspršeni dijagram)
    • koeficijent korelacije
  6. Smjer korelacije
    • ravno
    • obrnuti
  7. Snaga korelacije
    • jako: ±0,7 do ±1
    • prosjek: ±0,3 do ±0,699
    • slabo: 0 do ±0,299
  8. Metode određivanja koeficijenta korelacije i formule
    • metoda kvadrata (Pearsonova metoda)
    • metoda rangiranja (Spearmanova metoda)
  9. Metodološki zahtjevi za korištenje koeficijenta korelacije
    • mjerenje odnosa moguće je samo u kvalitativno homogenim populacijama (npr. mjerenje odnosa visine i težine u populacijama homogenim po spolu i dobi)
    • izračun se može napraviti pomoću apsolutnih ili izvedenih vrijednosti
    • za izračun koeficijenta korelacije koriste se negrupirane serije varijacija (ovaj zahtjev vrijedi samo za izračun koeficijenta korelacije metodom kvadrata)
    • broj promatranja najmanje 30
  10. Preporuke za korištenje metode rang korelacije (Spearmanova metoda)
    • kada nema potrebe točno utvrđivati ​​snagu veze, već su dovoljni približni podaci
    • kada su karakteristike predstavljene ne samo kvantitativnim, već i atributivnim vrijednostima
    • kada raspodjelni niz karakteristika ima otvorene mogućnosti (npr. radno iskustvo do 1 godine i sl.)
  11. Preporuke za korištenje metode kvadrata (Pearsonova metoda)
    • kada je potrebno točno određivanje snage veze između karakteristika
    • kada znakovi imaju samo kvantitativni izraz
  12. Metodologija i postupak izračuna koeficijenta korelacije

    1) Metoda kvadrata

    2) Metoda rangiranja

  13. Shema za ocjenu korelacijskog odnosa pomoću koeficijenta korelacije
  14. Izračun pogreške koeficijenta korelacije
  15. Procjena pouzdanosti koeficijenta korelacije dobivenog metodom rang korelacije i metodom kvadrata

    Metoda 1
    Pouzdanost se određuje formulom:

    Kriterij t ocjenjuje se pomoću tablice t vrijednosti, uzimajući u obzir broj stupnjeva slobode (n - 2), gdje je n broj uparenih opcija. Kriterij t mora biti jednak ili veći od tabličnog, što odgovara vjerojatnosti p ≥99%.

    Metoda 2
    Pouzdanost se procjenjuje pomoću posebne tablice standardnih koeficijenata korelacije. U ovom slučaju, koeficijent korelacije se smatra pouzdanim kada je, uz određeni broj stupnjeva slobode (n - 2), jednak ili veći od tabličnog, što odgovara stupnju predviđanja bez pogreške p ≥95% .

koristiti metodu kvadrata

Vježba: izračunati koeficijent korelacije, odrediti smjer i jačinu veze između količine kalcija u vodi i tvrdoće vode, ako su poznati sljedeći podaci (tablica 1.). Procijenite pouzdanost odnosa. Izvući zaključak.

stol 1

Obrazloženje izbora metode. Za rješavanje problema odabrana je metoda kvadrata (Pearson), jer svaki od znakova (tvrdoća vode i količina kalcija) ima numerički izraz; nema otvorene opcije.

Riješenje.
Redoslijed izračuna je opisan u tekstu, rezultati su prikazani u tablici. Nakon što je konstruiran niz uparenih usporedivih karakteristika, označite ih s x (tvrdoća vode u stupnjevima) i s y (količina kalcija u vodi u mg/l).

Tvrdoća vode
(u stupnjevima)
Količina kalcija u vodi
(u mg/l)
d x d g d x x d y d x 2 d y 2
4
8
11
27
34
37
28
56
77
191
241
262
-16
-12
-9
+7
+14
+16
-114
-86
-66
+48
+98
+120
1824
1032
594
336
1372
1920
256
144
81
49
196
256
12996
7396
4356
2304
9604
14400
M x =Σ x / n M y =Σ y / n Σ d x x d y =7078 Σ d x 2 =982 Σ d y 2 =51056
M x =120/6=20 M y =852/6=142
  1. Odredite prosječne vrijednosti M x u opciji retka "x" i M y u opciji retka "y" pomoću formula:
    M x = Σh/n (stupac 1) i
    M y = Σu/n (stupac 2)
  2. Pronađite odstupanje (d x i d y) svake opcije od izračunatog prosjeka u seriji “x” i u seriji “y”
    d x = x - M x (stupac 3) i d y = y - M y (stupac 4).
  3. Nađite umnožak odstupanja d x x d y i zbrojite ih: Σ d x x d y (kolona 5)
  4. Kvadrirajte svako odstupanje d x i d y i zbrojite njihove vrijednosti duž serije "x" i serije "y": Σ d x 2 = 982 (stupac 6) i Σ d y 2 = 51056 (stupac 7).
  5. Odredite umnožak Σ d ​​x 2 x Σ d y 2 i izvucite kvadratni korijen iz tog umnoška
  6. Rezultirajuće vrijednosti Σ (d x x d y) i √ (Σd x 2 x Σd y 2) zamijenite u formulu za izračun koeficijenta korelacije:
  7. Odredite pouzdanost koeficijenta korelacije:
    1. metoda. Nađite pogrešku koeficijenta korelacije (mr xy) i t kriterija pomoću formula:

    Kriterij t = 14,1, što odgovara vjerojatnosti bezgrešne prognoze p > 99,9 %.

    2. metoda. Pouzdanost koeficijenta korelacije procjenjuje se pomoću tablice "Standardni koeficijenti korelacije" (vidi Dodatak 1). Uz broj stupnjeva slobode (n - 2)=6 - 2=4, naš izračunati koeficijent korelacije r xu = + 0,99 veći je od tabelarnog (r tablica = + 0,917 pri p = 99%).

    Zaključak.Što je više kalcija u vodi, to je ona tvrđa (veza izravan, snažan i autentičan: r xy = + 0,99, p > 99,9%).

    koristiti metodu rangiranja

    Vježba: Metodom rangiranja utvrditi smjer i snagu veze između godina radnog iskustva i učestalosti ozljeda ako se dobiju sljedeći podaci:

    Obrazloženje odabira metode: Za rješavanje problema može se odabrati samo metoda korelacije ranga, jer Prvi redak atributa “radno iskustvo u godinama” ima otvorene opcije (radno iskustvo do 1 godine i 7 i više godina), što ne dopušta korištenje točnije metode - metode kvadrata - za uspostavu veze između uspoređivanih karakteristika.

    Riješenje. Redoslijed izračuna prikazan je u tekstu, rezultati su prikazani u tablici. 2.

    tablica 2

    Radno iskustvo u godinama Broj ozljeda Redni brojevi (činovi) Razlika u rangu Kvadratna razlika rangova
    x Y d(x-y) d 2
    Do 1 godine 24 1 5 -4 16
    1-2 16 2 4 -2 4
    3-4 12 3 2,5 +0,5 0,25
    5-6 12 4 2,5 +1,5 2,25
    7 ili više 6 5 1 +4 16
    Σ d 2 = 38,5

    Standardni koeficijenti korelacije koji se smatraju pouzdanima (prema L.S. Kaminsky)

    Broj stupnjeva slobode - 2 Razina vjerojatnosti p (%)
    95% 98% 99%
    1 0,997 0,999 0,999
    2 0,950 0,980 0,990
    3 0,878 0,934 0,959
    4 0,811 0,882 0,917
    5 0,754 0,833 0,874
    6 0,707 0,789 0,834
    7 0,666 0,750 0,798
    8 0,632 0,716 0,765
    9 0,602 0,885 0,735
    10 0,576 0,858 0,708
    11 0,553 0,634 0,684
    12 0,532 0,612 0,661
    13 0,514 0,592 0,641
    14 0,497 0,574 0,623
    15 0,482 0,558 0,606
    16 0,468 0,542 0,590
    17 0,456 0,528 0,575
    18 0,444 0,516 0,561
    19 0,433 0,503 0,549
    20 0,423 0,492 0,537
    25 0,381 0,445 0,487
    30 0,349 0,409 0,449

    1. Vlasov V.V. Epidemiologija. - M.: GEOTAR-MED, 2004. - 464 str.
    2. Lisitsyn Yu.P. Javno zdravstvo i zdravstvena zaštita. Udžbenik za sveučilišta. - M.: GEOTAR-MED, 2007. - 512 str.
    3. Medić V.A., Yuryev V.K. Tijek predavanja iz područja javnog zdravlja i zdravstvene zaštite: 1. dio. Javno zdravlje. - M.: Medicina, 2003. - 368 str.
    4. Minyaev V.A., Vishnyakov N.I. i dr. Socijalna medicina i organizacija zdravstva (Priručnik u 2 sveska). - St. Petersburg, 1998. -528 str.
    5. Kucherenko V.Z., Agarkov N.M. i dr. Socijalna higijena i organizacija zdravstvene zaštite (Tutorial) - Moskva, 2000. - 432 str.
    6. S. Glanz. Medicinska i biološka statistika. Prijevod s engleskog - M., Praktika, 1998. - 459 str.

Pri proučavanju različitih društveno-ekonomskih pojava razlikuju se funkcionalna povezanost i stohastička ovisnost. Funkcionalna veza je vrsta veze u kojoj samo jedna vrijednost rezultantnog pokazatelja odgovara zadanoj vrijednosti faktorskog pokazatelja. Funkcionalna povezanost očituje se u svim slučajevima istraživanja i za svaku pojedinu jedinicu analizirane populacije.

Objavljeno na www.site

U slučaju kada uzročna ovisnost ne djeluje u svakom konkretnom slučaju, nego općenito za cijelu promatranu populaciju, u prosjeku za značajan broj opažanja, tada je takva ovisnost stohastička. Poseban slučaj stohastičke ovisnosti je korelacijski odnos, u kojem je promjena prosječne vrijednosti pokazatelja učinka uzrokovana promjenom vrijednosti faktorskih pokazatelja. Izračunavanje stupnja bliskosti i usmjerenosti komunikacije značajan je zadatak u proučavanju i kvantitativnoj procjeni odnosa između različitih društveno-ekonomskih pojava. Utvrđivanje stupnja bliskosti odnosa između različitih pokazatelja zahtijeva određivanje razine korelacije između promjene rezultirajuće karakteristike od promjene u jednoj (u slučaju proučavanja uparenih ovisnosti) ili varijacije u nekoliko (u slučaju proučavanja višestrukih ovisnosti ) karakteristični čimbenici. Za određivanje ove razine koristi se koeficijent korelacije.

Koeficijent linearne korelacije prvi put je uveden početkom 90-ih. XIX stoljeće Pearson i pokazuje stupanj bliskosti i usmjerenost odnosa između dva korelirana faktora ako među njima postoji linearni odnos. Pri tumačenju dobivene vrijednosti koeficijenta linearne korelacije, stupanj bliskosti između karakteristika procjenjuje se pomoću Chaddockove ljestvice; jedna od varijanti ove ljestvice prikazana je u donjoj tablici:

Chaddock ljestvica za kvantitativnu procjenu stupnja bliskosti veze

Vrijednost indikatora blizine veze

Priroda komunikacije

Gotovo odsutan

Umjereno

Kod tumačenja vrijednosti koeficijenta linearne korelacije u smjeru veze razlikuju se izravna i obrnuta. Ako postoji izravna veza s povećanjem ili smanjenjem vrijednosti faktorske karakteristike, dolazi do povećanja ili smanjenja pokazatelja rezultirajuće karakteristike, tj. promjena faktora i rezultata odvija se u istom smjeru. Na primjer, povećanje profitnih marži pridonosi povećanju pokazatelja profitabilnosti. U prisutnosti povratne veze, vrijednosti rezultirajuće karakteristike mijenjaju se pod utjecajem faktorske karakteristike, ali u suprotnom smjeru u usporedbi s dinamikom faktorske karakteristike. Na primjer, povećanjem produktivnosti rada smanjuje se trošak po jedinici proizvoda itd.

Koeficijent korelacije je vrijednost koja može varirati od +1 do –1. U slučaju potpune pozitivne korelacije taj je koeficijent jednak plus 1 (kažu da kad raste vrijednost jedne varijable, raste i vrijednost druge varijable), a u slučaju potpuno negativne korelacije iznosi minus 1. (što ukazuje na povratnu vezu, tj. kada se vrijednosti jedne varijable povećavaju, vrijednosti druge se smanjuju).

Primjer 1:

Grafikon odnosa između sramežljivosti i depresije. Kao što vidite, točke (subjekti) nisu smještene kaotično, već se nižu oko jedne crte, a gledajući ovu crtu, možemo reći da što je veća sramežljivost osobe, to je veća depresija, tj. ti su fenomeni međusobno povezani.

Primjer 2: Tablica za sramežljivost i društvenost. Vidimo da kako se stidljivost povećava, društvenost se smanjuje. Njihov koeficijent korelacije je -0,43. Dakle, koeficijent korelacije veći od 0 do 1 označava izravno proporcionalni odnos (što više... to više...), a koeficijent od -1 do 0 označava obrnuto proporcionalan odnos (što više... to manje. ..)

Ako je koeficijent korelacije 0, obje varijable su potpuno neovisne jedna o drugoj.

Poveznica- ovo je odnos gdje se utjecaj pojedinih čimbenika pojavljuje samo kao trend (u prosjeku) tijekom masovnog promatranja stvarnih podataka. Primjeri korelacijskih ovisnosti mogu biti ovisnosti između veličine aktive banke i visine dobiti banke, rasta produktivnosti rada i radnog staža zaposlenika.

Za klasifikaciju korelacija prema njihovoj snazi ​​koriste se dva sustava: opći i specifični.

Opća klasifikacija korelacija: 1) jaka ili bliska s koeficijentom korelacije r>0,70 2) prosječna na 0,500,70, a ne samo korelacija visoke razine značajnosti;

Sljedeća tablica prikazuje nazive korelacijskih koeficijenata za različite vrste ljestvica.

Dihotomna ljestvica (1/0) Rang (ordinalna) ljestvica
Dihotomna ljestvica (1/0) Pearsonov koeficijent asocijacije, Pearsonov četveroćelijski koeficijent kontingencije. Biserijska korelacija
Rang (ordinalna) ljestvica Rang-biserijska korelacija. Spearmanov ili Kendallov rang koeficijent korelacije.
Intervalna i apsolutna ljestvica Biserijska korelacija Vrijednosti intervalne ljestvice pretvaraju se u rangove i koristi se koeficijent ranga Pearsonov koeficijent korelacije (linearni koeficijent korelacije)

Na r=0 Ne postoji linearna korelacija. U ovom slučaju, grupne sredine varijabli podudaraju se s njihovim ukupnim sredinama, a regresijske linije su paralelne s koordinatnim osima.

Jednakost r=0 govori samo o nepostojanju linearne korelacijske ovisnosti (nekorelirane varijable), ali ne općenito o nepostojanju korelacijske, a još više statističke ovisnosti.

Ponekad je nalaz nepostojanja korelacije važniji od prisutnosti jake korelacije. Nulta korelacija između dvije varijable može značiti da nema utjecaja jedne varijable na drugu, pod uvjetom da vjerujemo rezultatima mjerenja.

U SPSS-u: 11.3.2 Koeficijenti korelacije

Do sada smo samo razjasnili činjenicu postojanja statističke veze između dvije karakteristike. Zatim ćemo pokušati saznati koji se zaključci mogu izvući o snazi ​​ili slabosti te ovisnosti, kao io njezinoj vrsti i smjeru. Kriteriji za kvantificiranje odnosa između varijabli nazivaju se koeficijenti korelacije ili mjere povezanosti. Dvije varijable su u pozitivnoj korelaciji ako između njih postoji izravan, jednosmjeran odnos. U jednosmjernom odnosu, male vrijednosti jedne varijable odgovaraju malim vrijednostima druge varijable, a velike vrijednosti odgovaraju velikim vrijednostima. Dvije varijable negativno koreliraju jedna s drugom ako između njih postoji inverzna, višesmjerna veza. S višesmjernim odnosom, male vrijednosti jedne varijable odgovaraju velikim vrijednostima druge varijable i obrnuto. Vrijednosti korelacijskih koeficijenata uvijek leže u rasponu od -1 do +1.

Spearmanov koeficijent koristi se kao korelacijski koeficijent između varijabli koje pripadaju ordinalnoj ljestvici, a Pearsonov koeficijent korelacije (moment proizvoda) koristi se za varijable koje pripadaju intervalnoj ljestvici. Treba uzeti u obzir da se svaka dihotomna varijabla, odnosno varijabla koja pripada nominalnoj ljestvici i ima dvije kategorije, može smatrati ordinalnom.

Prvo ćemo provjeriti postoji li korelacija između varijabli spola i psihe iz datoteke studium.sav. Pritom ćemo uzeti u obzir da se dihotomna varijabla spol može smatrati ordinalnom. Prati ove korake:

· Odaberite iz izbornika naredbi Analiziraj unakrsne tabele deskriptivne statistike...

· Premjestite varijablu spol na popis redaka, a varijablu psiha na popis stupaca.

· Kliknite na gumb Statistika.... U dijaloškom okviru Crosstabs: Statistics odaberite potvrdni okvir Correlations. Potvrdite svoj odabir tipkom Nastavi.

· U dijaloškom okviru Crosstabs onemogućite prikaz tablica označavanjem potvrdnog okvira Supress tables. Pritisnite OK.

Izračunat će se Spearmanov i Pearsonov koeficijent korelacije i testirati njihova značajnost:

/ SPSS 10

Zadatak br. 10 Korelacijska analiza

Pojam korelacije

Korelacija ili koeficijent korelacije je statistički pokazatelj vjerojatnosni odnosi između dvije varijable mjereni na kvantitativnim skalama. Za razliku od funkcionalnog odnosa, u kojem svaka vrijednost jedne varijable odgovara strogo definiran vrijednost druge varijable, vjerojatnosna veza karakterizira činjenica da svaka vrijednost jedne varijable odgovara višestruka značenja Još jedna varijabla Primjer vjerojatnostnog odnosa je odnos između visine i težine ljudi. Jasno je da ljudi različite težine mogu imati istu visinu i obrnuto.

Korelacija je vrijednost u rasponu od -1 do +1 i označava se slovom r. Štoviše, ako je vrijednost bliža 1, to znači da postoji jaka veza, a ako je bliža 0, onda je slaba. Vrijednost korelacije manja od 0,2 smatra se slabom korelacijom, a vrijednost veća od 0,5 smatra se visokom korelacijom. Ako je korelacijski koeficijent negativan, to znači da postoji povratna veza: što je veća vrijednost jedne varijable, to je manja vrijednost druge.

Ovisno o prihvaćenim vrijednostima koeficijenta r, mogu se razlikovati različite vrste korelacije:

Stroga pozitivna korelacija određena vrijednošću r=1. Pojam "strogi" znači da je vrijednost jedne varijable jedinstveno određena vrijednostima druge varijable, a pojam " pozitivno" - da kako se povećavaju vrijednosti jedne varijable, tako rastu i vrijednosti druge varijable.

Stroga korelacija je matematička apstrakcija i praktički se nikada ne pojavljuje u stvarnom istraživanju.

Pozitivna korelacija odgovara vrijednostima 0

Nema korelacije određena vrijednošću r=0. Nulti koeficijent korelacije označava da vrijednosti varijabli ni na koji način nisu međusobno povezane.

Nema korelacije H o : 0 r xy =0 formuliran kao odraz ništavan hipoteze u korelacijskoj analizi.

Negativna korelacija: -1

Stroga negativna korelacija određena vrijednošću r= -1. Ona je, kao i stroga pozitivna korelacija, apstrakcija i ne nalazi izražaja u praktičnom istraživanju.

stol 1

Vrste korelacije i njihove definicije

Metoda izračuna koeficijenta korelacije ovisi o vrsti ljestvice na kojoj se mjere varijable.

Koeficijent korelacije rPearson je bazična i može se koristiti za varijable s nominalnim i djelomično uređenim intervalnim ljestvicama, raspodjela vrijednosti na kojima odgovara normalnoj (korelacija produkta momenta). Pearsonov koeficijent korelacije daje prilično točne rezultate u slučajevima abnormalnih distribucija.

Za distribucije koje nisu normalne, poželjno je koristiti koeficijente korelacije ranga Spearman i Kendall. Oni su rangirani jer program unaprijed rangira korelirane varijable.

Program SPSS izračunava Spearmanovu korelaciju na sljedeći način: prvo se varijable pretvaraju u rangove, a zatim se na rangove primjenjuje Pearsonova formula.

Osnova korelacije koju je predložio M. Kendall je ideja da se smjer veze može prosuditi usporedbom subjekata u parovima. Ako se za par subjekata promjena u X podudara u smjeru s promjenom u Y, tada to ukazuje na pozitivnu vezu. Ako se ne podudara, onda postoji negativna veza. Ovaj koeficijent prvenstveno koriste psiholozi koji rade s malim uzorcima. Budući da sociolozi rade s velikom količinom podataka, nabrajanje parova i utvrđivanje razlika u relativnim učestalostima i inverzijama svih parova subjekata u uzorku je teško. Najčešći je koeficijent. Pearson.

Budući da je Pearsonov koeficijent korelacije r osnovni i da se može koristiti (uz određenu pogrešku ovisno o vrsti ljestvice i razini abnormalnosti u distribuciji) za sve varijable mjerene na kvantitativnim ljestvicama, razmotrit ćemo primjere njegove uporabe i usporediti rezultate dobivenih s rezultatima mjerenja pomoću drugih koeficijenata korelacije.

Formula za izračunavanje koeficijenta r- Pearson:

r xy = ∑ (Xi-Xavg)∙(Yi-Yavg) / (N-1)∙σ x ∙σ y ∙

Gdje su: Xi, Yi - vrijednosti dviju varijabli;

Xavg, Yavg - prosječne vrijednosti dviju varijabli;

σ x, σ y – standardna odstupanja,

N je broj opažanja.

Parne korelacije

Na primjer, željeli bismo saznati u kakvoj su korelaciji odgovori između različitih vrsta tradicionalnih vrijednosti u idejama učenika o idealnom mjestu za rad (varijable: a9.1, a9.3, a9.5, a9.7) , a zatim o korelaciji između liberalnih vrijednosti (a9 .2, a9.4. a9.6, a9.8) . Ove varijable mjere se na skali od 5 čestica.

Koristimo postupke: “Analiza”,  “Korelacije”,  “Upareni”. Zadani koeficijent Pearson je postavljen u dijaloškom okviru. Koristimo koeficijent. Pearson

Testirane varijable se prenose u prozor za odabir: a9.1, a9.3, a9.5, a9.7

Klikom na OK dobivamo izračun:

Korelacije

a9.1.t. Koliko je važno imati dovoljno vremena za obitelj i osobni život?

Pearsonova korelacija

Vrijednost (2 strane)

a9.3.t. Koliko je važno ne bojati se gubitka posla?

Pearsonova korelacija

Vrijednost (2 strane)

a9.5.t. Koliko je važno imati šefa koji će se savjetovati s vama kada donosite ovu ili onu odluku?

Pearsonova korelacija

Vrijednost (2 strane)

a9.7.t. Koliko je važno raditi u dobro uigranom timu i osjećati se kao dio njega?

Pearsonova korelacija

Vrijednost (2 strane)

** Korelacija je značajna na razini 0,01 (dvostrana).

Tablica kvantitativnih vrijednosti konstruirane korelacijske matrice

Djelomične korelacije:

Prvo, izgradimo korelaciju u paru između ove dvije varijable:

Korelacije

s8. Osjećaj bliskost s onima koji žive pored tebe, susjedima

Pearsonova korelacija

Vrijednost (2 strane)

s12. Osjećati se blisko njihovoj obitelji

Pearsonova korelacija

Vrijednost (2 strane)

**. Korelacija je značajna na razini 0,01 (dvostrana).

Zatim koristimo postupak za konstruiranje djelomične korelacije: “Analiza”,  “Korelacije”,  “Djelomična”.

Pretpostavimo da se vrijednost “Važno je samostalno odrediti i promijeniti redoslijed svog rada” u odnosu na navedene varijable pokazuje kao odlučujući čimbenik pod čijim će utjecajem prethodno identificirani odnos nestati ili se pokazati neznatan.

Korelacije

Isključene varijable

s8. Osjećaj bliskost s onima koji žive pored tebe, susjedima

s12. Osjećati se blisko njihovoj obitelji

p16. Osjećajte se blisko s ljudima koji imaju isti prihod kao i vi

s8. Osjećaj bliskost s onima koji žive pored tebe, susjedima

Poveznica

Značaj (dvostrano)

s12. Osjećati se blisko njihovoj obitelji

Poveznica

Značaj (dvostrano)

Kao što je vidljivo iz tablice, pod utjecajem kontrolne varijable odnos se neznatno smanjio: s 0,120 na 0,102. Međutim, ovo blago smanjenje ne dopušta nam da ustvrdimo da je prethodno utvrđeni odnos odraz lažne korelacije, tj. jer ostaje prilično visok i omogućuje nam da odbacimo nultu hipotezu s nula pogreške.

Koeficijent korelacije

Najprecizniji način za određivanje bliskosti i prirode korelacije je pronalaženje koeficijenta korelacije. Koeficijent korelacije je broj određen formulom:


gdje je r xy koeficijent korelacije;

x i - vrijednosti prve karakteristike;

y i su vrijednosti drugog atributa;

Aritmetička sredina vrijednosti prve karakteristike

Aritmetička sredina vrijednosti druge karakteristike

Da bismo koristili formulu (32), napravit ćemo tablicu koja će osigurati potrebnu dosljednost u pripremi brojeva za pronalaženje brojnika i nazivnika koeficijenta korelacije.

Kao što se može vidjeti iz formule (32), redoslijed radnji je sljedeći: nalazimo aritmetičke prosjeke obje karakteristike x i y, nalazimo razliku između vrijednosti atributa i njegovog prosjeka (x i - ) i y i - ), tada nalazimo njihov umnožak (x i - ) ( y i - ) – zbroj potonjeg daje brojnik koeficijenta korelacije. Da bi se dobio njegov nazivnik, razlike (x i - ) i (y i - ) moraju se kvadrirati, moraju se pronaći njihovi zbrojevi i mora se izvući kvadratni korijen njihovog umnoška.

Tako na primjer 31, pronalaženje koeficijenta korelacije u skladu s formulom (32) može se predstaviti na sljedeći način (tablica 50).

Dobiveni broj koeficijenta korelacije omogućuje utvrđivanje prisutnosti, bliskosti i prirode veze.

1. Ako je koeficijent korelacije jednak nuli, nema veze između karakteristika.

2. Ako je koeficijent korelacije jednak jedinici, povezanost između obilježja je tolika da prelazi u funkcionalnu.

3. Apsolutna vrijednost koeficijenta korelacije ne prelazi interval od nula do jedan:

To omogućuje fokusiranje na bliskost veze: što je koeficijent bliži nuli, to je veza slabija, a što je bliži jedinici, to je veza bliža.

4. Predznak “plus” koeficijenta korelacije označava izravnu korelaciju, predznak “minus” znači inverznu korelaciju.

Stol 50

x i u i (x i - ) (u i - ) (x i - )(y i - ) (x i - )2 (u i - )2
14,00 12,10 -1,70 -2,30 +3,91 2,89 5,29
14,20 13,80 -1,50 -0,60 +0,90 2,25 0,36
14,90 14,20 -0,80 -0,20 +0,16 0,64 0,04
15,40 13,00 -0,30 -1,40 +0,42 0,09 1,96
16,00 14,60 +0,30 +0,20 +0,06 0,09 0,04
17,20 15,90 +1,50 +2,25 2,25
18,10 17,40 +2,40 +2,00 +4,80 5,76 4,00
109,80 101,00 12,50 13,97 13,94


Dakle, koeficijent korelacije izračunat u primjeru 31 je r xy = +0,9. omogućuje nam da izvučemo sljedeće zaključke: postoji korelacija između veličine mišićne snage desne i lijeve ruke u ispitivanih školaraca (koeficijent r xy =+0,9 različit je od nule), odnos je vrlo blizak (koeficijent r xy =+0,9 je blizak jedinici) , korelacija je izravna (koeficijent r xy = +0,9 je pozitivan), tj. s povećanjem mišićne snage jedne ruke raste i snaga druge ruke.

Pri izračunavanju koeficijenta korelacije i korištenju njegovih svojstava treba voditi računa da zaključci daju ispravne rezultate kada su karakteristike normalno raspoređene i kada se uzme u obzir odnos između velikog broja vrijednosti obiju karakteristika.

U razmatranom primjeru 31 analizirano je samo 7 vrijednosti obje karakteristike, što, naravno, nije dovoljno za takva istraživanja. Ovdje vas još jednom podsjećamo da su primjeri u ovoj knjizi općenito, a posebno u ovom poglavlju, po prirodi ilustrirajući metode, a ne detaljan prikaz bilo kakvih znanstvenih eksperimenata. Kao rezultat toga, uzet je u obzir mali broj vrijednosti značajki, mjerenja su zaokružena - sve je to učinjeno tako da glomazni izračuni nisu zamaglili ideju metode.

Posebnu pozornost treba posvetiti suštini odnosa koji se razmatra. Koeficijent korelacije ne može dovesti do točnih rezultata istraživanja ako se odnos između karakteristika analizira formalno. Vratimo se još jednom na primjer 31. Oba razmatrana znaka bile su vrijednosti mišićne snage desne i lijeve ruke. Zamislimo da predznakom x i u primjeru 31 (14,0; 14,2; 14,9... ...18,1) mislimo na duljinu slučajno ulovljene ribe u centimetrima, a predznakom y i (12,1 ; 13,8; 14,2... ... 17.4) - težina instrumenata u laboratoriju u kilogramima. Nakon što smo formalno upotrijebili uređaj za izračun kako bismo pronašli koeficijent korelacije iu ovom slučaju također dobili r xy =+0>9, morali smo zaključiti da postoji bliska izravna veza između duljine ribe i težine instrumenata. Očita je besmislenost takvog zaključka.

Da bi se izbjegao formalni pristup korištenju koeficijenta korelacije, treba koristiti bilo koju drugu metodu - matematičku, logičku, eksperimentalnu, teoretsku - za utvrđivanje mogućnosti postojanja korelacije među karakteristikama, odnosno za otkrivanje organskog jedinstva karakteristika. Tek nakon toga može se početi koristiti korelacijskom analizom i utvrditi veličinu i prirodu odnosa.

U matematičkoj statistici također postoji pojam višestruka korelacija- odnosi između tri ili više karakteristika. U tim se slučajevima koristi koeficijent višestruke korelacije koji se sastoji od gore opisanih uparenih koeficijenata korelacije.

Na primjer, koeficijent korelacije tri karakteristike - x i, y i, z i - je:

gdje je R xyz koeficijent višestruke korelacije, koji izražava kako značajka x i ovisi o značajkama y i i z i;

r xy - koeficijent korelacije između karakteristika x i i y i;

r xz - korelacijski koeficijent između karakteristika Xi i Zi;

r yz - koeficijent korelacije između obilježja y i , z i

Korelacijska analiza je:

Korelacijska analiza

Poveznica- statistički odnos između dvije ili više slučajnih varijabli (ili varijabli koje se takvima mogu smatrati s nekim prihvatljivim stupnjem točnosti). Štoviše, promjene jedne ili više ovih veličina dovode do sustavne promjene druge ili drugih veličina. Matematička mjera korelacije između dviju slučajnih varijabli je koeficijent korelacije.

Korelacija može biti pozitivna i negativna (moguće je i da ne postoji statistički odnos – npr. za nezavisne slučajne varijable). Negativna korelacija - korelacija, u kojoj je porast jedne varijable povezan sa smanjenjem druge varijable, a koeficijent korelacije je negativan. Pozitivna korelacija - korelacija, u kojoj je povećanje jedne varijable povezano s povećanjem druge varijable, a koeficijent korelacije je pozitivan.

Autokorelacija - statistički odnos između slučajnih varijabli iz istog niza, ali uzetih s pomakom, npr. za slučajni proces - s vremenskim pomakom.

Metoda obrade statističkih podataka, koja se sastoji u proučavanju koeficijenata (korelacije) između varijabli, naziva se korelacijska analiza.

Koeficijent korelacije

Koeficijent korelacije ili parni koeficijent korelacije u teoriji vjerojatnosti i statistici, to je pokazatelj prirode promjene dviju slučajnih varijabli. Koeficijent korelacije označava se latiničnim slovom R i može imati vrijednosti između -1 i +1. Ako je apsolutna vrijednost bliža 1, to znači postojanje jake veze (ako je koeficijent korelacije jednak jedan, govorimo o funkcionalnoj povezanosti), a ako je bliža 0, onda je slaba.

Pearsonov koeficijent korelacije

Za metričke veličine koristi se Pearsonov koeficijent korelacije čiju je točnu formulu uveo Francis Galton:

Neka x,Y- dvije slučajne varijable definirane na istom prostoru vjerojatnosti. Tada se njihov koeficijent korelacije daje formulom:

,

gdje cov označava kovarijancu, a D je varijanca, ili ekvivalentno,

,

gdje simbol označava matematičko očekivanje.

Da biste grafički prikazali takav odnos, možete koristiti pravokutni koordinatni sustav s osima koje odgovaraju objema varijablama. Svaki par vrijednosti označen je određenim simbolom. Ovaj se graf naziva "plota raspršenosti".

Način izračuna koeficijenta korelacije ovisi o vrsti ljestvice kojoj varijable pripadaju. Dakle, za mjerenje varijabli intervalnim i kvantitativnim skalama potrebno je koristiti Pearsonov koeficijent korelacije (korelacija momenta proizvoda). Ako je barem jedna od dvije varijable na ordinalnoj ljestvici ili nije normalno raspoređena, mora se koristiti Spearmanova korelacija ranga ili Kendalov τ (tau). U slučaju da je jedna od dviju varijabli dihotomna, koristi se točkasto-biserijska korelacija, a ako su obje varijable dihotomna: četveropoljska korelacija. Izračunavanje koeficijenta korelacije između dvije nedihotomne varijable ima smisla samo kada je odnos između njih linearan (jednosmjeran).

Kendellov koeficijent korelacije

Koristi se za mjerenje međusobnog poremećaja.

Spearmanov koeficijent korelacije

Svojstva koeficijenta korelacije

  • Cauchy-Bunyakovsky nejednakost:
ako kovarijancu uzmemo kao skalarni umnožak dviju slučajnih varijabli, tada će norma slučajne varijable biti jednaka , a posljedica nejednakosti Cauchy-Bunyakovskog bit će: . , Gdje . Štoviše, u ovom slučaju znakovi i k podudarati se: .

Korelacijska analiza

Korelacijska analiza- metoda obrade statističkih podataka, koja se sastoji u proučavanju koeficijenata ( korelacije) između varijabli. U ovom slučaju, korelacijski koeficijenti između jednog para ili više parova karakteristika uspoređuju se kako bi se utvrdili statistički odnosi među njima.

Cilj korelacijska analiza- pružiti neke informacije o jednoj varijabli koristeći drugu varijablu. U slučajevima kada je moguće postići cilj, kaže se da su varijable korelirati. U svom najopćenitijem obliku, prihvaćanje hipoteze o korelaciji znači da će se promjena vrijednosti varijable A dogoditi istovremeno s proporcionalnom promjenom vrijednosti B: ako obje varijable rastu, tada korelacija je pozitivna, ako se jedna varijabla povećava, a druga smanjuje, korelacija je negativna.

Korelacija odražava samo linearnu ovisnost vrijednosti, ali ne odražava njihovu funkcionalnu povezanost. Na primjer, ako izračunate koeficijent korelacije između veličina A = sin(x) I B = cos(x), tada će biti blizu nule, tj. nema ovisnosti između veličina. U međuvremenu, količine A i B očito su funkcionalno povezane prema zakonu sin 2(x) + cos 2(x) = 1.

Ograničenja korelacijske analize



Grafovi distribucija parova (x,y) s pripadajućim koeficijentima korelacije x i y za svaki od njih. Imajte na umu da koeficijent korelacije odražava linearan odnos (gornja crta), ali ne opisuje krivulju odnosa (srednja crta) i uopće nije prikladan za opisivanje složenih, nelinearnih odnosa (donja crta).
  1. Primjena je moguća ako postoji dovoljan broj slučajeva za proučavanje: za određenu vrstu koeficijent korelacije kreće se od 25 do 100 parova opažanja.
  2. Drugo ograničenje proizlazi iz hipoteze korelacijske analize, koja uključuje linearna ovisnost varijabli. U mnogim slučajevima, kada se pouzdano zna da odnos postoji, korelacijska analiza možda neće dati rezultate samo zato što je odnos nelinearan (izražen, na primjer, kao parabola).
  3. Sama činjenica korelacije ne daje temelja za tvrdnju koja od varijabli prethodi ili uzrokuje promjene, ili da su varijable općenito uzročno povezane jedna s drugom, na primjer, zbog djelovanja trećeg čimbenika.

Područje primjene

Ova metoda obrade statističkih podataka vrlo je popularna u ekonomiji i društvenim znanostima (osobito u psihologiji i sociologiji), iako je područje primjene korelacijskih koeficijenata opsežno: kontrola kvalitete industrijskih proizvoda, metalurgija, agrokemija, hidrobiologija, biometrija i drugo.

Popularnost metode posljedica je dvaju čimbenika: koeficijente korelacije relativno je lako izračunati, a njihova uporaba ne zahtijeva posebnu matematičku obuku. U kombinaciji s lakoćom tumačenja, jednostavnost primjene koeficijenta dovela je do njegove široke upotrebe u području statističke analize podataka.

Lažna korelacija

Često, primamljiva jednostavnost istraživanja korelacije potiče istraživača na lažne intuitivne zaključke o prisutnosti uzročno-posljedične veze između parova karakteristika, dok koeficijenti korelacije uspostavljaju samo statističke odnose.

Suvremena kvantitativna metodologija društvenih znanosti zapravo je odustala od pokušaja utvrđivanja uzročno-posljedičnih odnosa između promatranih varijabli empirijskim metodama. Stoga, kada istraživači u društvenim znanostima govore o uspostavljanju odnosa između varijabli koje se proučavaju, implicira se ili opća teorijska pretpostavka ili statistička ovisnost.

vidi također

  • Autokorelacijska funkcija
  • Funkcija uzajamne korelacije
  • Kovarijanca
  • Koeficijent determinacije
  • Regresijska analiza

Zaklada Wikimedia. 2010.

Faza 3. Pronalaženje odnosa između podataka

Linearna korelacija

Posljednja faza zadatka proučavanja povezanosti pojava je procjena tijesnosti veze pomoću korelacijskih pokazatelja. Ova je faza vrlo važna za utvrđivanje ovisnosti između čimbenika i karakteristika izvedbe, a time i za mogućnost postavljanja dijagnoze i prognoze fenomena koji se proučava.

Dijagnoza(od grčke dijagnoze prepoznavanje) - određivanje suštine i karakteristika stanja objekta ili fenomena na temelju njegove sveobuhvatne studije.

Prognoza(od grčke prognoze predviđanje, predviđanje) - svako specifično predviđanje, prosudba o stanju bilo koje pojave u budućnosti (vremenska prognoza, izborni ishod itd.). Prognoza je znanstveno utemeljena hipoteza o vjerojatnom budućem stanju sustava, objekta ili fenomena koji se proučava i pokazatelja koji karakteriziraju to stanje. Prognoziranje je izrada prognoze, posebno znanstveno istraživanje konkretnih izgleda za razvoj neke pojave.

Prisjetimo se definicije korelacije:

Poveznica– ovisnost između slučajnih varijabli, izražena u činjenici da raspodjela jedne vrijednosti ovisi o vrijednosti druge vrijednosti.

Uočava se korelacija ne samo između kvantitativnih, već i kvalitativnih karakteristika. Postoje različite metode i pokazatelji za procjenu bliskosti veza. Zaustavit ćemo se samo na linear pair koeficijent korelacije , koji se koristi kada postoji linearni odnos između slučajnih varijabli. U praksi se često javlja potreba za određivanjem razine povezanosti između slučajnih varijabli nejednakih dimenzija, pa je poželjno imati neku vrstu bezdimenzionalne karakteristike te povezanosti. Takva karakteristika (mjera povezanosti) je linearni koeficijent korelacije r xy, što je određeno formulom

Gdje , .

Označavajući i , možemo dobiti sljedeći izraz za izračunavanje koeficijenta korelacije

.

Ako uvedemo pojam normalizirano odstupanje , koji izražava odstupanje koreliranih vrijednosti od prosjeka u dijelovima standardne devijacije:



tada će izraz za koeficijent korelacije dobiti oblik

.

Ako izračunate koeficijent korelacije koristeći konačne vrijednosti izvornih slučajnih varijabli iz tablice za izračun, tada se koeficijent korelacije može izračunati pomoću formule

.

Svojstva koeficijenta linearne korelacije:

1). Koeficijent korelacije je bezdimenzijska veličina.

2). |r| £1 ili .

3). , a,b= const, – vrijednost korelacijskog koeficijenta se neće promijeniti ako se sve vrijednosti slučajnih varijabli X i Y pomnože (ili podijele) s konstantom.

4). , a,b= const, – vrijednost korelacijskog koeficijenta se neće promijeniti ako se sve vrijednosti slučajnih varijabli X i Y povećaju (ili smanje) za konstantu.

5). Postoji odnos između koeficijenta korelacije i koeficijenta regresije:

Vrijednosti korelacijskih koeficijenata mogu se tumačiti na sljedeći način:

Kvantitativni kriteriji za procjenu bliskosti komunikacije:

U prognostičke svrhe, vrijednosti s |r| > 0,7.

Koeficijent korelacije nam omogućuje da zaključimo da postoji linearni odnos između dviju slučajnih varijabli, ali ne pokazuje koja od varijabli uzrokuje promjenu druge. Zapravo, veza između dvije slučajne varijable može postojati bez uzročno-posljedične veze između samih vrijednosti, jer promjena obiju slučajnih varijabli može biti uzrokovana promjenom (utjecajem) treće.

Koeficijent korelacije r xy je simetrična u odnosu na slučajne varijable koje se razmatraju x I Y. To znači da je za određivanje koeficijenta korelacije potpuno svejedno koja je od veličina nezavisna, a koja zavisna.

Značaj koeficijenta korelacije

Čak i za nezavisne varijable koeficijent korelacije može biti različit od nule zbog slučajnog raspršenja rezultata mjerenja ili zbog malog uzorka slučajnih varijabli. Stoga treba provjeriti značajnost koeficijenta korelacije.

Značajnost linearnog koeficijenta korelacije provjerava se na temelju Studentov t-test :

.

Ako t > t cr(P,n-2), tada je linearni koeficijent korelacije značajan, pa je stoga statistički odnos također značajan x I Y.

.

Radi lakšeg izračuna izrađene su tablice vrijednosti granica pouzdanosti koeficijenata korelacije za različite brojeve stupnjeva slobode. f = n–2 (dvostrani test) i različite razine značajnosti a= 0,1; 0,05; 0,01 i 0,001. Korelacija se smatra značajnom ako izračunati koeficijent korelacije prelazi vrijednost granice pouzdanosti koeficijenta korelacije za dani f I a.

Za velike n I a= 0,01 vrijednost granice pouzdanosti koeficijenta korelacije može se izračunati pomoću približne formule

.

Prilikom studiranja korelacije pokušava utvrditi postoji li odnos između dva pokazatelja u istom uzorku (na primjer, između visine i težine djece ili između razine kvocijent inteligencije i školski uspjeh) ili između dva različita uzorka (primjerice, kada se uspoređuju parovi blizanaca), te ako taj odnos postoji, prati li povećanje jednog pokazatelja povećanje (pozitivna korelacija) ili smanjenje (negativna korelacija) drugi.

Drugim riječima, korelacijska analiza pomaže utvrditi je li moguće predvidjeti moguće vrijednosti jednog pokazatelja, znajući vrijednost drugog.

Do sada, kada smo analizirali rezultate našeg iskustva u proučavanju učinaka marihuane, namjerno smo ignorirali takav pokazatelj kao što je vrijeme reakcije. U međuvremenu, bilo bi zanimljivo provjeriti postoji li veza između učinkovitosti reakcija i njihove brzine. To bi omogućilo, na primjer, tvrdnju da što je osoba sporija, to će njegove akcije biti točnije i učinkovitije i obrnuto.

U tu svrhu mogu se koristiti dvije različite metode: parametarska metoda izračuna Bravais-Pearsonovog koeficijenta (r) i izračun Spearmanova rang koeficijenta korelacije (r s ), koji se odnosi na ordinalne podatke, tj. neparametarski je. Međutim, prvo shvatimo što je korelacijski koeficijent.

Koeficijent korelacije

Koeficijent korelacije je vrijednost koja može varirati od -1 do 1. U slučaju potpune pozitivne korelacije, ovaj koeficijent je plus 1, a u slučaju potpuno negativne korelacije, on je minus 1. Na grafikonu je ovo odgovara ravnoj liniji koja prolazi kroz točke sjecišta vrijednosti svakog para podataka:

Varijabilna

Ako se te točke ne poredaju u ravnu liniju, već tvore "oblak", koeficijent korelacije u apsolutnoj vrijednosti postaje manji od jedan i, kako se ovaj oblak zaokružuje, približava se nuli:

Ako je koeficijent korelacije 0, obje varijable su potpuno neovisne jedna o drugoj.

U humanističkim znanostima, korelacija se smatra jakom ako je njen koeficijent veći od 0,60; ako prelazi 0,90, tada se korelacija smatra vrlo jakom. No, da bi se mogli zaključivati ​​o odnosima između varijabli, veličina uzorka je od velike važnosti: što je uzorak veći, to je vrijednost dobivenog koeficijenta korelacije pouzdanija. Postoje tablice s kritičnim vrijednostima Bravais-Pearsonovog i Spearmanovog koeficijenta korelacije za različite brojeve stupnjeva slobode (jednak je broju parova minus 2, tj. n-2). Samo ako su korelacijski koeficijenti veći od ovih kritičnih vrijednosti, mogu se smatrati pouzdanima. Dakle, da bi korelacijski koeficijent od 0,70 bio pouzdan potrebno je u analizu uzeti najmanje 8 parova podataka ( = P - 2 = 6) prilikom izračunavanja r(Tablica B.4) i 7 parova podataka (= n - 2 = 5) pri računanju r s (Tablica 5 u Dodatku B. 5).

Bravais–Pearsonov koeficijent

Za izračun ovog koeficijenta koristite sljedeću formulu (može izgledati drugačije za različite autore):

gdje je  XY - zbroj umnožaka podataka iz svakog para;

n - broj parova;

- prosjek za datu varijablu x;

Prosjek za varijabilne podatke Y;

S x - x;

s Y - standardna devijacija za distribuciju u.

Sada možemo koristiti ovaj koeficijent da odredimo postoji li odnos između vremena reakcije ispitanika i učinkovitosti njihovih radnji. Uzmimo, na primjer, razinu pozadine kontrolne skupine.

n= 15  15,8  13,4 = 3175,8;

(n 1)S x S g = 14  3,07  2,29 = 98,42;

r =

Negativan korelacijski koeficijent može značiti da što je duže vrijeme reakcije, to je niža izvedba. Međutim, njegova je vrijednost premala da bi se moglo govoriti o pouzdanom odnosu između ove dvije varijable.

nXY=………

(n- 1)S x S Y = ……

Koji se zaključak može izvući iz ovih rezultata? Ako mislite da postoji veza između varijabli, je li izravna ili inverzna? Je li pouzdan [vidi stol 4 (dodatak B. 5) s kritičnim vrijednostima r]?

Spearmanov rang koeficijent korelacijer s

Ovaj koeficijent je lakše izračunati, ali rezultati su manje točni nego kada se koristi r. To je zbog činjenice da se pri izračunu Spearmanova koeficijenta koristi redoslijed podataka, a ne njihove kvantitativne karakteristike i intervali između razreda.

Stvar je u tome da kada se koristi koeficijent korelacije ranga Kopljanik(r s ) oni samo provjeravaju hoće li rangiranje podataka za bilo koji uzorak biti isto kao u nizu drugih podataka za ovaj uzorak, upareno povezanih s prvim (primjerice, hoće li studenti biti "rangirani" jednako kada polažu i psihologiju i matematiku, ili čak s dva različita učitelja psihologije?). Ako je koeficijent blizu + 1, to znači da su obje serije praktički identične, a ako je taj koeficijent blizu - 1, može se govoriti o potpunom inverznom odnosu.

Koeficijent r s izračunati po formuli

Gdje d- razlika između redova vrijednosti konjugiranih obilježja (bez obzira na njegov predznak), i n-broj parova

Obično se ovaj neparametarski test koristi u slučajevima kada je potrebno izvući neke zaključke ne toliko o intervali između podataka, koliko o njima činovi, i također kada su krivulje distribucije previše asimetrične i ne dopuštaju korištenje parametarskih kriterija kao što je koeficijent r(u tim slučajevima može biti potrebno pretvoriti kvantitativne podatke u redne podatke).

Budući da je to slučaj s distribucijom vrijednosti učinkovitosti i vremena reakcije u eksperimentalnoj skupini nakon izlaganja, možete ponoviti izračune koje ste već napravili za ovu skupinu, samo sada ne za koeficijent r, i za indikator r s . To će vam omogućiti da vidite koliko su ta dva različita*.

*Treba zapamtiti da

1) za broj pogodaka rang 1 odgovara najvišoj, a 15 najnižoj izvedbi, dok za vrijeme reakcije rang 1 odgovara najkraćem vremenu, a 15 najdužem;

2) ex aequo podaci dobivaju srednji rang.

Dakle, kao iu slučaju koeficijenta r, dobiven je pozitivan, iako nepouzdan rezultat. Koji je od ova dva rezultata vjerojatniji: r =-0,48 ili r s = +0,24? Ovo se pitanje može postaviti samo ako su rezultati pouzdani.

Još jednom želim naglasiti da je bit ova dva koeficijenta nešto drugačija. Negativan koeficijent r pokazuje da je učinkovitost često veća što je vrijeme reakcije kraće, dok je kod izračuna koeficijenta r s trebalo je provjeriti odgovaraju li brži ispitanici uvijek točnije, a sporiji - manje točno.

Budući da je u eksperimentalnoj skupini nakon izlaganja dobiven koeficijent r s , jednak 0,24, ovdje očito nije vidljiv sličan trend. Pokušajte sami razumjeti podatke za kontrolnu skupinu nakon intervencije, znajući da  d 2 = 122,5:

; Je li pouzdan?

Koji je vaš zaključak?……………………………………………………………………………………………………………………

…………………………………………………………………………………………………………………….

Dakle, pogledali smo različite parametarske i neparametarske statističke metode koje se koriste u psihologiji. Naš osvrt je bio vrlo površan, a glavni zadatak mu je bio dati čitatelju do znanja da statistika nije tako strašna kao što se čini i da zahtijeva uglavnom zdrav razum. Podsjećamo vas da su podaci o “iskustvima” kojima smo se ovdje bavili izmišljeni i ne mogu poslužiti kao temelj za bilo kakve zaključke. Međutim, takav bi se eksperiment doista isplatio provesti. Budući da je za ovaj eksperiment odabrana čisto klasična tehnika, ista se statistička analiza može koristiti u mnogim različitim eksperimentima. U svakom slučaju, čini nam se da smo zacrtali neke glavne smjernice koje bi mogle biti od koristi onima koji ne znaju odakle krenuti sa statističkom analizom dobivenih rezultata.

Postoje tri glavne grane statistike: deskriptivna statistika, induktivna statistika i korelacijska analiza.

Udio