Variatsioonisarjade koostamine. Intervallide variatsioonirea koostamine pidevate kvantitatiivsete andmete jaoks Milliseid variatsiooniridu te teate

Antud katses või vaatluses uuritud parameetri väärtuste kogumit, mis on järjestatud suuruse järgi (suurenemine või vähenemine), nimetatakse variatsiooniseeriaks.

Oletame, et mõõtsime kümne patsiendi vererõhku, et saada ülemine BP lävi: süstoolne rõhk, s.o. ainult üks number.

Kujutage ette, et arteriaalse süstoolse rõhu vaatluste seeria (statistiline populatsioon) 10 vaatluse jooksul on järgmisel kujul (tabel 1):

Tabel 1

Variatsioonirea komponente nimetatakse variantideks. Variandid esindavad uuritava tunnuse arvulist väärtust.

Variatsioonirea koostamine statistilise vaatluste kogumi põhjal on alles esimene samm kogu komplekti omaduste mõistmise suunas. Järgmisena on vaja määrata uuritava kvantitatiivse tunnuse keskmine tase (verevalgu keskmine tase, patsientide keskmine kaal, anesteesia alguse keskmine aeg jne).

Keskmist taset mõõdetakse kriteeriumide abil, mida nimetatakse keskmisteks. Keskmine väärtus on kvalitatiivselt homogeensete väärtuste üldistav arvtunnus, mis iseloomustab ühe numbriga kogu statistilist üldkogumit ühe tunnuse järgi. Keskmine väärtus väljendab üldist, mis on antud vaatluskogumi tunnusele iseloomulik.

Tavaliselt kasutatakse kolme tüüpi keskmisi: režiim (), mediaan () ja aritmeetiline keskmine ().

Mis tahes keskmise väärtuse määramiseks on vaja kasutada üksikute vaatluste tulemusi, kirjutades need variatsioonireana (tabel 2).

Mood- väärtus, mis esineb vaatlusseerias kõige sagedamini. Meie näites režiim = 120. Kui variatsiooniseerias pole korduvaid väärtusi, siis öeldakse, et režiimi pole. Kui mitut väärtust korratakse sama arv kordi, võetakse režiimiks neist väikseim.

Mediaan- väärtus, mis jagab jaotuse kaheks võrdseks osaks, kasvavas või kahanevas järjekorras järjestatud vaatluste seeria keskne või mediaanväärtus. Seega, kui variatsioonireas on 5 väärtust, siis on selle mediaan võrdne variatsioonirea kolmanda liikmega, kui reas on paarisarv liikmeid, siis mediaan on selle kahe rea aritmeetiline keskmine. kesksed vaatlused, s.o. kui seerias on 10 vaatlust, siis mediaan võrdub 5 ja 6 vaatluse aritmeetilise keskmisega. Meie näites.

Pange tähele režiimi ja mediaani olulist tunnust: nende väärtusi ei mõjuta äärmuslike variantide arvväärtused.

Aritmeetiline keskmine arvutatakse valemiga:

kus on -nda vaatluse vaadeldud väärtus ja vaatluste arv. Meie juhtumi jaoks.

Aritmeetilisel keskmisel on kolm omadust:

Keskmine on variatsioonide seerias keskmisel positsioonil. Rangelt sümmeetrilises reas.

Keskmine on üldistav väärtus ja juhuslikud kõikumised, üksikandmete erinevusi keskmise taga näha ei ole. See peegeldab tüüpilist, mis on iseloomulik kogu elanikkonnale.

Kõigi variantide keskmisest kõrvalekallete summa on võrdne nulliga: . Näidatud on variandi kõrvalekalle keskmisest.

Variatsiooniseeria koosneb variantidest ja neile vastavatest sagedustest. Kümnest saadud väärtusest kohtas numbrit 120 6 korda, 115 - 3 korda, 125 - 1 korda. Sagedus () – üksikute valikute absoluutarv populatsioonis, mis näitab, mitu korda see valik variatsioonireas esineb.

Variatsiooniseeriad võivad olla lihtsad (sagedused = 1) või rühmitatud lühendatud, igaüks 3-5 valikut. Lihtsat seeriat kasutatakse väikese arvu vaatlustega (), rühmitatud - suure hulga vaatlustega ().

variatsiooniline nimetatakse kvantitatiivsel alusel üles ehitatud jaotussarjadeks. Kvantitatiivsete tunnuste väärtused populatsiooni üksikutes üksustes ei ole püsivad, erinevad üksteisest enam-vähem.

Variatsioon- tunnuse väärtuse kõikumine, varieeruvus üldkogumi ühikutes. Nimetatakse uuritavas populatsioonis esineva tunnuse eraldi arvväärtusi valikuid väärtused. Keskmise väärtuse ebapiisavus populatsiooni täielikuks iseloomustamiseks tingib vajaduse täiendada keskmisi väärtusi näitajatega, mis võimaldavad hinnata nende keskmiste tüüpilisust, mõõtes uuritava tunnuse kõikumist (variatsiooni).

Variatsiooni olemasolu on tingitud paljude tegurite mõjust tunnuse taseme kujunemisele. Need tegurid toimivad ebavõrdse jõuga ja erinevates suundades. Tunnuste varieeruvuse mõõtmise kirjeldamiseks kasutatakse variatsiooninäitajaid.

Variatsiooni statistilise uuringu ülesanded:

  • 1) märkide olemuse ja varieerumisastme uurimine populatsiooni üksikutes üksustes;
  • 2) üksikute tegurite või nende rühmade rolli kindlaksmääramine populatsiooni teatud tunnuste varieerumisel.

Statistikas kasutatakse variatsiooni uurimiseks spetsiaalseid meetodeid, mis põhinevad indikaatorite süsteemil, Koos mille järgi variatsiooni mõõdetakse.

Variatsiooni uurimine on hädavajalik. Variatsioonide mõõtmine on vajalik valimivaatluse, korrelatsiooni- ja dispersioonanalüüsi jms läbiviimisel. Ermolaev O.Yu. Matemaatiline statistika psühholoogidele: õpik [Tekst] / O.Yu. Ermolajev. - M.: Moskva Psühholoogilise ja Sotsiaalse Instituudi kirjastus Flint, 2012. - 335lk.

Variatsiooniastme järgi saab hinnata populatsiooni homogeensust, tunnuste individuaalsete väärtuste stabiilsust ja keskmise tüüpilisust. Nende põhjal töötatakse välja märkide vahelise seose läheduse näitajad, indikaatorid valikulise vaatluse täpsuse hindamiseks.

Varieerub ruumis ja ajas.

Ruumi varieerumist mõistetakse kui tunnuse väärtuste kõikumist eraldi territooriume esindavates elanikkonna ühikutes. Ajamuutuse all mõeldakse atribuudi väärtuste muutumist erinevatel ajaperioodidel.

Jaotussarja variatsiooni uurimiseks on kõik atribuutide väärtuste variandid järjestatud kasvavas või kahanevas järjekorras. Seda protsessi nimetatakse seeriate järjestamiseks.

Kõige lihtsamad varieerumise märgid on miinimum ja maksimum- atribuudi väikseim ja suurim väärtus agregaadis. Tunnuste väärtuste üksikute variantide korduste arvu nimetatakse korduste sageduseks (fi). Sagedusi on mugav asendada sagedustega - wi. Sagedus - sageduse suhteline näitaja, mida saab väljendada ühiku murdosades või protsentides ja võimaldab võrrelda variatsiooniridu erineva arvu vaatlustega. Väljendatakse valemiga:

kus Xmax, Xmin - atribuudi maksimaalne ja minimaalne väärtus agregaadis; n on rühmade arv.

Tunnuse varieerumise mõõtmiseks kasutatakse erinevaid absoluutseid ja suhtelisi näitajaid. Variatsiooni absoluutnäitajate hulka kuuluvad variatsioonivahemik, keskmine lineaarhälve, dispersioon, standardhälve. Kõikumise suhtelised näitajad hõlmavad võnketegurit, suhtelist lineaarset hälvet, variatsioonikordajat.

Näide variatsiooniseeria leidmisest

Harjutus. Selle proovi jaoks:

  • a) Leia variatsiooniseeria;
  • b) konstrueerida jaotusfunktsioon;

nr=42. Näidisesemed:

1 5 1 8 1 3 9 4 7 3 7 8 7 3 2 3 5 3 8 3 5 2 8 3 7 9 5 8 8 1 2 2 5 1 6 1 7 6 7 7 6 2

Lahendus.

  • a) järjestatud variatsiooniseeria koostamine:
    • 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9
  • b) diskreetse variatsioonirea konstrueerimine.

Arvutame Sturgessi valemi abil variatsioonirea rühmade arvu:

Võtame rühmade arvu 7.

Teades rühmade arvu, arvutame intervalli väärtuse:

Tabeli koostamise mugavuse huvides võtame rühmade arvu 8, intervall on 1.

Riis. üks Kaupluse müügimaht teatud aja jooksul

Näide matemaatilise statistika testi lahendamisest

Ülesanne 1

Esialgsed andmed : teatud 30 inimesest koosneva rühma õpilased sooritasid eksami kursusel "Informaatika". Õpilaste saadud hinded moodustavad järgmise numbrijada:

I. Koostage variatsiooniseeria

m x

w x

m x nak

w x nak

Kokku:

II. Statistilise teabe graafiline esitus.

III. Valimi arvulised omadused.

1. Aritmeetiline keskmine

2. Geomeetriline keskmine

3. Mood

4. Mediaan

222222333333333 | 3 34444444445555

5. Valimi dispersioon

7. Variatsioonikoefitsient

8. Asümmeetria

9. Asümmeetria koefitsient

10. Kurtosis

11. Kurtoosi koefitsient

2. ülesanne

Esialgsed andmed : teatud rühma õpilased kirjutasid lõputöö. Grupis on 30 inimest. Õpilaste kogutud hinded moodustavad järgmise arvude jada

Lahendus

I. Kuna märk võtab palju erinevaid väärtusi, koostame selle jaoks intervalli variatsioonirea. Selleks määrame esmalt intervalli väärtuse h. Kasutame Sturgeri valemit

Teeme intervallide skaala. Sel juhul võtame esimese intervalli ülemise piiri jaoks valemiga määratud väärtuse:

Järgmiste intervallide ülemised piirid määratakse järgmise rekursiivse valemiga:

, siis

Lõpetame intervallide skaala loomise, kuna järgmise intervalli ülempiir on muutunud valimi maksimaalsest väärtusest suuremaks või sellega võrdseks
.

II. Intervallide variatsiooniseeriate graafiline kuvamine

III. Valimi arvulised omadused

Valimi arvuliste karakteristikute määramiseks koostame abitabeli

Summa:

1. Aritmeetiline keskmine

2. Geomeetriline keskmine

3. Mood

4. Mediaan

10 11 12 12 13 13 13 13 14 14 14 14 15 15 15 |15 15 15 16 16 16 16 16 17 17 18 19 19 20 20

5. Valimi dispersioon

6. Proovi standardhälve

7. Variatsioonikoefitsient

8. Asümmeetria

9. Asümmeetria koefitsient

10. Kurtosis

11. Kurtoosi koefitsient

3. ülesanne

Seisund : ampermeetri skaala jagamise väärtus on 0,1 A. Näidud ümardatakse lähima täisjaotuseni. Leidke tõenäosus, et lugemisel tehakse viga, mis on suurem kui 0,02 A.

Lahendus.

Ümardamisviga võib pidada juhuslikuks muutujaks X, mis jaotub ühtlaselt kahe kõrvuti asetseva täisarvujaotuse vahel. Ühtlase jaotuse tihedus

,

kus
- võimalikke väärtusi sisaldava intervalli pikkus X; väljaspool seda intervalli
Selles ülesandes on võimalikke väärtusi sisaldava intervalli pikkus X, võrdub 0,1, seega

Lugemisviga ületab 0,02, kui see on intervalliga (0,02; 0,08) suletud. Siis

Vastus: R=0,6

4. ülesanne

Algandmed: normaaljaotusega tunnuse matemaatiline ootus ja standardhälve X on vastavalt 10 ja 2. Leidke tõenäosus, et testi tulemusena X võtab intervallis (12, 14) sisalduva väärtuse.

Lahendus.

Kasutame valemit

Ja teoreetilised sagedused

Lahendus

X puhul selle matemaatiline ootus M(X) ja dispersioon D(X). Lahendus. Leida juhusliku suuruse jaotusfunktsioon F(x)... diskreetimisviga). Koostame variatsiooniline rida Intervalli laius saab: iga väärtuse jaoks rida Arvutame välja, kui palju...

  • Lahendus: eraldatav võrrand

    Lahendus

    Vormis Eraisiku leidmiseks lahendusi ebahomogeenne võrrand koostada süsteem Lahendame saadud süsteemi... ; +47; +61; +10; - kaheksa. Ehitamise intervall variatsiooniline rida. Andke statistilised hinnangud keskmisele...

  • Lahendus: Arvutame ahel- ja baas absoluutsed kasvumäärad, kasvumäärad, kasvumäärad. Saadud väärtused on kokku võetud tabelis 1

    Lahendus

    Tootmise maht. Lahendus: intervalli aritmeetiline keskmine variatsiooniline rida arvutatakse järgmiselt: per... Valimi võtmise piirviga tõenäosusega 0,954 (t=2) saab: Δ w = t*μ = 2*0,0146 = 0,02927 Määratleme piirid...

  • Lahendus. märk

    Lahendus

    Kelle töökogemusest ja ulatus näidis. Nende töötajate keskmine tööstaaž valimi ... tööpäevast ja ulatus näidis. Valimi keskmine kestus... 1,16, olulisuse tase α = 0,05. Lahendus. variatsiooniline rida selle proovi vorm on: 0,71 ...

  • Bioloogia tööõppekava 10.-11. klassile Koostanud Polikarpova S. V

    Töö õppekava

    Lihtsamad ristamise skeemid» 5 L.r. " Lahendus elementaarsed geneetilised probleemid” 6 L.r. " Lahendus elementaarsed geneetilised probleemid” 7 L.r. "..., 110, 115, 112, 110. Koosta variatsiooniline rida, joonista variatsiooniline kõver, leidke objekti keskmine väärtus ...

  • Kutsutakse numbrite rühma, mida ühendab mingi atribuut agregaat.

    Nagu eespool märgitud, on esmane statistiline spordimaterjal rühm erinevaid numbreid, mis ei anna treenerile ettekujutust nähtuse või protsessi olemusest. Väljakutse on muuta see populatsioon süsteemiks ja kasutada selle näitajaid vajaliku teabe saamiseks.

    Variatsioonirea koostamine on just nimelt teatud matemaatilise rea moodustamine

    Näide 2. 34 suusatajat registreerisid pärast distantsi läbimist järgmise pulsi taastumise aja (sekundites):

    81; 78: 84; 90; 78; 74; 84; 85; 81; 84: 79; 84; 74; 84; 84;

    85; 81; 84; 78: 81; 74; 84; 81; 84; 85; 81; 78; 81; 81; 84;

    Nagu näete, ei kanna see numbrirühm mingit teavet.

    Variatsioonirea koostamiseks sooritame esmalt toimingu paremusjärjestus - numbrite paigutus kasvavas või kahanevas järjekorras. Näiteks kasvavas järjekorras saadakse järjestamisel järgmised tulemused;

    78; 78; 78; 78; 78; 78;

    81; 81; 81; 81; 81; 81; 81; 81; 81;

    84; 84; 84; 84; 84; 84; 84; 84; 84; 84; 84;

    Kahanevas järjestuses saadakse järjestus selles numbrirühmas:

    84; 84; 84; 84; 84; 84; 84; 84: 84: 84; 84;

    81; 81; 81; 81; 8!; 81: 81; 81; 81;

    78; 78; 78; 78; 78; 78;

    Pärast pingerida ilmneb selle numbrirühma kirjutamise irratsionaalne vorm - samu numbreid korratakse mitu korda. Seetõttu tekib loomulik mõte muuta kirje selliselt, et näidata, millist numbrit mitu korda korratakse. Näiteks, võttes arvesse järjestust kasvavas järjekorras:

    Siin vasakul on number, mis näitab sportlase pulsi taastumisaega, paremal on selle näidu korduste arv selles 34 sportlasest koosnevas grupis.

    Vastavalt ülaltoodud matemaatiliste sümbolite kontseptsioonidele tähistatakse vaadeldavat mõõtmisrühma mõne tähega, näiteks x. Arvestades selle rühma arvude kasvavat järjekorda: x 1 -74 s; x 2 - 78 s; x 3 - 81 s; x 4 - 84 s; x 5 - 85 s; x 6 -x n - 90 s, saab iga vaadeldavat arvu tähistada sümboliga X i .

    Tähistame vaadeldavate mõõtmiste korduste arvu tähega n. Seejärel:

    n1 = 4; n2 = 6; n3 = 9; n4 = 11; n 5 =3;n 6 =n n =1 ja iga korduste arvu saab tähistada kui n i .

    Näite tingimusest tulenevalt on tehtud mõõtmiste koguarv 34. See tähendab, et kõigi n-de summa on 34. Või sümboolses avaldises:

    Tähistame seda summat ühe tähega - n. Seejärel saab vaadeldava näite lähteandmed kirjutada sellisel kujul (tabel 1).

    Saadud arvude rühm on teisendatud jada kaootiliselt hajutatud näitudest, mille koolitaja sai töö alguses.

    Tabel 1

    x i n i
    n = 34

    Selline rühm on teatud süsteem, mille parameetrid iseloomustavad mõõtmisi. Nimetatakse numbreid, mis tähistavad mõõtmiste tulemusi (x i). valikuvõimalused; n i - nende korduste arv - nimetatakse sagedused; n - kõigi sageduste summa - jah täitematerjali maht.

    Saadud süsteemi nimetatakse variatsiooni seeria. Mõnikord nimetatakse neid seeriaid empiirilisteks või statistilisteks.

    On lihtne näha, et võimalik on variatsioonirea erijuhtum, kui kõik sagedused on võrdsed ühega n i ==1, st iga mõõtmine antud arvurühmas toimus ainult üks kord.

    Saadud variatsiooniseeriaid, nagu kõiki teisi, saab esitada graafiliselt. Saadud seeria joonistamiseks tuleb kõigepealt kokku leppida horisontaal- ja vertikaaltelje skaala.

    Selles ülesandes joonistame horisontaalteljele impulsi taastumisaja väärtused (x 1) nii, et suvaliselt valitud pikkusühik vastab ühe sekundi väärtusele. Hakkame neid väärtusi edasi lükkama 70 sekundilt, tinglikult taandudes kahe telje ristumiskohast 0.

    Vertikaalteljel joonistame oma seeria sageduste väärtused (n i), võttes skaala: pikkusühik võrdub sagedusühikuga.

    Olles niimoodi ette valmistanud tingimused graafiku joonistamiseks, jätkame tööd saadud variatsiooniridadega.

    Esimene numbripaar x 1 \u003d 74, n 1 \u003d 4 kantakse graafikule järgmiselt: x-teljel; leia x 1 =74 ja taastada risti sellest punktist, n-teljel leiame n 1 =4 ja tõmmake sellest horisontaaljoon, kuni see lõikub varem taastatud ristiga. Mõlemad jooned – vertikaalne ja horisontaalne – on abijooned ja seetõttu kantakse neid joonisele punktiirjoonega. Nende lõikepunktiks on selle graafiku skaalal X 1 =74 ja n 1 =4 suhe.

    Kõik teised graafiku punktid on joonistatud samal viisil. Seejärel ühendatakse need joonelõikudega. Et graafikul oleks suletud vorm, ühendame äärmised punktid horisontaaltelje naaberpunktidega segmentidega.

    Saadud joonis on meie variatsiooniseeria graafik (joonis 1).

    On üsna selge, et iga variatsiooniseeria on kujutatud oma graafikuga.

    Riis. 1. Variatsiooniseeria graafiline esitus.

    Joonisel fig. 1 on nähtav:

    1) kõigist uuritutest moodustasid suurima rühma sportlased, kelle pulsi taastumise aeg oli 84 s;

    2) paljude jaoks on see aeg 81 s;

    3) väikseima rühma moodustasid lühikese pulsi taastumisajaga - 74 s ja pika - 90 s sportlased.

    Seega tuleks pärast testide seeria täitmist järjestada saadud arvud ja koostada variatsiooniseeria, mis on teatud matemaatiline süsteem. Selguse huvides võib variatsiooniseeriaid illustreerida graafikuga.

    Ülaltoodud variatsiooniseeriaid nimetatakse ka diskreetne järgmine - selline, milles iga valikut väljendatakse ühe numbriga.

    Toome veel mõned näited variatsiooniridade koostamise kohta.

    Näide 3 12 laskurit, kes sooritasid kõhuli harjutust 10 lasku, näitasid (punktides) järgmisi tulemusi:

    94; 91; 96; 94; 94; 92; 91; 92; 91; 95; 94; 94.

    Variatsiooniseeria moodustamiseks järjestame need arvud;

    94; 94; 94; 94; 94;

    Pärast järjestamist koostame variatsioonirea (tabel 3).

    Statistiliste terminite sõnastik

    Statistika üldküsimused

    MIS ON MEDITSIINISTATISTIKA?

    Statistika on sündmuste, nähtuste, objektide kvantitatiivne kirjeldamine ja mõõtmine. Seda mõistetakse kui praktilise tegevuse haru (massinähtuste andmete kogumine, töötlemine ja analüüs), teadmiste haruna, s.o. spetsiaalne teadusdistsipliin ja kokkuvõtete kogumina lõplikud digitaalsed näitajad, mis on kogutud mis tahes sotsiaalsete nähtuste valdkonna iseloomustamiseks.

    Statistika on teadus, mis uurib massinähtuste mustreid näitajate üldistamise meetodil.

    Meditsiinistatistika on sõltumatu sotsiaalteadus, mis uurib massiliste sotsiaalsete nähtuste kvantitatiivne pool lahutamatult seotud nende kvalitatiivse poolega, mis võimaldab üldistavate näitajate meetod uurida nende nähtuste mustreid, ühiskonna majandusliku ja sotsiaalse elu tähtsamaid protsesse, selle tervist ning elanikkonna arstiabi korraldamise süsteemi.

    Statistilised meetodid on massivaatlusmaterjalide töötlemise tehnikate kogum, mis hõlmab: rühmitamist, kokkuvõtet, näitajate saamist, nende statistilist analüüsi jne.

    Meditsiinis kasutatakse statistilisi meetodeid:

    1. rahvastiku kui terviku ja selle peamiste rühmade terviseseisundi uurimine, kogudes ja analüüsides statistilisi andmeid rahvastiku suuruse ja koosseisu, taastootmise, kehalise arengu, erinevate haiguste levimuse ja kestuse jms kohta;
    2. tuvastada ja luua seoseid üldise haigestumuse ja suremuse vahel erinevate keskkonnateguritega üksikutesse haigustesse;
    3. raviasutuste võrgu, nende tegevuse ja personali arvandmete kogumine ja uurimine tervishoiutegevuse planeerimiseks, tervishoiuasutuste võrgu ja tegevuste arendamise plaanide täitmise jälgimiseks ning üksikute raviasutuste töökvaliteedi hindamiseks;
    4. haiguste ennetamise ja ravi meetmete tõhususe hindamine;
    5. uuringu tulemuste statistilise olulisuse määramine kliinikus ja katses.

    Meditsiinistatistika jaotised:

    • statistika üldteoreetilised ja metodoloogilised alused,
    • rahvastiku tervise statistika,
    • tervisestatistika.

    ANDMEBAASI LOOMINE MS EXCELIS

    Selleks, et andmebaas oleks edasiseks töötlemiseks mugav, tuleks järgida lihtsaid põhimõtteid:

    1) Parim programm andmebaasi loomiseks on MS Excel. Exceli andmeid saab hiljem hõlpsasti üle kanda ka teistesse spetsialiseeritud statistikapakettidesse, näiteks Statisticasse, SPSS-i jne keerukamate manipulatsioonide jaoks. Kuni 80-90% arvutustest saab aga kõige mugavamalt teha Excelis endas, kasutades Andmeanalüüsi lisandmoodulit.

    2) Tabeli ülemine rida andmebaasiga on kujundatud päisena, kuhu kantakse nende näitajate nimetused, mida selles veerus arvesse võetakse. Lahtrite ühendamine on ebasoovitav (see nõue kehtib üldiselt kogu andmebaasi kohta), kuna sel juhul muutuvad paljud toimingud kehtetuks. Samuti ei tohiks luua "kahekorruselist" päist, mille ülemine rida tähistab homogeensete indikaatorite rühma nime ja alumine rida - konkreetseid näitajaid. Homogeensete indikaatorite rühmitamiseks on parem märkida need ühevärvilise täidisega või lisada nende nimesse sulgudes rühmitusfunktsioon.

    Näiteks, mitte nii:

    ÜLDINE VERE ANALÜÜS
    ER LEU TR
    ER (UAC) LEU (UAC) TR(UAC)

    viimases versioonis on tagatud nii “ühe loo” päis kui ka andmete visuaalne homogeensus (kõik need viitavad UAC näitajatele).

    3) Esimene veerg peaks sisaldama selles andmebaasis oleva patsiendi seerianumbrit, sidumata seda ühegi uuritud näitajaga. See võimaldab tulevikus hõlpsalt taastada patsientide esialgset järjekorda igal etapil, isegi pärast loendi arvukaid sorteerimisi.

    4) Teine veerg täidetakse tavaliselt patsientide nimedega (või täisnimedega).

    5) Kvantitatiivsed näitajad (need, mida mõõdetakse numbritega, näiteks - pikkus, kaal, vererõhk, pulss jne) mahuvad tabelisse numbrilises vormingus. Näib, et see on juba selge, kuid tuleb meeles pidada, et Excelis tähistatakse alates 2007. aasta versioonist murdosa väärtusi punktiga: 4.5. Kui kirjutate arvu komaga eraldatuna, tajutakse seda tekstina ja need veerud tuleb ümber kirjutada.

    6) Kvalitatiivsete näitajatega on keerulisem. Need, millel on kaks väärtuse varianti (nn kahendväärtused: Jah-ei, Saadaval-Puudub, Mees-Naine), on parem tõlkida kahendsüsteemi: 0 ja 1. Väärtus 1 määratakse tavaliselt positiivne väärtus (Jah, Saadaval), 0 - negatiivne (Ei, Puudub).

    7) Kvalitatiivseid näitajaid, millel on mitu väärtust, mis erinevad raskusastmelt, nähtuse tasemest (nõrk-keskmine-tugev; külm-soe-kuum) saab järjestada ja vastavalt tõlkida ka numbriteks. Nähtuse madalaimale tasemele omistatakse madalaim aste - 0 või 1, järgmisi astmeid tähistavad järjestuste väärtused. Näiteks: haigus puudub – 0, kerge – 1, mõõdukas – 2, raske – 3.

    8) Mõnikord vastab üks kvaliteedinäitaja mitmele väärtusele. Näiteks veerus "Kaasnev diagnoos", kui haigusi on mitu, tahame need märkida komadega eraldatuna. Seda ei tohiks teha, kuna selliste andmete töötlemine on väga keeruline ja seda ei saa automatiseerida. Seetõttu on parem teha mitu veergu konkreetsete haigusrühmadega ("CVD haigused", "seedetrakti haigused" jne) või teatud nosoloogiatega ("chr.gastriit", "CHD" jne), mille andmed sisestatakse binaarsesse, binaarsesse vormi: 1 (mis tähendab "On antud haigus") - 0 ("Ei ole antud haigust").

    9) Indikaatorite üksikute rühmade eristamiseks saate aktiivselt kasutada värvi: näiteks on KLA indikaatoritega veerud esile tõstetud punasega, OAM-i andmed - kollasega jne.

    10) Iga patsient peab vastama ühele tabeli reale.

    Selline andmebaasi kujundus võimaldab mitte ainult oluliselt lihtsustada selle statistilise töötlemise protsessi, vaid ka hõlbustada selle täitmist materjali kogumise etapis.

    MILLINE MEETOD STATISTILISEKS ANALÜÜSIKS VALIDA?

    Pärast kõigi andmete kogumist seisab iga teadlane silmitsi küsimusega, kas valida kõige sobivam statistilise töötlemise meetod. Ja see pole üllatav: kaasaegne statistika ühendab tohutul hulgal erinevaid kriteeriume ja meetodeid. Kõigil neil on oma eripärad, need võivad sobida või mitte sobida kahe pealtnäha sarnase olukorra jaoks. Käesolevas artiklis püüame süstematiseerida kõik peamised, levinumad statistilise analüüsi meetodid vastavalt nende eesmärgile.

    Kuid kõigepealt paar sõna selle kohta, millised statistilised andmed on olemas, kuna sellest sõltub kõige sobivama analüüsimeetodi valik.

    Mõõtmisskaala

    Uuringu läbiviimisel määratakse iga vaatlusüksuse jaoks erinevate tunnuste väärtused. Sõltuvalt skaalast, millel neid mõõdetakse, jagunevad kõik märgid kvantitatiivne ja kvaliteet. Kvalitatiivsed näitajad teadustöös jagunevad vastavalt nn nominaalne kaal. Lisaks saab näitajaid esitada pingerida kaal.

    Näiteks võrreldakse sportlaste ja istuva eluviisiga inimeste südametegevuse näitajaid.

    Samal ajal määrati katsealustel järgmised omadused:

    • korrus- on nominaalne indikaator, mis võtab kaks väärtust - mees või naine.
    • vanus - kvantitatiivne indeks,
    • sport - nominaalne indikaator, millel on kaks väärtust: sisse lülitatud või mitte lülitatud,
    • südamerütm - kvantitatiivne indeks,
    • süstoolne vererõhk - kvantitatiivne indeks,
    • kaebused valu rinnus- on kvaliteet indikaator, mille väärtusi saab määrata kui nominaalne(kaebused on - kaebusi pole), ja vastavalt pingerida sagedusest sõltuv skaala (näiteks kui valu esineb mitu korda päevas - indikaatorile omistatakse auaste 3, mitu korda kuus - aste 2, mitu korda aastas - aste 1, kui ei kurda valu rinnus – määratakse 0) .

    Sobivate populatsioonide arv

    Järgmine probleem, mida tuleb statistilise meetodi valimiseks lahendada, on uuringus sobitatavate populatsioonide arv.

    • Enamikul juhtudel tegeleme kliinilistes uuringutes kahe patsientide rühmaga - põhilised ja kontroll. Põhiline, või kogenud, loetakse rühmaks, kus uuritud diagnoosi- või ravimeetodit kasutati või kus patsiendid põevad käesolevas uuringus käsitletavat haigust. kontroll rühm seevastu koosneb patsientidest, kes saavad tavapärast arstiabi, platseebot või isikuid, kellel ei ole uuritavat haigust. Selliseid populatsioone, mida esindavad erinevad patsiendid, nimetatakse mitteseotud.
      Neid on ikka veel seotud, või paaris, agregaadid, kui tegemist on samade inimestega, kuid mis tahes funktsiooni väärtusi võrreldakse, saadakse Enne ja pärast uurimine. Võrreldavate komplektide arv on samuti 2, kuid neile rakendatakse erinevaid meetodeid kui mitteseotud komplektidele.
    • Teine võimalus on kirjeldus üks totaalsus, mis, tõsi küll, on üldiselt igasuguse uurimistöö aluseks. Isegi kui töö põhieesmärk on võrrelda kahte või enamat gruppi, tuleb esmalt igaüht neist iseloomustada. Selleks kasutatakse meetodeid kirjeldav statistika. Lisaks saab meetodeid rakendada ühe populatsiooni puhul korrelatsioonianalüüs, mida kasutatakse seose leidmiseks kahe või enama uuritava tunnuse vahel (näiteks pikkuse sõltuvus kehakaalust või pulsisageduse sõltuvus kehatemperatuurist).
    • Lõpuks võib võrrelda mitut komplekti. See on meditsiiniuuringutes väga levinud. Patsiendid saab rühmitada sõltuvalt erinevate ravimite kasutamisest (näiteks kui võrrelda antihüpertensiivsete ravimite efektiivsust: rühm 1 - AKE inhibiitorid, 2 - beetablokaatorid, 3 - tsentraalselt toimivad ravimid), vastavalt haiguse tõsidusele ( rühm 1 - kerge, 2 - keskmine, 3 - raske) jne.

    Samuti on oluline küsimus jaotuse normaalsus uuritud populatsioonid. See sõltub sellest, kas meetodeid saab rakendada parameetriline analüüs või ainult mitteparameetriline. Tingimused, mis peavad olema normaalselt jaotunud populatsioonides täidetud, on järgmised:

    1. aritmeetilise keskmise, režiimi ja mediaani väärtuste maksimaalne lähedus või võrdsus;
    2. vastavus "kolme sigma" reeglile (vähemalt 68,3% variandist on vahemikus M ± 1σ, vähemalt 95,5% variandist on vahemikus M ± 2σ, vähemalt 99,7% variandist on vahemikus M ± 2σ intervall M ± 3σ;
    3. näitajaid mõõdetakse kvantitatiivsel skaalal;
    4. jaotuse normaalsuse testimise positiivsed tulemused, kasutades spetsiaalseid kriteeriume - Kolmogorov-Smirnov või Shapiro-Wilk.

    Pärast kõigi meie poolt näidatud uuritud populatsioonide omaduste kindlaksmääramist soovitame kasutada järgmist tabelit, et valida kõige optimaalsem statistilise analüüsi meetod.

    meetod Skaala indikaatorite mõõtmiseks Võrreldavate populatsioonide arv Töötlemise eesmärk Andmete levitamine
    Üliõpilase t-test kvantitatiivne 2 normaalne
    Studenti t-test Bonferroni korrektsiooniga kvantitatiivne 3 või rohkem mitteseotud populatsioonide võrdlus normaalne
    Paaritud Studenti t-test kvantitatiivne 2 normaalne
    Ühesuunaline dispersioonanalüüs (ANOVA) kvantitatiivne 3 või rohkem mitteseotud populatsioonide võrdlus normaalne
    Ühesuunaline dispersioonanalüüs (ANOVA) korduvate mõõtmistega kvantitatiivne 3 või rohkem seotud populatsioonide võrdlus normaalne
    Mann-Whitney U test kvantitatiivne, pingerida 2 mitteseotud populatsioonide võrdlus ükskõik milline
    Rosenbaumi Q-test kvantitatiivne, pingerida 2 mitteseotud populatsioonide võrdlus ükskõik milline
    Kruskell-Wallise test kvantitatiivne 3 või rohkem mitteseotud populatsioonide võrdlus ükskõik milline
    Wilcoxoni test kvantitatiivne, pingerida 2 seotud populatsioonide võrdlus ükskõik milline
    G-testi märgid kvantitatiivne, pingerida 2 seotud populatsioonide võrdlus ükskõik milline
    Friedmani kriteerium kvantitatiivne, pingerida 3 või rohkem seotud populatsioonide võrdlus ükskõik milline
    Kriteerium χ 2 Pearson nominaalne 2 või enam mitteseotud populatsioonide võrdlus ükskõik milline
    Fisheri täpne test nominaalne 2 mitteseotud populatsioonide võrdlus ükskõik milline
    McNemari test nominaalne 2 seotud populatsioonide võrdlus ükskõik milline
    Q-test Cochran nominaalne 3 või rohkem seotud populatsioonide võrdlus ükskõik milline
    Suhteline risk (Risk Ratio, RR) nominaalne 2 mitteseotud populatsioonide võrdlus kohordiuuringutes ükskõik milline
    Koefitsientide suhe (OR) nominaalne 2 mitteseotud populatsioonide võrdlus juhtumikontrolli uuringutes ükskõik milline
    Pearsoni korrelatsioonikordaja kvantitatiivne 2 rida mõõte normaalne
    Spearmani astme korrelatsioonikordaja kvantitatiivne, pingerida 2 rida mõõte tunnuste vaheliste seoste tuvastamine ükskõik milline
    Kendalli korrelatsioonikordaja kvantitatiivne, pingerida 2 rida mõõte tunnuste vaheliste seoste tuvastamine ükskõik milline
    Kendalli vastavuskoefitsient kvantitatiivne, pingerida 3 või enam rida mõõtmisi tunnuste vaheliste seoste tuvastamine ükskõik milline
    Keskmiste väärtuste (M) ja keskmiste vigade (m) arvutamine kvantitatiivne 1 kirjeldav statistika ükskõik milline
    Mediaanide (Me) ja protsentiilide (kvartiilid) arvutamine pingerida 1 kirjeldav statistika ükskõik milline
    Suhteliste väärtuste (P) ja keskmiste vigade (m) arvutamine nominaalne 1 kirjeldav statistika ükskõik milline
    Shapiro-Wilki kriteerium kvantitatiivne 1 leviku analüüs ükskõik milline
    Kolmogorovi-Smirnovi kriteerium kvantitatiivne 1 leviku analüüs ükskõik milline
    Kriteerium ω 2 Smirnov-Kramer-von Mises kvantitatiivne 1 leviku analüüs ükskõik milline
    Kaplan-Meieri meetod ükskõik milline 1 ellujäämise analüüs ükskõik milline
    Coxi proportsionaalse ohu mudel ükskõik milline 1 ellujäämise analüüs ükskõik milline

    Suurepärased statistikud

    Karl Pearson (27. märts 1857 – 27. aprill 1936)

    27. märtsil 1857 sündis Karl Pearson – suur inglise matemaatik, statistik, bioloog ja filosoof; matemaatilise statistika rajaja, üks biomeetria rajajaid.

    Pärast 27-aastaselt Londoni ülikooli kolledžis rakendusmatemaatika professuuri saamist hakkas Karl Pearson uurima statistikat, mida ta pidas üldiseks teaduslikuks tööriistaks, mis on kooskõlas tema kaugeltki tavapäraste arusaamadega vajadusest pakkuda õpilastele laiaulatuslikke vaateid. .

    Pearsoni peamised saavutused statistika vallas hõlmavad tunnuste korrelatsiooni- ja kontingentsusteooria aluste väljatöötamist, empiiriliste jaotuste kirjeldamiseks mõeldud "Pearsoni kõverate" kasutuselevõttu ja ülimalt tähtsat hii-ruut testi ning suure hulga statistiliste tabelite arv. Pearson rakendas statistilist meetodit ja eriti korrelatsiooniteooriat paljudes teadusharudes.

    Siin on üks tema väidetest: "Kaasaegsete statistiliste meetodite esmakordsele amatöörlikule kasutuselevõtule väljakujunenud teaduses on tüüpiline põlgus. Aga ma elasin selle ajani, mil paljud neist hakkasid varjatult rakendama just neid meetodeid, mille nad alguses hukka mõistsid."

    Ja juba 1920. aastal kirjutas Pearson märkuse, milles ta väitis, et biomeetria koolkonna eesmärk "on muuta statistika rakendusmatemaatika haruks, üldistada, kõrvale heita või õigustada vana poliitika- ja sotsiaalstatisikute koolkonna nappe meetodeid. , ja üldse muuta statistika amatööride ja väitlejate spordiplatsilt tõsiseks teadusharuks.. Oli vaja kritiseerida ebatäiuslikke ja sageli ekslikke meetodeid meditsiinis, antropoloogias, kraniomeetrias, psühholoogias, kriminoloogias, bioloogias, sotsioloogias, et varustada neid teadusi uute ja võimsamate vahenditega.Võitlus kestis ligi kakskümmend aastat, kuid palju märke, et vana vaenulikkus on seljataga ja uued meetodid on üldtunnustatud.

    Karl Pearsonil olid väga mitmekülgsed huvid: ta õppis Heidelbergis füüsikat, tundis huvi religiooni sotsiaalse ja majandusliku rolli vastu ning pidas Cambridge'is ja Londonis isegi loenguid Saksa ajaloost ja kirjandusest.

    Vähetuntud on tõsiasi, et Karl Pearson pidas 28-aastaselt loenguid "naiste küsimusest" ja asutas isegi 1889. aastani kestnud meeste ja naiste klubi, kus peeti kõike naistega seonduvat, sealhulgas sugudevahelisi suhteid. vabalt ja piiranguteta arutleda.

    Klubi koosnes võrdsel arvul mehi ja naisi, peamiselt liberaalsest keskklassist, sotsialistidest ja feministidest.

    Klubi arutelude teemaks olid kõige laiemad teemad: seksuaalsuhetest Vana-Kreeka Ateenas kuni budistlike nunnade olukorrani, suhtumisest abielusse kuni prostitutsiooniprobleemideni. Sisuliselt seadis "Meeste ja naiste klubi" kahtluse alla meeste ja naiste vahelise suhtluse kauaaegsed normid ning ideed "õige" seksuaalsuse kohta. Victoria ajastul Inglismaal, kus paljud tajusid seksuaalsust millegi "madala" ja "loomana" ning teadmatus seksuaalkasvatusest oli laialt levinud, oli arutelu selliste teemade üle tõeliselt radikaalne.

    1898. aastal pälvis Pearson Kuningliku Seltsi Darwini medali, millest ta keeldus, arvates, et auhindu "tuleks anda noortele, et neid julgustada".

    Florence Nightingale (12. mai 1820 – 13. august 1910)

    Florence Nightingale (1820-1910) - armuõde ja Suurbritannia ühiskonnategelane, kelle sünnipäeval tähistame täna rahvusvahelist õdede päeva.

    Ta sündis Firenzes jõukas aristokraatlikus perekonnas, sai suurepärase hariduse, oskas kuut keelt. Noorest peale unistas ta halastajaõeks saamisest, 1853. aastal sai ta Kaiserwerthis pastor Flenderi õdede kogukonnas õehariduse ja sai Londoni väikese erahaigla juhatajaks.

    1854. aasta oktoobris, Krimmi sõja ajal, läks Firenze koos 38 assistendiga Krimmi välihaiglatesse. Haavatute hooldust korraldades rakendas ta järjekindlalt sanitaar- ja hügieenipõhimõtteid. Selle tulemusena vähenes haiglate suremus vähem kui kuue kuuga 42-lt 2,2%-le!

    Seades endale ülesandeks reformida sõjaväe meditsiiniteenistust, tagas Nightingale haiglate ventilatsiooni- ja kanalisatsioonisüsteemidega varustamise; Haigla personal peab olema saanud vajaliku koolituse. Korraldati sõjaväemeditsiini kool, sõdurite ja ohvitseride seas tehti selgitustööd haiguste ennetamise tähtsusest.

    Florence Nightingale’i panus meditsiinistatistikasse on suurepärane!

    • Tema 800-leheküljeline raamat "Märkused Briti armee haiglate tervist, tõhusust ja haldust mõjutavatest teguritest" (1858) sisaldas tervet statistikale pühendatud ja diagrammidega illustreeritud osa.
    • Nightingale oli uuendaja graafiliste kujutiste kasutamisel statistikas. Ta leiutas sektordiagrammid, mida ta nimetas "kukeharjadeks" ja mida kasutas suremuse mustrite kirjeldamiseks. Paljud tema skeemid sisaldusid sõjaväe terviseprobleemide komisjoni raportis, tänu millele tehti otsus armee meditsiini reformida.
    • Ta töötas välja esimese haiglate statistika kogumise vormi, mis on tänapäevaste haigla tegevuse aruandlusvormide eelkäija.

    Aastal 1859 valiti ta Kuningliku Statistikaühingu liikmeks ja hiljem sai temast Ameerika Statistikaühingu auliige.

    Johann Carl Friedrich Gauss (30. aprill 1777 – 23. veebruar 1855)

    30. aprillil 1777 sündis Braunschweigis suur saksa matemaatik, mehaanik, füüsik, astronoom, geodeet ja statistik Johann Carl Friedrich Gauss.

    Teda peetakse üheks kõigi aegade suurimaks matemaatikuks, "matemaatikute kuningaks". Copley medali laureaat (1838), Inglise Kuningliku Seltsi Rootsi (1821) ja Venemaa (1824) Teaduste Akadeemia välisliige.

    Juba kolmeaastaselt oskas Karl lugeda ja kirjutada, parandas isegi isa loendusvigu. Legendi järgi kutsus kooli matemaatikaõpetaja, et lapsi pikka aega töös hoida, lugema arvude summat 1-st 100-ni. Noor Gauss märkas, et paarissummad vastasotstest on samad: 1 + 100 = 101, 2 + 99 = 101 jne jne ja saigi kohe tulemuseks: 50×101=5050. Kuni kõrge eani tegi ta suurema osa arvutustest peas.

    Carl Gaussi peamised teadussaavutused statistikas on regressioonanalüüsi aluseks oleva vähimruutude meetodi loomine.

    Samuti uuris ta üksikasjalikult looduses levinud normaaljaotuse seadust, mille graafikut on sellest ajast peale sageli kutsutud Gaussi graafikuks. Laialt on tuntuks saanud normaaljaotust kirjeldav kolme sigma reegel (Gaussi reegel).

    Lev Semjonovitš Kaminski (1889-1962)

    Suure Isamaasõja võidu 75. aastapäeval tahaksin meenutada tähelepanuväärset teadlast, üht NSV Liidu sõjalise meditsiini- ja sanitaarstatistika rajajat - Lev Semjonovitš Kaminskit (1889-1962) ja rääkida temast.

    Ta sündis 27. mail 1889 Kiievis. Pärast Petrogradi ülikooli arstiteaduskonna kiitusega lõpetamist 1918. aastal oli Kaminski Punaarmee ridades, 1919. aasta aprillist kuni 1920. aasta lõpuni töötas Kagurinde 136. koondevakuatsioonihaigla peaarstina.

    Alates 1922. aastast juhtis Lev Semjonovitš Looderaudtee meditsiini- ja sanitaarteenistuse sanitaar- ja epidemioloogiaosakonda. Nendel aastatel sai Kaminsky teaduslik tegevus alguse prof. S.A.Novoselski. Nende ühises fundamentaalses töös “Kaotused minevikusõdades” analüüsiti statistilist materjali inimkaotuste kohta maailma erinevate armeede sõdades aastatel 1756–1918. Järgnevates töödes töötas Kaminsky välja ja põhjendas uut, täpsemat sõjaliste kaotuste klassifikatsiooni. .

    Monograafias "Rahvuslik toitumine ja rahvatervis" (1929) vaadeldi üksikasjalikult sõdade mõju sanitaar- ja hügieeniaspekte elanikkonna tervisele, samuti elanikkonna ja sõjaväe arstiabi korraldamist sõja-aastatel. .

    Aastatel 1935–1943 juhtis Lev Semenovitš NSV Liidu Tervishoiu Rahvakomissariaadi sanitaarstatistika (alates 1942. aastast - meditsiinilist) osakonda. 1943. aasta oktoobris sai prof Kaminskyst Sõjaväemeditsiini Akadeemia sõjaväelise meditsiinilise statistika osakonna juhataja. S.M.Kirov ning aastast 1956 on ta Leningradi Riikliku Ülikooli statistika ja raamatupidamise osakonna professor.

    Lev Semjonovitš pooldas kvantitatiivsete meetodite laialdast kasutuselevõttu sanitaar- ja meditsiinistatistika praktikas. 1959. aastal ilmus tema autorluses õpik "Laboratoorsete ja kliiniliste andmete statistiline töötlemine: statistika kasutamine arsti teaduslikus ja praktilises töös", mis kujunes paljudeks aastateks üheks parimaks kodumaiseks meditsiinistatistika õpikuks. L.S. Kaminsky märgib eessõnas:
    "... Tundub oluline, et raviarstid oskaksid asja kallale asuda, oskaksid koguda ja töödelda õigeid, võrdluseks ja võrdlemiseks sobivaid numbreid."

    Kriteeriumid ja meetodid

    Studenti t-test sõltumatute populatsioonide jaoks

    Studenti t-test on Studenti jaotusel põhinevate hüpoteeside statistilise kontrollimise meetodite klassi üldnimetus (statistilised testid). Levinumad t-testi rakendamise juhud on seotud kahe valimi keskmiste võrdsuse kontrollimisega.

    See kriteerium töötati välja William Seeley Gosset

    2. Milleks Studenti t-testi kasutatakse?

    Keskmiste erinevuste statistilise olulisuse määramiseks kasutatakse Studenti t-testi. Seda saab kasutada nii sõltumatute proovide võrdlemisel (näiteks suhkurtõvega patsientide rühmad ja terved rühmad) kui ka seotud populatsioonide võrdlemisel (näiteks samade patsientide keskmine pulsisagedus enne ja pärast antiarütmilise ravimi võtmist ). Viimasel juhul arvutatakse paaris Studenti t-test

    3. Millal saab Studenti t-testi kasutada?

    Studenti t-testi rakendamiseks on vajalik, et algandmetel oleks normaaljaotus. Samuti on oluline võrreldavate rühmade dispersioonide (jaotuste) võrdsus (homoskedastilisus). Ebavõrdsete dispersioonide korral kasutatakse Welchi t-testi (Welchi "s t").

    Võrreldavate valimite normaaljaotuse puudumisel kasutatakse Studenti t-testi asemel sarnaseid mitteparameetrilise statistika meetodeid, millest tuntuim on Mann-Whitney U-test.

    4. Kuidas arvutada Studenti t-testi?

    Keskmiste võrdlemiseks arvutatakse Studenti t-test järgmise valemi abil:

    kus M 1- esimese võrreldud populatsiooni (rühma) aritmeetiline keskmine, M 2- teise võrreldava populatsiooni (rühma) aritmeetiline keskmine, m 1- esimese aritmeetilise keskmise keskmine viga, m2- teise aritmeetilise keskmise keskmine viga.

    Studenti t-testi saadud väärtust tuleb õigesti tõlgendada. Selleks peame teadma ainete arvu igas rühmas (n 1 ja n 2). Vabadusastmete arvu leidmine f järgmise valemi järgi:

    F \u003d (n 1 + n 2) - 2

    Pärast seda määrame Studenti t-testi kriitilise väärtuse vajaliku olulisuse taseme (näiteks p=0,05) ja etteantud arvu vabadusastmete jaoks. f vastavalt tabelile (vt allpool).

    • Kui Studenti t-testi arvutatud väärtus on võrdne tabelist leitud kriitilise väärtusega või sellest suurem, järeldame, et erinevused võrreldavate väärtuste vahel on statistiliselt olulised.
    • Kui arvutatud Studenti t-testi väärtus on väiksem kui tabel, siis ei ole erinevused võrreldavate väärtuste vahel statistiliselt olulised.

    Uue rauapreparaadi efektiivsuse uurimiseks valiti välja kaks aneemiaga patsientide rühma. Esimeses rühmas said patsiendid kaks nädalat uut ravimit ja teises rühmas platseebot. Pärast seda mõõdeti hemoglobiini taset perifeerses veres. Esimeses rühmas oli keskmine hemoglobiini tase 115,4±1,2 g/l ja teises - 103,7±2,3 g/l (andmed on esitatud formaadis M±m), võrreldavad populatsioonid on normaaljaotusega. Esimeses rühmas oli 34 ja teises 40 patsienti. Tuleb teha järeldus saadud erinevuste statistilise olulisuse ja uue rauapreparaadi efektiivsuse kohta.

    Lahendus: Erinevuste olulisuse hindamiseks kasutame Studenti t-testi, mis arvutatakse keskmiste erinevusena, mis on jagatud vigade ruudu summaga:

    Pärast arvutuste tegemist võrdus t-testi väärtus 4,51-ga. Leiame vabadusastmete arvu (34 + 40) - 2 = 72. Saadud Studenti t-testi väärtust 4,51 võrdleme tabelis näidatud kriitilise väärtusega p=0,05: 1,993. Kuna kriteeriumi arvutuslik väärtus on suurem kui kriitiline väärtus, järeldame, et täheldatud erinevused on statistiliselt olulised (olulisuse tase p<0,05).


    PAARID ÕPILASTE t-test

    Paaritud Studenti t-test on üks Studenti meetodi modifikatsioone, mida kasutatakse paaris (korduvate) mõõtmiste erinevuste statistilise olulisuse määramiseks.

    1. T-testi kujunemislugu

    töötati välja t-test William Gosset hinnata õlle kvaliteeti Guinnessis. Seoses kohustustega ettevõtte ees ärisaladusi mitte avaldada, avaldati Gosseti artikkel 1908. aastal ajakirjas Biometrics pseudonüümi "Õpilane" (Student) all.

    2. Milleks kasutatakse paaris Studenti t-testi?

    Paaritud Studenti t-testi kasutatakse kahe sõltuva (paaris) valimi võrdlemiseks. Sõltuvad on mõõtmised, mis on tehtud samadel patsientidel, kuid erinevatel aegadel, näiteks vererõhu mõõtmised hüpertensiivsetel patsientidel enne ja pärast antihüpertensiivse ravimi võtmist. Nullhüpotees väidab, et võrreldavate valimite vahel ei ole erinevusi, alternatiivne hüpotees aga statistiliselt oluliste erinevuste olemasolu.

    3. Millal saab paaris Studenti t-testi kasutada?

    Peamine tingimus on proovide sõltuvus, see tähendab, et võrreldavad väärtused tuleks saada ühe parameetri korduva mõõtmisega samadel patsientidel.

    Nagu ka sõltumatute valimite võrdlemisel, on paaris-t-testi rakendamiseks vajalik, et algandmetel oleks normaaljaotus. Kui see tingimus ei ole täidetud, kasutatakse mitteparameetrilisi statistikameetodeid, nt G-testi märgid või Wilcoxoni t-test.

    Paaritud t-testi saab kasutada ainult kahe valimi võrdlemisel. Kui soovite võrrelda kolme või enamat korduvat mõõtmist, peaksite kasutama ühesuunaline dispersioonanalüüs (ANOVA) korduvate mõõtmiste jaoks.

    4. Kuidas arvutada paaris Studenti t-testi?

    Paaritud Studenti t-test arvutatakse järgmise valemi abil:

    kus M d- enne ja pärast mõõdetud näitajate erinevuste aritmeetiline keskmine, σd- näitajate erinevuste standardhälve, n- õppeainete arv.

    5. Kuidas tõlgendada Studenti t-testi väärtust?

    Paaritud Studenti t-testi saadud väärtuse tõlgendus ei erine mitteseotud populatsioonide t-testi hindamisest. Kõigepealt on vaja leida vabadusastmete arv f järgmise valemi järgi:

    F = n - 1

    Pärast seda määrame vajaliku olulisuse taseme jaoks Studenti t-testi kriitilise väärtuse (näiteks p<0,05) и при данном числе степеней свободы f vastavalt tabelile (vt allpool).

    Võrdleme kriteeriumi kriitilisi ja arvutatud väärtusi:

    • Kui paaris Studenti t-testi arvutatud väärtus on võrdne tabelist leitud kriitilise väärtusega või sellest suurem, järeldame, et erinevused võrreldavate väärtuste vahel on statistiliselt olulised.
    • Kui arvutatud paaris Studenti t-testi väärtus on väiksem kui tabeli väärtus, siis ei ole erinevused võrreldavate väärtuste vahel statistiliselt olulised.

    6. Studenti t-testi arvutamise näide

    Uue hüpoglükeemilise aine efektiivsuse hindamiseks mõõdeti suhkurtõvega patsientidel enne ja pärast ravimi võtmist vere glükoosisisaldust. Selle tulemusena saadi järgmised andmed:

    Lahendus:

    1. Arvutage iga väärtuste paari erinevus (d):

    Patsient N Vere glükoosisisaldus, mmol/l Väärtuste erinevus (d)
    enne ravimi võtmist pärast ravimi võtmist
    1 9.6 5.7 3.9
    2 8.1 5.4 2.7
    3 8.8 6.4 2.4
    4 7.9 5.5 2.4
    5 9.2 5.3 3.9
    6 8.0 5.2 2.8
    7 8.4 5.1 3.3
    8 10.1 6.9 3.2
    9 7.8 7.5 2.3
    10 8.1 5.0 3.1

    2. Leidke valemi abil erinevuste aritmeetiline keskmine:

    3. Leidke erinevuste standardhälve keskmisest valemiga:

    4. Arvutage paaris Studenti t-test:

    5. Võrdleme Studenti t-testi 8.6 saadud väärtust tabeli väärtusega, mis vabadusastmete arvuga f 10 - 1 = 9 ja olulisuse tasemega p=0,05 on 2,262. Kuna saadud väärtus on kriitilisest suurem, järeldame, et enne ja pärast uue ravimi võtmist on vere glükoositasemetes statistiliselt olulisi erinevusi.

    Kuva Studenti t-testi kriitiliste väärtuste tabel

    MANN-WHITNEY U-KRITEERIUM

    Mann-Whitney U-test on mitteparameetriline statistiline test, mida kasutatakse kahe sõltumatu valimi võrdlemiseks mis tahes tunnuse taseme osas, mõõdetuna kvantitatiivselt. Meetod põhineb määramisel, kas kahe variatsioonirea (esimeses proovis parameetrite väärtuste vahemiku seeria ja teises proovis sama) ristumisväärtuste tsoon on piisavalt väike. Mida väiksem on kriteeriumi väärtus, seda tõenäolisem on, et proovide parameetrite väärtuste erinevused on olulised.

    1. U-testi väljatöötamise ajalugu

    Selle proovidevaheliste erinevuste tuvastamise meetodi pakkus 1945. aastal välja Ameerika keemik ja statistik. Frank Wilcoxon.
    1947. aastal vaatasid matemaatikud seda oluliselt läbi ja laiendasid H.B. Mann(H.B. Mann) ja DR. Whitney(D.R. Whitney), kelle nimedega seda tänapäeval tavaliselt kutsutakse.

    2. Milleks kasutatakse Mann-Whitney U-testi?

    Mann-Whitney U-testi kasutatakse kahe sõltumatu valimi erinevuste hindamiseks mis tahes kvantitatiivse tunnuse taseme osas.

    3. Millal saab Mann-Whitney U testi kasutada?

    Mann-Whitney U-test on mitteparameetriline test, seega erinevalt Üliõpilase t-test

    U-test sobib väikeste valimite võrdlemiseks: iga proov peab sisaldama vähemalt 3 tunnuse väärtust. Lubatud on, et ühes valimis on 2 väärtust, kuid teises peab siis olema vähemalt viis.

    Mann-Whitney U-testi rakendamise tingimus on kattuvate atribuutide väärtuste puudumine võrreldavates rühmades (kõik numbrid on erinevad) või väga väike arv selliseid vasteid.

    Mann-Whitney U-testi analoog kolme või enama rühma võrdlemiseks on Kruskal-Wallise test.

    4. Kuidas arvutada Mann-Whitney U-testi?

    Esiteks, mõlemast võrreldavast proovist üks järjestatud rida, korraldades vaatlusühikud vastavalt tunnuse suurenemise astmele ja omistades madalamale järgule madalama väärtuse. Mitme üksuse võrdsete atribuutide väärtuste korral määratakse igaühele neist järjestikuste järguväärtuste aritmeetiline keskmine.

    Näiteks kahel üksusel, mis hõivavad ühel järjestatud real 2. ja 3. koha (reas), on samad väärtused. Seetõttu määratakse igaühele neist auaste, mis on võrdne (3 + 2) / 2 = 2,5.

    Koostatud üksikute paremusjärjestuse seerias võrdub auastmete koguarv:

    N = n 1 + n 2

    kus n 1 on elementide arv esimeses valimis ja n 2 on elementide arv teises valimis.

    Järgmisena jagame üksiku järjestatud seeria uuesti kaheks, mis koosnevad vastavalt esimese ja teise valimi ühikutest, jättes samal ajal meelde iga üksuse järjestuste väärtused. Arvutame eraldi nende ridade summa, mis langesid esimese valimi elementide osakaalule, ja eraldi - teise valimi elementide osakaalule. Määrake kahest järgusummast (T x) suurem, mis vastab n x elemendiga valimile.

    Lõpuks leiame Mann-Whitney U-testi väärtuse valemi abil:

    5. Kuidas tõlgendada Mann-Whitney U-testi väärtust?

    Saadud U-kriteeriumi väärtust võrreldakse vastavalt tabelile valitud statistilise olulisuse taseme jaoks (p=0,05 või p=0,01) U kriitilise väärtusega antud arvu võrreldavate proovide puhul:

    • Kui saadud väärtus U vähem tabelikujuline või võrdub talle, siis tuvastatakse vaadeldavate valimite tunnuse tasemete erinevuste statistiline olulisus (aksepteeritakse alternatiivset hüpoteesi). Erinevuste olulisus on seda suurem, mida väiksem on U väärtus.
    • Kui saadud väärtus U rohkem tabelina, aktsepteeritakse nullhüpoteesi.
    Näidake Mann-Whitney U-testi kriitiliste väärtuste tabelit p=0,05 juures

    WILCOXONI KRITEERIUM

    Wilcoxoni test lingitud proovide jaoks (tuntud ka kui Wilcoxoni T-test, Wilcoxoni test, Wilcoxoni märgistatud järgu test, Wilcoxoni auastme summa test) on mitteparameetriline statistiline test, mida kasutatakse kahe seotud (paaritud) proovi võrdlemiseks mis tahes kvantitatiivse tunnuse taseme järgi. mõõdetakse pideval või järguskaalal.

    Meetodi olemus seisneb selles, et võrreldakse ühes või teises suunas nihete raskuse absoluutväärtusi. Selleks järjestatakse kõigepealt kõik vahetuste absoluutväärtused ja seejärel summeeritakse järjestused. Kui nihked ühes või teises suunas juhtuvad juhuslikult, on nende ridade summad ligikaudu võrdsed. Kui nihke intensiivsus ühes suunas on suurem, on vastassuunaliste nihkete absoluutväärtuste järjekohtade summa oluliselt väiksem, kui see võiks olla juhuslike muutuste korral.

    1. Lingitud proovide Wilcoxoni testi väljatöötamise ajalugu

    Testi pakkus esmakordselt välja 1945. aastal Ameerika statistik ja keemik Frank Wilcoxon (1892–1965). Samas teadustöös kirjeldas autor veel üht kriteeriumi, mida kasutatakse sõltumatute valimite võrdlemise puhul.

    2. Milleks Wilcoxoni testi kasutatakse?

    Wilcoxoni t-testi kasutatakse, et hinnata erinevusi kahe mõõtmiskomplekti vahel, mis on tehtud sama katsealuste populatsiooniga, kuid erinevates tingimustes või erinevatel aegadel. See test suudab paljastada muutuste suuna ja raskusastme – see tähendab, kas näitajad on ühes suunas rohkem nihkunud kui teises.

    Klassikaline näide olukorrast, kus saab rakendada Wilcoxoni T-testi seotud populatsioonide jaoks, on enne-pärast uuring, kus võrreldakse ravieelseid ja -järgseid skoori. Näiteks antihüpertensiivse aine efektiivsuse uurimisel võrreldakse vererõhku enne ravimi võtmist ja pärast selle võtmist.

    3. Wilcoxoni T-testi kasutamise tingimused ja piirangud

    1. Wilcoxoni test on mitteparameetriline test, seega erinevalt paaris Studenti t-test, ei nõua võrreldavate populatsioonide normaalse jaotuse olemasolu.
    2. Wilcoxoni T-testi kasutamisel peab katsealuste arv olema vähemalt 5.
    3. Uuritavat tunnust saab mõõta nii kvantitatiivses pidevas (vererõhk, pulss, leukotsüütide arv 1 ml veres) kui ka järguskaalas (punktide arv, haiguse raskusaste, mikroorganismidega saastumise aste).
    4. Seda kriteeriumi kasutatakse ainult kahe mõõtmiste seeria võrdlemisel. Wilcoxoni T-testi analoog kolme või enama seotud populatsiooni võrdlemiseks on Friedmani kriteerium.

    4. Kuidas arvutada Wilcoxoni T-testi seotud proovide jaoks?

    1. Arvutage iga subjekti paarismõõtmiste väärtuste erinevus. Null nihkeid edasi ei arvestata.
    2. Määrake, millised erinevustest on tüüpilised, st vastavad sageduses valitseva indikaatori muutumise suunale.
    3. Järjesta paaride erinevused nende absoluutväärtuste järgi (st ilma märki arvestamata) kasvavas järjekorras. Erinevuse madalamale absoluutväärtusele omistatakse madalam aste.
    4. Arvutage ebatüüpilistele nihketele vastavate auastmete summa.

    Seega arvutatakse Wilcoxoni T-test seotud proovide jaoks järgmise valemiga:

    kus ΣRr on näitajate ebatüüpiliste muutuste astmete summa.

    5. Kuidas tõlgendada Wilcoxoni testi väärtust?

    Saadud Wilcoxoni T-testi väärtust võrreldakse kriitilise väärtusega vastavalt tabelile valitud statistilise olulisuse taseme jaoks ( p = 0,05 või p = 0,01) teatud arvu võrreldavate proovide n puhul:

    • Kui arvutatud (empiiriline) väärtus Temp. vähem kui tabeli T kr. või sellega võrdne, siis tunnustatakse indikaatori tüüpilise suuna muutuste statistilist olulisust (aksepteeritakse alternatiivset hüpoteesi). Erinevuste olulisus on seda suurem, mida väiksem on T väärtus.
    • Kui Temp. rohkem T kr. , aktsepteeritakse nullhüpoteesi indikaatori muutuste statistilise olulisuse puudumise kohta.

    Näide Wilcoxoni testi arvutamisest seotud proovide jaoks

    Farmaatsiafirma viib läbi uuringuid mittesteroidsete põletikuvastaste ravimite rühma kuuluva uue ravimi kohta. Selleks valiti välja 10 vabatahtlikust koosnev rühm, kes kannatasid ägedate hingamisteede viirusnakkuste ja hüpertermia all. Nende kehatemperatuuri mõõdeti enne ja 30 minutit pärast uue ravimi võtmist. On vaja teha järeldus kehatemperatuuri languse olulisuse kohta ravimi võtmise tagajärjel.

    1. Algandmed on esitatud järgmise tabeli kujul:
    2. Wilcoxoni T-testi arvutamiseks arvutame paarisnäitajate erinevused ja järjestame nende absoluutväärtused. Samal ajal tõstetakse ebatüüpilised auastmed punasega esile:
      N Perekonnanimi t keha enne ravimi võtmist t keha pärast ravimi võtmist Näitajate erinevus, d |d| Koht
      1. Ivanov 39.0 37.6 -1.4 1.4 7
      2. Petrov 39.5 38.7 -0.8 0.8 5
      3. Sidorov 38.6 38.7 0.1 0.1 1.5
      4. Popov 39.1 38.5 -0.6 0.6 4
      5. Nikolajev 40.1 38.6 -1.5 1.5 8
      6. Kozlov 39.3 37.5 -1.8 1.8 9
      7. Ignatjev 38.9 38.8 -0.1 0.1 1.5
      8. Semenov 39.2 38.0 -1.2 1.2 6
      9. Egorov 39.8 39.8 0
      10. Aleksejev 38.8 39.3 0.5 0.5 3
      Nagu näeme tüüpiline nihe indikaator on selle langus, seda märgiti 7 juhul 10-st. Ühel juhul (patsiendil Egorovil) temperatuur pärast ravimi võtmist ei muutunud ja seetõttu seda juhtumit edasises analüüsis ei kasutatud. Kahel juhul (Sidorovi ja Aleksejevi patsientidel) ebatüüpiline nihe temperatuur ülespoole. Ebatüüpilisele nihkele vastavad auastmed on 1,5 ja 3.
    3. Arvutame Wilcoxoni T-testi, mis võrdub indikaatori ebatüüpilisele nihkele vastavate ridade summaga:

      T = ΣRr = 3 + 1,5 = 4,5

    4. Võrdle Temp. koos T kr. , mis olulisuse tasemel p=0,05 ja n=9 võrdub 8-ga. Seetõttu T emp.
    5. Järeldame, et ARVI-ga patsientide kehatemperatuuri langus uue ravimi võtmise tagajärjel on statistiliselt oluline (p<0.05).
    Kuva Wilcoxoni T-testi kriitiliste väärtuste tabel

    PEARSONI KHI-RUUT test

    Pearsoni χ2 test on mitteparameetriline meetod, mis võimaldab hinnata igasse kategooriasse kuuluvate valimi tegeliku (uuringu tulemusena selgunud) tulemuste arvu või kvalitatiivsete omaduste ja teoreetilise arvu erinevuste olulisust. võib eeldada uuritud rühmades, kui nullhüpotees on tõene. Lihtsamalt öeldes võimaldab meetod hinnata kahe või enama suhtelise näitaja (sagedused, osakaalud) erinevuste statistilist olulisust.

    1. χ 2 kriteeriumi kujunemise ajalugu

    Hii-ruuttesti situatsioonitabelite analüüsimiseks töötas välja ja pakkus välja 1900. aastal inglise matemaatik, statistik, bioloog ja filosoof, matemaatilise statistika rajaja ja üks biomeetria rajajatest. Karl Pearson(1857-1936).

    2. Milleks kasutatakse Pearsoni χ 2 kriteeriumi?

    Analüüsis saab rakendada hii-ruut testi situatsioonitabelid mis sisaldab teavet tulemuste sageduse kohta sõltuvalt riskiteguri olemasolust. Näiteks näeb neljaväljaline situatsioonitabel välja selline:

    Exodus on (1) Väljapääsu pole (0) Kokku
    On olemas riskitegur (1) A B A+B
    Riskifaktor puudub (0) C D C+D
    Kokku A+C B+D A+B+C+D

    Kuidas sellist situatsioonitabelit täita? Vaatleme väikest näidet.

    Käimas on uuring suitsetamise mõju kohta arteriaalse hüpertensiooni tekkeriskile. Selleks valiti välja kaks katsealuste gruppi – esimesse kuulus 70 inimest, kes suitsetavad päevas vähemalt 1 paki sigarette, teises – 80 samavanust mittesuitsetajat. Esimeses rühmas oli kõrge vererõhk 40 inimesel. Teises - arteriaalset hüpertensiooni täheldati 32 inimesel. Seega oli normaalne vererõhk suitsetajate rühmas 30 inimesel (70–40 = 30) ja mittesuitsetajate rühmas 48 (80–32 = 48).

    Täidame neljaväljalise situatsioonitabeli algandmetega:

    Saadud situatsioonitabelis vastab iga rida kindlale subjektide rühmale. Veerud – näitavad arteriaalse hüpertensiooniga või normaalse vererõhuga inimeste arvu.

    Uurija väljakutseks on: kas suitsetajate ja mittesuitsetajate seas on vererõhuhaigete esinemissageduses statistiliselt olulisi erinevusi? Sellele küsimusele saate vastata, kui arvutate Pearsoni hii-ruut testi ja võrdlete saadud väärtust kriitilise väärtusega.

    1. Võrreldavaid näitajaid tuleks mõõta nominaalsel skaalal (näiteks patsiendi sugu - mees või naine) või järguskaalal (näiteks arteriaalse hüpertensiooni aste, mis võtab väärtusi 0 kuni 3).
    2. See meetod võimaldab analüüsida mitte ainult neljaväljalisi tabeleid, kui nii tegur kui ka tulemus on binaarsed muutujad, see tähendab, et neil on ainult kaks võimalikku väärtust (näiteks mees või naine, teatud haiguse olemasolu või puudumine ajaloos ...). Pearsoni hii-ruut testi saab kasutada ka mitme väljaga tabelite analüüsi puhul, kui tegur ja (või) tulemus võtavad kolm või enam väärtust.
    3. Sobitatud rühmad peaksid olema sõltumatud, st hii-ruudu testi ei tohiks kasutada enne-pärast vaatluste võrdlemisel. McNemari test(kahe seotud populatsiooni võrdlemisel) või arvutatud Q-test Cochran(kolme või enama rühma võrdlemisel).
    4. Neljavälja tabelite analüüsimisel eeldatavad väärtused igas lahtris peab olema vähemalt 10. Juhul, kui vähemalt ühes lahtris on oodatava nähtuse väärtus vahemikus 5 kuni 9, tuleb arvutada hii-ruut test Yatesi parandusega. Kui vähemalt ühes lahtris on oodatav nähtus alla 5, tuleks analüüsi kasutada Fisheri täpne test.
    5. Mitmeväljaga tabelite analüüsi korral ei tohiks oodatav vaatluste arv olla väiksem kui 5 rohkem kui 20% lahtritest.

    4. Kuidas arvutada Pearsoni hii-ruut testi?

    Hii-ruuttesti arvutamiseks peate:

    See algoritm on rakendatav nii nelja- kui ka mitmeväljaliste tabelite jaoks.

    5. Kuidas tõlgendada Pearsoni hii-ruut testi väärtust?

    Juhul, kui kriteeriumi χ 2 saadud väärtus on suurem kui kriitiline, järeldame, et uuritud riskiteguri ja tulemuse vahel on statistiline seos sobival olulisuse tasemel.

    6. Pearsoni hii-ruuttesti arvutamise näide

    Teeme kindlaks suitsetamisteguri mõju statistilise olulisuse arteriaalse hüpertensiooni esinemissagedusele ülaltoodud tabeli järgi:

    1. Arvutame iga lahtri eeldatavad väärtused:
    2. Leia Pearsoni hii-ruuttesti väärtus:

      χ 2 \u003d (40-33,6) 2 / 33,6 + (30-36,4) 2 / 36,4 + (32-38,4) 2 / 38,4 + (48-41,6) 2 / 41,6 \u003d 4,396.

    3. Vabadusastmete arv f = (2-1)*(2-1) = 1. Tabelist leiame Pearsoni hii-ruuttesti kriitilise väärtuse, mis olulisuse tasemel p=0,05 ja vabadusastmete arv 1, on 3,841.
    4. Võrdleme saadud hii-ruut testi väärtust kriitilisega: 4,396 > 3,841, seega on arteriaalse hüpertensiooni esinemissageduse sõltuvus suitsetamise esinemisest statistiliselt oluline. Selle seose olulisuse tase vastab p<0.05.
    Kuva Pearsoni hii-ruuttesti kriitiliste väärtuste tabel

    FISHERI TÄPNE KRITEERIUM

    Fisheri täpne test on test, mida kasutatakse kahe suhtelise näitaja võrdlemiseks, mis iseloomustavad konkreetse tunnuse sagedust, millel on kaks väärtust. Algandmed Fisheri täpse testi arvutamiseks on tavaliselt koondatud neljaväljalise tabeli kujul.

    1. Kriteeriumi kujunemise ajalugu

    Kriteerium pakuti esmalt välja Ronald Fisher oma raamatus Design of Experiments. See juhtus 1935. aastal. Fisher ise väitis, et selle idee ajendas Muriel Bristol. 1920. aastate alguses olid Ronald, Muriel ja William Roach Inglismaal eksperimentaalses põllumajandusjaamas. Muriel väitis, et suudab kindlaks teha, millises järjekorras tee ja piim tema tassi valati. Sel ajal ei olnud võimalik tema väite õigsust kontrollida.

    Sellest sündis Fisheri idee "nullhüpoteesist". Eesmärk ei olnud üritada tõestada, et Muriel suudab eristada erinevalt valmistatud teetasse. Otsustati ümber lükata hüpotees, et naine teeb valiku juhuslikult. Tehti kindlaks, et nullhüpoteesi ei saa tõestada ega põhjendada. Kuid seda saab katsete käigus ümber lükata.

    Valmistati 8 tassi. Esimeses neljas valatakse kõigepealt piim, ülejäänud neljas - tee. Tassid olid sassis. Bristol kutsuti teed maitsma ja tasse vastavalt tee valmistamise meetodile jagama. Tulemuseks oleks pidanud olema kaks rühma. Ajalugu ütleb, et katse oli edukas.

    Tänu Fisheri testile on tõenäosus, et Bristol tegutseb intuitiivselt, vähenenud 0,01428-ni. See tähendab, et tassi oli võimalik õigesti määrata ühel juhul 70-st. Kuid siiski ei saa kuidagi nullini vähendada tõenäosust, mille Madame juhuslikult määrab. Isegi kui tõstate tasside arvu.

    See lugu andis tõuke "nullhüpoteesi" väljatöötamisele. Samal ajal pakuti välja Fisheri täpne test, mille põhiolemus on kõigi võimalike sõltuvate ja sõltumatute muutujate kombinatsioonide loetlemine.

    2. Milleks Fisheri täpset testi kasutatakse?

    Fisheri täpset testi kasutatakse peamiselt väikeste valimite võrdlemiseks. Sellel on kaks olulist põhjust. Esiteks on kriteeriumi arvutamine üsna tülikas ja võib võtta palju aega või nõuda võimsaid arvutusressursse. Teiseks on kriteerium üsna täpne (mis kajastub isegi nimetuses), mis võimaldab seda kasutada vähese vaatluste arvuga uuringutes.

    Eriline koht on Fisheri täpsele kriteeriumile meditsiinis. See on oluline meditsiiniliste andmete töötlemise meetod, mis on leidnud rakendust paljudes teaduslikes uuringutes. Tänu sellele on võimalik uurida teatud tegurite ja tulemuste seost, võrrelda patoloogiliste seisundite esinemissagedust kahe uuritava rühma vahel jne.

    3. Millistel juhtudel saab Fisheri täpset testi kasutada?

    1. Võrreldavaid muutujaid tuleks mõõta nominaalskaalal ja neil on ainult kaks väärtust, näiteks vererõhk on normaalne või kõrgenenud, tulemus on soodne või ebasoodne, kas on operatsioonijärgseid tüsistusi või mitte.
    2. Fisheri täpne test on loodud kahe sõltumatu rühma võrdlemiseks, mis on jagatud teguriga. Vastavalt sellele peab ka teguril olema ainult kaks võimalikku väärtust.
    3. Test sobib väga väikeste proovide võrdlemiseks: Fisheri täpse testiga saab analüüsida nelja täielikku tabelit juhul, kui oodatavate nähtuste väärtused on alla 5, mis on rakenduse piirang. Pearsoni hii-ruut test, isegi Yatesi parandusega.
    4. Fisheri täpne test võib olla ühe- või kahepoolne. Ühepoolse variandi puhul on täpselt teada, kuhu üks näitajatest kõrvale kaldub. Näiteks võrreldakse uuringus, kui palju patsiente paranes võrreldes kontrollrühmaga. Eeldatakse, et ravi ei saa halvendada patsientide seisundit, vaid ainult ravib või mitte.
      Kahesuunaline test hindab sageduse erinevusi kahel viisil. See tähendab, et katserühmas hinnatakse nii suurema kui ka väiksema nähtuse esinemissageduse tõenäosust võrreldes kontrollrühmaga.

    Fisheri täpse testi analoog on Pearsoni hii-ruut test, samas kui Fisheri täpsel testil on suurem võimsus, eriti väikeste valimite võrdlemisel, ja seetõttu on sellel antud juhul eelis.

    4. Kuidas arvutada Fisheri täpset testi?

    Näiteks uurime kaasasündinud väärarengutega (CMD) laste sünnisageduse sõltuvust ema suitsetamisest raseduse ajal. Selleks valiti välja kaks rasedate gruppi, millest üks on eksperimentaalne, mis koosneb 80 raseduse esimesel trimestril suitsetanud naisest ja teine ​​on võrdlusgrupp, kuhu kuulub 90 terve raseduse vältel tervislikke eluviise järgivat naist. Loote CM-i juhtude arv katserühmas oli 10, võrdlusrühmas - 2.

    Esiteks koostame neljaväljalise situatsioonitabeli:

    Fisheri täpne test arvutatakse järgmise valemi abil:

    kus N on katsealuste koguarv kahes rühmas; ! - faktoriaal, mis on arvu ja arvujada korrutis, millest igaüks on eelmisest 1 võrra väiksem (näiteks 4! = 4 3 2 1)

    Arvutuste tulemusena leiame, et P = 0,0137.

    5. Kuidas tõlgendada Fisheri täpse testi väärtust?

    Meetodi eeliseks on saadud kriteeriumi vastavus olulisuse taseme p täpsele väärtusele. See tähendab, et meie näites saadud väärtus 0,0137 on võrreldavate rühmade vaheliste erinevuste olulisuse tase loote CM-i esinemissageduse osas. Seda arvu tuleb võrrelda ainult kriitilise olulisuse tasemega, mida meditsiinilistes uuringutes tavaliselt võetakse kui 0,05.

    • Kui Fisheri eksakttesti väärtus on suurem kui kriitiline, aktsepteeritakse nullhüpoteesi ja tehakse järeldus, et tulemuste sageduses ei ole statistiliselt olulisi erinevusi sõltuvalt riskiteguri olemasolust.
    • Kui Fisheri eksakttesti väärtus on kriitilisest väiksem, aktsepteeritakse alternatiivset hüpoteesi ja tehakse järeldus statistiliselt oluliste erinevuste esinemise kohta tulemuste sageduses sõltuvalt riskiteguri mõjust.

    Meie näites P< 0,05, в связи с чем делаем вывод о наличии прямой взаимосвязи курения и вероятности развития ВПР плода. Частота возникновения врожденной патологии у детей курящих женщин статистически значимо выше, чем у некурящих.


    Koefitsientide suhe

    Koefitsientide suhe on statistiline näitaja (vene keeles lühendatakse selle nime tavaliselt kui OSH ja inglise keeles - VÕI sõnast "odds ratio"), üks peamisi viise, kuidas kirjeldada numbriliselt, kui palju teatud tulemuse puudumine või olemasolu. on seotud teatud teguri olemasolu või puudumisega konkreetses statistilises rühmas.

    1. Koefitsientide suhte indikaatori kujunemise ajalugu

    Mõiste "juhus" tuli hasartmängude teooriast, kus selle kontseptsiooni abil tähistati võidupositsioonide ja kaotavate positsioonide suhet. Meditsiiniteaduslikus kirjanduses mainiti tõenäosussuhte näitajat esmakordselt 1951. aastal J. Kornfieldi töös. Seejärel avaldas see teadlane artikleid, milles märgiti vajadust arvutada tõenäosussuhte 95% usaldusvahemik. (Cornfield, J. Kliiniliste andmete võrdlusmäärade hindamise meetod. Kopsu-, rinna- ja emakakaelavähi rakendused // National Cancer Institute, 1951. - N.11. - P.1269–1275.)

    2. Milleks kasutatakse koefitsientide suhet?

    Koefitsientide suhe võimaldab hinnata seost teatud tulemuse ja riskiteguri vahel.

    Koefitsientide suhe võimaldab võrrelda katsealuste rühmi konkreetse riskiteguri tuvastamise sageduse järgi. On oluline, et koefitsientide suhte rakendamise tulemus ei oleks ainult teguri ja tulemuse vahelise seose statistilise olulisuse määramine, vaid ka selle kvantitatiivne hinnang.

    3. Koefitsientide suhte rakendamise tingimused ja piirangud

    1. Toimivus- ja tegurinäitajaid tuleks mõõta nominaalsel skaalal. Näiteks on resultanttunnuseks loote kaasasündinud väärarengu olemasolu või puudumine, uuritavaks teguriks on ema suitsetamine (suitsetamine või mittesuitsetamine).
    2. See meetod võimaldab analüüsida ainult neljaväljaga tabeleid, kui nii tegur kui ka tulemus on binaarsed muutujad, see tähendab, et neil on ainult kaks võimalikku väärtust (näiteks sugu - mees või naine, arteriaalne hüpertensioon - olemasolu või puudumine , haiguse tulemus - paranemisega või ilma ...).
    3. Sobivad rühmad peaksid olema sõltumatud, see tähendab, et koefitsientide suhe ei sobi enne-pärast vaatluste võrdlemiseks.
    4. Koefitsientide suhte indikaatorit kasutatakse juhtumikontrolli uuringutes (näiteks esimene rühm on hüpertensiooniga patsiendid, teine ​​suhteliselt terved inimesed). Prospektiivsete uuringute jaoks, kui rühmad moodustatakse riskifaktori olemasolu või puudumise põhjal (näiteks esimene rühm - suitsetajad, teine ​​rühm - mittesuitsetajad), saab arvutada ka suhteline risk.

    4. Kuidas arvutada koefitsient?

    Koefitsientide suhe on selle murdosa väärtus, mille lugejas on esimese rühma teatud sündmuse tõenäosus ja nimetajas on sama sündmuse tõenäosus teise rühma jaoks.

    juhus on teatud tunnust (tulemust või tegurit) omavate uuritavate arvu ja seda tunnust mitteomavate subjektide arvu suhe.

    Näiteks valiti välja pankrease nekroosiga opereeritud patsientide rühm, mille arv oli 100 inimest. 5 aasta pärast jäi 80 neist ellu. Seega oli ellujäämisvõimalus 80 kuni 20 ehk 4.

    Mugav viis on arvutada koefitsientide suhe andmetega, mis on kokku võetud 2x2 tabelis:

    Exodus on (1) Väljapääsu pole (0) Kokku
    On olemas riskitegur (1) A B A+B
    Riskifaktor puudub (0) C D C+D
    Kokku A+C B+D A+B+C+D

    Selle tabeli puhul arvutatakse koefitsientide suhe järgmise valemi abil:

    Väga oluline on hinnata tulemuse ja riskiteguri vahelise tuvastatud seose statistilist olulisust. See on tingitud asjaolust, et isegi ühele lähedase tõenäosuse suhte madalate väärtuste korral võib seos siiski olla oluline ja seda tuleks statistilistes järeldustes arvesse võtta. Vastupidi, suurte VÕI väärtuste korral osutub näitaja statistiliselt ebaoluliseks ja seetõttu võib ilmnenud seose tähelepanuta jätta.

    Koefitsientide suhte olulisuse hindamiseks arvutatakse 95% usaldusvahemiku piirid (kasutatakse ingliskeelse "usaldusvahemiku" lühendit 95% CI või 95% CI). Valem 95% CI ülemise piiri väärtuse leidmiseks:

    Valem 95% CI alampiiri väärtuse leidmiseks:

    5. Kuidas tõlgendada koefitsiendi väärtust?

    • Kui koefitsientide suhe on suurem kui 1, tähendab see, et riskiteguri leidmise tõenäosus on tulemusega rühmas suurem. Need. teguril on otsene seos tulemuse tõenäosusega.
    • Koefitsientide suhe alla 1 näitab, et riskiteguri leidmise tõenäosus on teises rühmas suurem. Need. teguril on pöördvõrdeline seos tulemuse tõenäosusega.
    • Kui koefitsient on võrdne ühega, on riskiteguri leidmise tõenäosus võrreldavates rühmades sama. Seega ei mõjuta tegur tulemuse tõenäosust.

    Lisaks hinnatakse igal juhul koefitsientide suhte statistilist olulisust 95% usaldusvahemiku väärtuste põhjal.

    • Kui usaldusvahemik ei sisalda 1, s.t. mõlemad piirväärtused on kas üle või alla 1, tehakse järeldus teguri ja tulemuse vahelise tuvastatud seose statistilise olulisuse kohta olulisuse tasemel p<0,05.
    • Kui usaldusvahemik sisaldab 1, s.t. selle ülemine piir on suurem kui 1 ja alumine piir on väiksem kui 1, järeldatakse, et olulisuse tasemel p>0,05 ei ole teguri ja tulemuse vahelise seose statistilist olulisust.
    • Usaldusvahemiku väärtus on pöördvõrdeline teguri ja tulemuse vahelise seose olulisuse tasemega, s.t. mida väiksem on 95% CI, seda olulisem on tuvastatud seos.

    6. Näide koefitsientide suhte indikaatori arvutamisest

    Kujutage ette kahte rühma: esimene koosnes 200 naisest, kellel diagnoositi loote kaasasündinud väärareng (Outcome+). Neist raseduse ajal suitsetatud (Factor+) - 50 inimest (AGA), olid mittesuitsetajad (Factor-) - 150 inimest (FROM).

    Teise rühma kuulus 100 loote väärarengute tunnusteta naist (Tulemus -), kellest 10 inimest suitsetas raseduse ajal (tegur +) (B), ei suitsetanud (Factor-) - 90 inimest (D).

    1. Koostage neljaväljaline situatsioonitabel:

    2. Arvutage koefitsiendi väärtus:

    VÕI = (A * D) / (B * C) = (50 * 90) / (150 * 10) = 3.

    3. Leidke 95% CI piirid. Eeltoodud valemi järgi arvutatud alampiiri väärtus oli 1,45 ja ülemine piir 6,21.

    Seega näitas uuring, et loote CM-i diagnoosiga patsientide seas on tõenäosus kohtuda suitsetava naisega 3 korda suurem kui loote CM-i tunnusteta naistel. Täheldatud sõltuvus on statistiliselt oluline, kuna 95% CI-st ei sisalda 1, selle alumise ja ülemise piiri väärtused on suuremad kui 1.


    SUHTELINE RISK

    Risk on konkreetse tulemuse, näiteks haiguse või vigastuse, tõenäosus. Risk võib ulatuda 0-st (tulemuse tõenäosus puudub) kuni 1-ni (ebasoodsat tulemust on oodata kõigil juhtudel). Meditsiinistatistikas uuritakse reeglina tulemuse riski muutusi sõltuvalt mõnest tegurist. Patsiendid jagatakse tinglikult 2 rühma, millest üks on mõjutatud faktorist, teine ​​mitte.

    Suhteline risk on tulemuste sageduse suhe uuritavatel isikutel, keda mõjutas uuritav tegur, tulemuste sagedusega isikute hulgas, keda see tegur ei mõjuta. Teaduskirjanduses kasutatakse sageli indikaatori lühendatud nimetust – RR või RR (inglise keelest "relative risk").

    1. Suhtelise riski näitaja kujunemise ajalugu

    Suhtelise riski arvutamine on meditsiinistatistikas laenatud majandusteadusest. Õige hindamine poliitiliste, majanduslike ja sotsiaalsete tegurite mõju kohta toote või teenuse nõudlusele võib viia eduni ning nende tegurite alahindamine võib viia rahaliste ebaõnnestumiste ja ettevõtte pankrotini.

    2. Milleks suhtelist riski kasutatakse?

    Suhtelist riski kasutatakse tulemuse tõenäosuse võrdlemiseks sõltuvalt riskiteguri olemasolust. Näiteks suitsetamise mõju hindamisel hüpertensiooni esinemissagedusele, rinnavähi esinemissageduse sõltuvuse uurimisel suukaudsetest kontratseptiividest jne. Suhteline risk on kõige olulisem näitaja teatud ravimeetodite määramisel või võimalike kõrvaltoimetega uuringute läbiviimisel.

    3. Suhtelise riski kasutamise tingimused ja piirangud

    1. Faktoreid ja tulemusi tuleks mõõta nominaalsel skaalal (nt patsiendi sugu, mees või naine, hüpertensioon või mitte).
    2. See meetod võimaldab analüüsida ainult neljaväljalisi tabeleid, kui nii tegur kui ka tulemus on muutujad, st neil on ainult kaks võimalikku väärtust (näiteks vanus alla 50 aasta või üle 50 aasta, konkreetse väärtuse olemasolu või puudumine haigus ajaloos).
    3. Suhtelist riski kasutatakse prospektiivsetes uuringutes, kui uuringurühmad moodustatakse riskifaktori olemasolu või puudumise alusel. Juhtumikontrolli uuringutes tuleks suhteline risk asendada indikaatoriga koefitsientide suhe.

    4. Kuidas arvutada suhtelist riski?

    Suhtelise riski arvutamiseks on vaja:

    5. Kuidas tõlgendada suhtelist riskiväärtust?

    Suhtelist riskiskoori võrreldakse 1-ga, et teha kindlaks teguri ja tulemuse vahelise seose olemus:

    • Kui RR on 1, võib järeldada, et uuritav tegur ei mõjuta tulemuse tõenäosust (teguri ja tulemuse vahel seos puudub).
    • Väärtuste puhul, mis on suuremad kui 1, järeldatakse, et tegur suurendab tulemuste sagedust (otsene seos).
    • Väärtuste korral alla 1 - umbes tulemuse tõenäosuse vähenemine teguri mõjul (tagasiside).

    Samuti hinnatakse tingimata 95% usaldusvahemiku piiride väärtusi. Kui mõlemad väärtused - nii alumine kui ka ülemine piir - on ühel pool 1 või teisisõnu, usaldusvahemik ei sisalda 1, siis tehakse järeldus tuvastatud seose statistilise olulisuse kohta. tegur ja tulemus vea tõenäosusega p<0,05.

    Kui 95% CI alumine piir on väiksem kui 1 ja ülempiir on suurem, siis järeldatakse, et teguri mõjul tulemusmäärale puudub statistiline olulisus, olenemata RR väärtusest (p> 0,05).

    6. Suhtelise riski näitaja arvutamise näide

    1999. aastal viidi Oklahomas läbi uuringud meeste maohaavandite esinemissageduse kohta. Mõjutavaks teguriks valiti regulaarne kiirtoidu tarbimine. Esimeses rühmas oli 500 pidevalt kiirtoitu söövat meest, kelle hulgas diagnoositi maohaavand 96 inimesel. Teise rühma kuulus 500 tervisliku toitumise pooldajat, kelle hulgas diagnoositi maohaavand 31 juhul. Saadud andmete põhjal koostati järgmine situatsioonitabel:


    PEARSONI KORRELATSIOONI KRITEERIUM

    Pearsoni korrelatsioonitest on parameetrilise statistika meetod, mis võimaldab määrata kahe kvantitatiivse näitaja vahelise lineaarse seose olemasolu või puudumist, samuti hinnata selle lähedust ja statistilist olulisust. Teisisõnu, Pearsoni korrelatsioonitest võimaldab teil määrata, kas üks näitaja muutub (tõuseb või väheneb) vastusena teise näitaja muutustele? Statistilistes arvutustes ja järeldustes tähistatakse korrelatsioonikordaja tavaliselt kui r xy või R xy .

    1. Korrelatsioonikriteeriumi kujunemise ajalugu

    Pearsoni korrelatsioonitesti töötas välja Briti teadlaste meeskond eesotsas Karl Pearson(1857-1936) 19. sajandi 90ndatel, et lihtsustada kahe juhusliku suuruse kovariatsiooni analüüsi. Lisaks Karl Pearsonile töötati ka Pearsoni korrelatsioonitestiga Francis Edgeworth ja Raphael Weldon.

    2. Milleks Pearsoni korrelatsioonitesti kasutatakse?

    Pearsoni korrelatsioonikriteerium võimaldab määrata, milline on korrelatsiooni lähedus (või tugevus) kahe kvantitatiivsel skaalal mõõdetava näitaja vahel. Täiendavate arvutuste abil saate ka kindlaks teha, kui statistiliselt oluline on tuvastatud seos.

    Näiteks Pearsoni korrelatsioonikriteeriumi abil saab vastata küsimusele, kas ägedate hingamisteede infektsioonide korral on seos kehatemperatuuri ja vere leukotsüütide sisalduse vahel, patsiendi pikkuse ja kehakaalu vahel, fluoriidisisalduse vahel. joogivees ja kaariese esinemissagedust elanikkonnas.

    3. Pearsoni hii-ruuttesti kasutamise tingimused ja piirangud

    1. Võrreldavaid näitajaid tuleks mõõta kvantitatiivsel skaalal (näiteks pulss, kehatemperatuur, leukotsüütide arv 1 ml vere kohta, süstoolne vererõhk).
    2. Pearsoni korrelatsioonikriteeriumi abil on võimalik määrata ainult suuruste vahelise lineaarse seose olemasolu ja tugevust. Muud seose omadused, sealhulgas suund (otsene või vastupidine), muutuste olemus (sirge või kõverjooneline), samuti ühe muutuja sõltuvus teisest, määratakse kindlaks kasutades regressioonianalüüs.
    3. Võrreldavate väärtuste arv peab olema võrdne kahega. Kolme või enama parameetri seose analüüsimisel tuleks kasutada meetodit faktoranalüüs.
    4. Pearsoni korrelatsioonitest on parameetriline ja seetõttu on selle rakendamise tingimuseks iga võrreldava muutuja normaaljaotus. Kui on vaja teha korrelatsioonianalüüsi näitajate puhul, mille jaotus erineb normaalsest, sh järguskaalal mõõdetavatest, tuleks kasutada Spearmani astme korrelatsioonikordaja.
    5. On vaja selgelt eristada mõisteid sõltuvus ja korrelatsioon. Väärtuste sõltuvus määrab nendevahelise korrelatsiooni olemasolu, kuid mitte vastupidi.

    Näiteks sõltub lapse kasv tema vanusest ehk mida vanem laps, seda pikem ta on. Kui võtta kaks erinevas vanuses last, siis suure tõenäosusega on vanema lapse kasv suurem kui noorema oma. Seda nähtust nimetatakse sõltuvuseks, mis tähendab põhjuslikku seost näitajate vahel. Loomulikult on nende vahel ka korrelatsioon, mis tähendab, et ühe näitaja muutustega kaasnevad muutused teises näitajas.

    Teises olukorras kaaluge seost lapse kasvu ja südame löögisageduse (HR) vahel. Nagu teate, sõltuvad need mõlemad väärtused otseselt vanusest, seetõttu on enamikul juhtudel suuremat kasvu (ja seega ka vanemas eas) lastel madalam pulsisagedus. See tähendab, et täheldatakse korrelatsiooni ja sellel võib olla üsna kõrge tihedus. Kui aga võtta ühevanused, kuid erineva pikkusega lapsed, siis suure tõenäosusega erineb nende pulss ebaoluliselt ja seetõttu võime järeldada, et pulss ei sõltu kasvust.

    See näide näitab, kui oluline on teha vahet statistikas fundamentaalsetel näitajate seose ja sõltuvuse mõistetel, et teha õigeid järeldusi.

    4. Kuidas arvutada Pearsoni korrelatsioonikordaja?

    Pearsoni korrelatsioonikordaja arvutatakse järgmise valemi abil:

    5. Kuidas tõlgendada Pearsoni korrelatsioonikordaja väärtust?

    Pearsoni korrelatsioonikordaja väärtusi tõlgendatakse selle absoluutväärtuste põhjal. Korrelatsioonikoefitsiendi võimalikud väärtused varieeruvad vahemikus 0 kuni ±1. Mida suurem on r xy absoluutväärtus, seda suurem on seos kahe suuruse vahel. r xy = 0 näitab täielikku ühenduse puudumist. r xy = 1 - näitab absoluutse (funktsionaalse) ühenduse olemasolu. Kui Pearsoni korrelatsioonikriteeriumi väärtus osutus suuremaks kui 1 või väiksemaks kui -1, tehti arvutustes viga.

    Korrelatsiooni tugevuse või tugevuse hindamiseks kasutatakse üldtunnustatud kriteeriume, mille kohaselt on r xy absoluutväärtused.< 0.3 свидетельствуют о nõrkühendus, r xy väärtused 0,3 kuni 0,7 - ühenduse kohta keskel tihedus, r xy väärtused> 0,7 - o tugevühendused.

    Korrelatsiooni tugevuse täpsema hinnangu saab Chaddocki tabeli abil:

    Korrelatsioonikordaja r xy statistilise olulisuse hindamine toimub t-testi abil, mis arvutatakse järgmise valemi abil:

    Saadud väärtust t r võrreldakse kriitilise väärtusega teatud olulisuse ja vabadusastmete arvu n-2 juures. Kui t r ületab t crit, siis tehakse järeldus tuvastatud korrelatsiooni statistilise olulisuse kohta.

    6. Pearsoni korrelatsioonikordaja arvutamise näide

    Uuringu eesmärk oli tuvastada, määrata kahe kvantitatiivse näitaja – testosterooni tase veres (X) ja keha lihasmassi protsent (Y) vahel – korrelatsiooni tihedus ja statistiline olulisus. 5 katsealusest koosneva valimi lähteandmed (n = 5) on kokku võetud tabelis:


    SPEERMANI KRITEERIUM

    Spearmani auaste korrelatsioonikordaja on mitteparameetriline meetod, mida kasutatakse nähtustevahelise seose statistiliseks uurimiseks. Sel juhul määratakse uuritud tunnuste kahe kvantitatiivse rea tegelik paralleelsusaste ja kvantitatiivselt väljendatud koefitsiendi abil antakse hinnang kindlaksmääratud seose tihedusele.

    1. Auastme korrelatsioonikordaja kujunemise ajalugu

    See kriteerium töötati välja ja pakuti korrelatsioonianalüüsiks 1904. aastal Charles Edward Spearman, inglise psühholoog, Londoni ja Chesterfieldi ülikoolide professor.

    2. Milleks kasutatakse Spearmani suhet?

    Spearmani järgu korrelatsioonikoefitsienti kasutatakse kahe võrreldava kvantitatiivse indikaatori seeria vahelise seose vahelise seose tuvastamiseks ja hindamiseks. Juhul, kui näitajate järjestused, mis on järjestatud tõusu või languse astme järgi, langevad enamikul juhtudel kokku (ühe näitaja kõrgem väärtus vastab teise näitaja kõrgemale väärtusele - näiteks patsiendi pikkuse ja tema kehakaalu võrdlemisel) , tehakse järeldus olemasolu kohta sirge korrelatsioon. Kui näitajate ridadel on vastupidine suund (ühe näitaja suurem väärtus vastab teise väiksemale väärtusele - näiteks vanuse ja pulsi võrdlemisel), siis räägitakse tagurpidi indikaatoritevahelised seosed.

      Spearmani korrelatsioonikoefitsiendil on järgmised omadused:
    1. Korrelatsioonikordaja võib võtta väärtused miinus ühest üheni ja rs = 1 korral on rangelt otsene seos ja rs = -1 korral rangelt pöördsuhe.
    2. Kui korrelatsioonikordaja on negatiivne, siis on pöördvõrdeline seos, kui see on positiivne, siis on otsene seos.
    3. Kui korrelatsioonikordaja on võrdne nulliga, siis seos suuruste vahel praktiliselt puudub.
    4. Mida lähemal on korrelatsioonikordaja moodul ühikule, seda tugevam on seos mõõdetud väärtuste vahel.

    3. Millistel juhtudel saab Spearmani koefitsienti kasutada?

    Kuna koefitsient on mitteparameetrilise analüüsi meetod, ei ole jaotuse normaalsuse kontrollimine vajalik.

    Võrreldavaid näitajaid saab mõõta nii pideval skaalal (näiteks erütrotsüütide arv 1 µl veres) kui ka järguskaalal (näiteks vastastikuse eksperdihinnangu hinded 1–5).

    Spearmani hinnangu efektiivsus ja kvaliteet vähenevad, kui mõne mõõdetud koguse erinevate väärtuste erinevus on piisavalt suur. Spearmani koefitsienti ei soovitata kasutada, kui mõõdetud koguse väärtuste jaotus on ebaühtlane.

    4. Kuidas arvutada Spearmani suhet?

    Spearmani astme korrelatsioonikordaja arvutamine hõlmab järgmisi samme:

    5. Kuidas tõlgendada Spearmani koefitsiendi väärtust?

    Auaste korrelatsioonikoefitsiendi kasutamisel hinnatakse märkide vahelise seose tihedust tinglikult, võttes arvesse koefitsiendi väärtusi alla 0,3 - seose nõrga läheduse märk; väärtused, mis on suuremad kui 0,3, kuid väiksemad kui 0,7, näitavad mõõdukat seoste lähedust ja väärtused 0,7 või rohkem on märk suurest seoste lähedusest.

    Samuti võib sideme läheduse hindamiseks kasutada Chaddocki skaala.

    Saadud koefitsiendi statistilist olulisust hinnatakse Studenti t-testi abil. Kui t-kriteeriumi arvutatud väärtus on etteantud arvu vabadusastmete puhul väiksem kui tabeliväärtus, puudub vaadeldava seose statistiline olulisus. Kui rohkem, siis peetakse korrelatsiooni statistiliselt oluliseks.


    KOLMOGOROV-SMIRNOVI MEETOD

    Kolmogorovi-Smirnovi test on klassikalises mõttes mitteparameetriline sobivuse test, mis on mõeldud lihtsate hüpoteeside kontrollimiseks analüüsitava valimi kohta, mis kuulub mõnele teadaolevale jaotusseadusele. Selle kriteeriumi kõige tuntum rakendus on uuritud populatsioonide normaaljaotuse testimine.

    1. Kolmogorovi-Smirnovi kriteeriumi kujunemislugu

    Kolmogorovi-Smirnovi kriteeriumi töötasid välja Nõukogude matemaatikud Andrei Nikolajevitš Kolmogorov ja Nikolai Vassiljevitš Smirnov.
    Kolmogorov A.N. (1903-1987) - Sotsialistliku töö kangelane, Moskva Riikliku Ülikooli professor, NSVL Teaduste Akadeemia akadeemik - 20. sajandi suurim matemaatik, üks kaasaegse tõenäosusteooria rajajaid.
    Smirnov N.V. (1900-1966) NSV Liidu Teaduste Akadeemia korrespondentliige, matemaatilise statistika mitteparameetriliste meetodite ja järjekordstatistika piirjaotuste teooria rajajaid.

    Seejärel muutis Kolmogorovi-Smirnovi sobivuse testi Ameerika statistik, George Washingtoni ülikooli professor, et seda kasutada populatsioonide normaaljaotuse testimiseks. Hubert Lilliefors(Hubert Whitman Lilliefors, 1928-2008). Professor Lilliefors oli üks teerajajaid arvutitehnoloogia kasutamisel statistilistes arvutustes.

    Hubert Lilliefors

    2. Milleks kasutatakse Kolmogorovi-Smirnovi kriteeriumi?

    See kriteerium võimaldab hinnata kahe valimi jaotuste vaheliste erinevuste olulisust, sealhulgas selle võimalikku kasutamist hinnata, kas uuritava valimi jaotus vastab normaaljaotuse seadusele.

    3. Millistel juhtudel saab kasutada Kolmogorovi-Smirnovi kriteeriumi?

    Kolmogorovi-Smirnovi test on mõeldud kvantitatiivsete andmete kogumite jaotuse normaalsuse testimiseks.

    Saadud andmete suurema usaldusväärsuse huvides peaksid vaadeldavate valimite mahud olema piisavalt suured: n ≥ 50. Hinnangulise populatsiooni suuruse korral 25–50 elementi on soovitatav kasutada Bolševi parandust.

    4. Kuidas arvutada Kolmogorovi-Smirnovi kriteeriumi?

    Kolmogorovi-Smirnovi kriteerium arvutatakse spetsiaalsete statistikaprogrammide abil. See põhineb statistikal järgmisel kujul:

    kus sup S on hulga S vähim ülemine piir, F n- uuritava populatsiooni jaotusfunktsioon, F(x)- normaaljaotuse funktsioon

    Tuletatud tõenäosused põhinevad eeldusel, et normaaljaotuse keskmine ja standardhälve on a priori teada ja neid ei hinnata andmete põhjal.

    Kuid praktikas arvutatakse parameetrid tavaliselt otse andmetest. Sel juhul sisaldab normaalsuse test keerulist hüpoteesi ("Kui tõenäoline on antud või suurema olulisusega D-statistika saamine, sõltuvalt andmetest arvutatud keskmisest ja standardhälbest") ja Lillieforsi tõenäosusi (Lilliefors, 1967) on antud.

    5. Kuidas tõlgendada Kolmogorovi-Smirnovi kriteeriumi väärtust?

    Kui D, on Kolmogorovi-Smirnovi statistika oluline (lk<0,05), то гипотеза о том, что соответствующее распределение нормально, должна быть отвергнута.