Ühesuguste auastmete juhtum. Aste korrelatsioonikordajad

Aste korrelatsioonikordajad- need on vähem täpsed, kuid lihtsamini arvutatavad mitteparameetrilised näitajad kahe korreleeruva tunnuse vahelise seose läheduse mõõtmiseks. Nende hulka kuuluvad Spearmani (ρ) ja Kendalli (τ) koefitsiendid, mis põhinevad mitte korrelatsioonitunnuste endi väärtuste, vaid nende väärtuste korrelatsioonil. auastmed- igale väärtusele määratud seerianumbrid X ja juures(eraldi) järjestatud real. Mõlemad funktsioonid peavad olema järjestatud (nummerdatud) samas järjekorras: madalamatest väärtustest kõrgemateni ja vastupidi. Kui väärtusi on mitu X(või juures), siis määratakse igaühele neist auaste, mis on võrdne nendele väärtustele omistatavate auastmete (rea kohtade) summa jagatisega võrdsete väärtuste arvuga. Funktsioonide auastmed X ja juures sümboliseeriti Rx ja Ry(mõnikord Nx ja Ny). Otsus väärtuste muutuste vahelise seose kohta X ja juures põhineb auastmete käitumise võrdlemisel kahe tunnuse paralleelselt. Kui iga paar X ja juures auastmed langevad kokku, see iseloomustab lähimat seost. Kui aga auastmetele on täiesti vastand, s.t. ühes reas tõusevad auastmed 1-lt n, samas kui teises need vähenevad alates n kuni 1, see on maksimaalne võimalik tagasiside. Spearmani ja Kendalli lähenemisviisid ühenduse tiheduse hindamisele on mõnevõrra erinevad. Arvutamiseks Spearmani koefitsient funktsiooni väärtused X ja juures nummerdatud (eraldi) kasvavas järjekorras 1 kuni n, st. neile antakse teatud auaste Rx ja Ry) on järjestatud seeria seerianumber. Seejärel leitakse iga auastmepaari jaoks nende erinevus (tähistatud kui d=RxRy) ja selle erinevuse ruudud liidetakse.

kus d- järgu erinevus X ja juures;

n on vaadeldud väärtuspaaride arv X ja juures.

Koefitsient ρ võib võtta väärtusi 0 kuni ±1. Tuleb meeles pidada, et kuna Spearmani koefitsient võtab arvesse erinevusi ainult auastmetes, mitte väärtustes enestes X ja y, see on vähem täpne kui lineaarne koefitsient. Seetõttu ei saa selle äärmuslikke väärtusi (1 või 0) tingimusteta pidada tõendiks funktsionaalsest ühendusest või täielikust sõltuvuse puudumisest X ja y. Kõigil muudel juhtudel, s.o. millal ρ ei võta äärmuslikke väärtusi, see on üsna lähedal r.

Valem (147) on rangelt teoreetiliselt rakendatav ainult üksikute väärtuste korral X(ja y), ja seega nende read ei kordu. Korduvate (seotud) auastmete jaoks on teine, keerulisem valem, mis on kohandatud korduvate auastmete arvu järgi. Kogemused näitavad aga, et seotud auastmete korrigeeritud valemiga tehtud arvutuste tulemused erinevad vähe korduvate auastmete valemiga saadud tulemustest. Seetõttu kasutatakse praktikas edukalt valemit (147) nii mittekorduvate kui ka korduvate ridade puhul.

Kendali astme korrelatsioonikordajaτ on üles ehitatud mõnevõrra erinevalt, kuigi ka selle arvutamine algab tunnuste väärtuste järjestamisest X ja y. Auastmed X(Rx) on ranged kasvavas järjekorras ja paralleelselt kirjutage üles igaühele vastav Rx tähenduses Ry. Kuna Rx on kirjutatud rangelt kasvavas järjekorras, siis on ülesandeks määrata jada vastavusaste Ry"õige" järgnemine Rx. Siiski iga Ry määrake järjestikku sellele järgnevate auastmete arv, mis ületavad selle väärtust, ja väiksemate auastmete arv. Esimesed (järgnevad "õiged") võetakse arvesse punktidena plussmärgiga ja nende summa on tähistatud tähega R. Teised (järgnevad "vale") võetakse arvesse punktidena, millel on märk "-" ja nende summa on tähistatud tähega K. Ilmselgelt maksimaalne väärtus R saavutatakse, kui auastmed y (ry) sobitada auastmetega X (Rx) ja igas reas esindavad naturaalarvude jada vahemikus 1 kuni P. Siis pärast esimest väärtuste paari Rx= 1 ja Ry= 1, on nende järgu väärtuste ületamise arv ( n– 1), pärast teist paari, kus Rx= 2 ja Ry= 2, vastavalt (P - 2) jne. Seega, kui auastmed X ja juures vaste ja auastmepaaride arv on n, siis

Kui auastmete järjestus X ja juures kaldub auastmete jada suhtes pöördvõrdeliselt X, siis K on sama maksimaalne väärtus modulo:

.

Kui y auastmed ei ühti auastmetega X, siis kõik positiivsed ja negatiivsed hinded liidetakse ( S=P+Q); selle summa suhe Sühe termini maksimaalse väärtuseni ja on Kendali astmete korrelatsioonikordaja τ, st:

. (148)

Kendalli astme korrelatsioonikordaja valemit (148) kasutatakse juhtudel, kui üksikute tunnuste väärtused (nagu X, nii y) ei kordu ja seetõttu nende auastmeid ei kombineerita. Kui on mitu identset väärtust X(või y), need. auastmed korduvad, muutuvad seotud, määratakse Kendali astmete korrelatsioonikordaja valemiga:

, (149)

kus S- tegelik koondskoor, kui hinnati +1 iga auastmepaari kohta sama muutumisjärjekorraga ja -1 iga auastmepaari kohta vastupidises muutumise järjekorras;

- punktide arv, mis parandavad (vähendavad) korduste (kombinatsioonide) tõttu maksimaalset punktide hulka t auastmed igas reas.

Pange tähele, et samade korduvate ridade juhtumeid (mis tahes reas) hinnatakse hindega 0, s.o. neid ei võeta arvutuses arvesse ei “+” ega “-” märgiga.

Spearmani ja Kendalli järgukorrelatsioonikordajate eelised: neid on lihtne arvutada, nende abil saab uurida ja mõõta seost mitte ainult kvantitatiivsete, vaid ka teatud viisil järjestatud kvalitatiivsete (kirjeldavate) tunnuste vahel. Lisaks ei ole auaste korrelatsioonikordajate kasutamisel vaja teada uuritavate nähtuste seose vormi.

Kui järjestatud tunnuste (tegurite) arv on suurem kui kaks, siis saab nendevahelise seose tiheduse mõõtmiseks kasutada M. Kendalli ja B. Smithi pakutud vastavuskordajat (mitme järgu korrelatsioonikordaja):

, (150)

kus S- summa ruudu hälbete summa t auastmed nende keskmise väärtuse järgi;

t - järjestatud tunnuste arv;

P - järjestatud ühikute arv (vaatluste arv).

Valemit (150) kasutatakse juhul, kui iga tunnuse auastmeid ei korrata. Seotud auastmete olemasolul arvutatakse vastavuskoefitsient, võttes arvesse iga teguri korduvate (seotud) astmete arvu:

, (151)

kus t on iga atribuudi identsete astmete arv.

Vastavuskordaja W võib võtta väärtusi vahemikus 0 kuni 1. Siiski on vaja kontrollida selle olulisust (olulisust), kasutades χ2 kriteeriumi valemi (152) seotud astmete puudumisel ja kui need on olemas, siis valemi (153) järgi. ):

, (152) . (153)

χ2 tegelikku väärtust võrreldakse aktsepteeritud olulisuse tasemele vastava tabeliga α (0,05 või 0,01) ja vabadusastmete arv v = P - 1. Kui χ2fact > χ2tabl, siis W- märkimisväärne (märkimisväärne).

Konkordantsi koefitsienti kasutatakse eriti sageli eksperthinnangutes, näiteks selleks, et teha kindlaks ekspertide arvamuste kokkulangevus teatud hinnatava näitaja olulisuse kohta või järjestada üksikuid üksusi mis tahes alusel. Valemis (150) tähendab nendel juhtudel m ekspertide arvu ja n on järjestatud ühikute (või tunnuste) arv.

Uurides rahvatervist ja tervishoidu teaduslikel ja praktilistel eesmärkidel, peab teadlane sageli tegema statistilise üldkogumi faktorite ja resultanttunnuste vaheliste seoste statistilist analüüsi (põhjus-tagajärg seos) või määrama paralleelsete muutuste sõltuvuse. selle populatsiooni mitmetes tunnustes mõnest kolmandast väärtusest (nende ühisest põhjusest). ). On vaja uurida selle ühenduse omadusi, määrata selle suurus ja suund ning hinnata ka selle usaldusväärsust. Selleks kasutatakse korrelatsioonimeetodeid.

  1. Tunnuste vaheliste kvantitatiivsete seoste avaldumistüübid
    • funktsionaalne ühendus
    • korrelatsioon
  2. Funktsionaalsuse ja korrelatsiooni mõisted

    funktsionaalne ühendus- seda tüüpi seos kahe tunnuse vahel, kui ühe väärtuse iga väärtus vastab teise rangelt määratletud väärtusele (ringi pindala sõltub ringi raadiusest jne). Funktsionaalne seos on iseloomulik füüsikalistele ja matemaatilistele protsessidele.

    korrelatsioon- selline seos, milles ühe atribuudi iga konkreetne väärtus vastab mitmele sellega seotud teise atribuudi väärtusele (inimese pikkuse ja kehakaalu suhe; kehatemperatuuri ja pulsisageduse suhe jne). Biomeditsiinilistele protsessidele on iseloomulik korrelatsioon.

  3. Korrelatsiooni tuvastamise praktiline tähendus. Põhjus-tagajärje seose väljaselgitamine teguri ja tulenevate tunnuste vahel (füüsilise arengu hindamisel töötingimuste, elamistingimuste ja tervisliku seisundi vahelise seose väljaselgitamiseks, haigestumise esinemissageduse sõltuvuse määramisel vanusest, tööstaažist tööstuslike ohtude olemasolu jne)

    Mitme tunnuse paralleelsete muutuste sõltuvus mõnest kolmandast suurusest. Näiteks töökojas kõrge temperatuuri mõjul vererõhu, vere viskoossuse, pulsisageduse jms muutused.

  4. Tunnustevahelise seose suunda ja tugevust iseloomustav väärtus. Korrelatsioonikoefitsient, mis ühes numbris annab aimu märkide (nähtuste) vahelise seose suunast ja tugevusest, selle kõikumise piirid on 0 kuni ± 1
  5. Korrelatsiooni esitusmeetodid
    • graafik (hajuvusdiagramm)
    • korrelatsioonikordaja
  6. Korrelatsiooni suund
    • sirge
    • tagurpidi
  7. Korrelatsiooni tugevus
    • tugev: ±0,7 kuni ±1
    • keskmine: ±0,3 kuni ±0,699
    • nõrk: 0 kuni ±0,299
  8. Korrelatsioonikordaja määramise meetodid ja valemid
    • ruutude meetod (Pearsoni meetod)
    • järjestuse meetod (Spearmani meetod)
  9. Korrelatsioonikordaja kasutamise metoodilised nõuded
    • assotsiatsiooni mõõtmine on võimalik ainult kvalitatiivselt homogeensetes populatsioonides (näiteks pikkuse ja kaalu vahelise seose mõõtmine populatsioonides, mis on soo ja vanuse järgi homogeensed)
    • arvutamiseks võib kasutada absoluutväärtusi või tuletatud väärtusi
    • korrelatsioonikordaja arvutamiseks kasutatakse grupeerimata variatsiooniridu (see nõue kehtib ainult korrelatsioonikordaja arvutamisel ruutude meetodil)
    • vaatluste arv vähemalt 30
  10. Auaste korrelatsioonimeetodi (Spearmani meetod) kasutamise soovitused
    • kui pole vaja täpselt kindlaks määrata ühenduse tugevust, vaid pigem indikatiivseid andmeid
    • kui märke esindavad mitte ainult kvantitatiivsed, vaid ka atributiivsed väärtused
    • kui funktsioonide levitamise seerial on avatud valikud (näiteks töökogemus kuni 1 aasta jne)
  11. Soovitused ruutude meetodi kasutamiseks (Pearsoni meetod)
    • kui on vaja täpselt kindlaks määrata tunnustevahelise seose tugevus
    • kui märkidel on ainult kvantitatiivne väljend
  12. Korrelatsioonikordaja arvutamise metoodika ja kord

    1) Ruudude meetod

    2) Järjekorra meetod

  13. Skeem korrelatsiooni hindamiseks korrelatsioonikordaja järgi
  14. Korrelatsioonikordaja vea arvutamine
  15. Astekorrelatsiooni meetodil ja ruutude meetodil saadud korrelatsioonikordaja usaldusväärsuse hindamine

    1. meetod
    Töökindlus määratakse järgmise valemiga:

    Kriteerium t hinnatakse t väärtuste tabeli järgi, võttes arvesse vabadusastmete arvu (n - 2), kus n on paarisoptsioonide arv. Kriteerium t peab olema võrdne tabeliga või sellest suurem, mis vastab tõenäosusele p ≥ 99%.

    2. meetod
    Usaldusväärsust hinnatakse standardsete korrelatsioonikoefitsientide spetsiaalse tabeli järgi. Samal ajal peetakse sellist korrelatsioonikordajat usaldusväärseks, kui see on teatud arvu vabadusastmete (n - 2) korral võrdne tabeliga või suurem, mis vastab veavaba prognoosi astmele p ≥ 95%.

ruutude meetodi rakendamiseks

Harjutus: arvutada korrelatsioonikoefitsient, määrata kindlaks vees sisalduva kaltsiumi koguse ja vee kareduse vahelise seose suund ja tugevus, kui on teada järgmised andmed (tabel 1). Hinnake ühenduse usaldusväärsust. Tee järeldus.

Tabel 1

Meetodi valiku põhjendus.Ülesande lahendamiseks valiti ruutude meetod (Pearson), kuna igal märgil (vee karedus ja kaltsiumi kogus) on arvuline avaldis; avatud võimalust pole.

Lahendus.
Arvutuste järjekord on kirjeldatud tekstis, tulemused on toodud tabelis. Pärast paaris võrreldavate märkide ridade koostamist tähistage neid kui x (vee karedus kraadides) ja läbi y (kaltsiumi kogus vees mg / l).

Vee karedus
(kraadides)
Kaltsiumi kogus vees
(mg/l)
d x d d x x d y d x 2 d a 2
4
8
11
27
34
37
28
56
77
191
241
262
-16
-12
-9
+7
+14
+16
-114
-86
-66
+48
+98
+120
1824
1032
594
336
1372
1920
256
144
81
49
196
256
12996
7396
4356
2304
9604
14400
M x = Σ x / n M y \u003d Σ y / n Σ d x x d y \u003d 7078 Σ d x 2 \u003d 982 Σ d y 2 = 51056
M x \u003d 120/6 \u003d 20 minu \u003d 852 / 6 \u003d 142
  1. Määrake keskmised väärtused M x reavalikus "x" ja M y reavalikus "y" vastavalt valemitele:
    М x = Σх/n (veerg 1) ja
    М y = Σу/n (veerg 2)
  2. Leidke iga valiku kõrvalekalle (d x ja d y) "x" seeria ja "y" seeria arvutatud keskmise väärtusest
    d x \u003d x - M x (veerg 3) ja d y \u003d y - M y (veerg 4).
  3. Leidke kõrvalekallete d x x d y korrutis ja summeerige need: Σ d x x d y (veerg 5)
  4. Ruudutage kõik kõrvalekalded d x ja d y ning liidage nende väärtused piki "x" seeriat ja piki "y" seeriat: Σ d x 2 = 982 (veerg 6) ja Σ d y 2 = 51056 (veerg 7).
  5. Määrake korrutis Σ d x 2 x Σ d y 2 ja eraldage sellest korrutisest ruutjuur
  6. Saadud suurused Σ (d x x d y) ja √ (Σd x 2 x Σd y 2) asendame korrelatsioonikordaja arvutamise valemis:
  7. Määrake korrelatsioonikordaja usaldusväärsus:
    1. viis. Leidke valemite abil korrelatsioonikordaja (mr xy) ja kriteeriumi t viga:

    Kriteerium t = 14,1, mis vastab veavaba prognoosi tõenäosusele p > 99,9%.

    2. viis. Korrelatsioonikordaja usaldusväärsust hinnatakse vastavalt tabelile "Standardkorrelatsioonikordajad" (vt lisa 1). Vabadusastmete arvuga (n - 2) = 6 - 2 = 4 on meie arvutatud korrelatsioonikordaja r xу = + 0,99 suurem kui tabel (r tabel = + 0,917 p = 99%).

    Järeldus. Mida rohkem kaltsiumi vees on, seda kõvem see on otsene, tugev ja usaldusväärne: r xy = + 0,99, p > 99,9%).

    auastme meetodi rakendamiseks

    Harjutus: auastmemeetodil määrata kindlaks aastates tööstaaži ja vigastuste sageduse vahelise seose suund ja tugevus, kui saadakse järgmised andmed:

    Meetodi valiku põhjendus:ülesande lahendamiseks saab valida ainult auaste korrelatsioonimeetodi, kuna atribuudi "töökogemus aastates" esimesel real on avatud valikud (töökogemus kuni 1 aasta ja 7 või enam aastat), mis ei võimalda täpsemat meetodit - ruutude meetodit - kasutada seose loomiseks võrreldavad omadused.

    Lahendus. Arvutuste järjekord on kirjeldatud tekstis, tulemused on toodud tabelis. 2.

    tabel 2

    Töökogemus aastates Vigastuste arv Järjearvud (järgud) Aste erinevus järgu erinevus ruudus
    X Y d(x-y) d2
    Kuni 1 aasta 24 1 5 -4 16
    1-2 16 2 4 -2 4
    3-4 12 3 2,5 +0,5 0,25
    5-6 12 4 2,5 +1,5 2,25
    7 või rohkem 6 5 1 +4 16
    Σ d 2 \u003d 38,5

    Standardsed korrelatsioonikoefitsiendid, mida peetakse usaldusväärseks (L.S. Kaminsky järgi)

    Vabadusastmete arv - 2 Tõenäosuse tase p (%)
    95% 98% 99%
    1 0,997 0,999 0,999
    2 0,950 0,980 0,990
    3 0,878 0,934 0,959
    4 0,811 0,882 0,917
    5 0,754 0,833 0,874
    6 0,707 0,789 0,834
    7 0,666 0,750 0,798
    8 0,632 0,716 0,765
    9 0,602 0,885 0,735
    10 0,576 0,858 0,708
    11 0,553 0,634 0,684
    12 0,532 0,612 0,661
    13 0,514 0,592 0,641
    14 0,497 0,574 0,623
    15 0,482 0,558 0,606
    16 0,468 0,542 0,590
    17 0,456 0,528 0,575
    18 0,444 0,516 0,561
    19 0,433 0,503 0,549
    20 0,423 0,492 0,537
    25 0,381 0,445 0,487
    30 0,349 0,409 0,449

    1. Vlasov V.V. Epidemioloogia. - M.: GEOTAR-MED, 2004. - 464 lk.
    2. Lisitsyn Yu.P. Rahvatervis ja tervishoid. Õpik gümnaasiumile. - M.: GEOTAR-MED, 2007. - 512 lk.
    3. Medik V.A., Juriev V.K. Rahvatervise ja tervishoiu loengute kursus: 1. osa. Rahvatervis. - M.: Meditsiin, 2003. - 368 lk.
    4. Minjajev V.A., Višnjakov N.I. jt Sotsiaalmeditsiin ja tervishoiukorraldus (Juhend 2 köites). - Peterburi, 1998. -528 lk.
    5. Kutšerenko V.Z., Agarkov N.M. jt Sotsiaalhügieen ja tervishoiu korraldus (Õpetus) - Moskva, 2000. - 432 lk.
    6. S. Glantz. Meditsiini-bioloogiline statistika. Per inglise keelest. - M., Praktika, 1998. - 459 lk.

Järjekorraskaala kasutamine võimaldab määrata objektidele auastmeid mõne atribuudi järgi. Seega tõlgitakse mõõdiku väärtused järjestusväärtusteks. Samal ajal fikseeritakse erinevused omaduste avaldumisastmes. Järjestusprotsessis tuleks järgida 2 reeglit.

Järjekorra reegel. On vaja otsustada, kes saab esimese järgu: mis tahes kvaliteedi kõrgeima väljendusastmega objekt või vastupidi. Enamasti on see absoluutselt ükskõikne ega mõjuta lõpptulemust. Traditsiooniliselt aktsepteeritakse esimese järgu omistamist kõrgema kvaliteediga objektidele (kõrgem väärtus – madalam aste). Näiteks tšempion saab esikoha ja mitte vastupidi. Kuigi siin, kui oleks kasutatud vastupidist järjestust, poleks tulemused sellest muutunud. Seega on igal teadlasel õigus järjestus ise määrata. Näiteks E. V. Sidorenko soovitab määrata madalamale väärtusele madalama auastme. Mõnel juhul on see mugavam, kuid ebatavalisem.

Näiteks: on järjestamata valim, mille andmed tuleb järjestada. (2, 7, 6, 8, 11, 15, 9). Pärast proovi tellimist reastame selle.

Meetrilised andmed

Alternatiivne võimalus:

Meetrilised andmed

Eraldi tuleks öelda järgmist. On rühm harva kasutatavaid mitteparameetrilisi teste (Wilcoxoni T-test, Mann-Whitney U-test, Rosenbaumi Q-test jne), millega töötades on alati vaja madalamale väärtusele määrata madalam auaste. .

Lingitud auastme reegel. Objektidele, mille omaduste raskusaste on sama, määratakse sama auaste. See auaste on nende auastmete keskmine, mille nad oleksid saanud, kui nad poleks olnud võrdsed. Näiteks peate järjestama valimi, mis sisaldab rida identseid mõõdikuandmeid: (4, 5, 9, 2, 6, 5, 9, 7, 5, 12). Pärast valimi tellimist tuleks arvutada seotud ridade aritmeetiline keskmine.

Meetrilised andmed

Eeljärjestus

Lõplik paremusjärjestus

Ülesanded iseseisvaks tööks.

    Reastage valim reegli "kõrgem väärtus – madalam auaste" järgi: (111, 104, 115, 107, 95, 104, 104).

    Reastage valim reegli "madalam väärtus – madalam aste" (20, 25, 8, 7, 20, 14, 27) järgi.

    Kombineerige kaks eelmist näidist ja järjestage vastavalt reeglile "kõrgem väärtus - madalam aste"

    Milliste I tabelis olevate tunnuste näitajad on nominatiivsed, millised meetrilised?

    Tõlgi teadlikkuse näitajad lisa tabelist I astmeskaalaks. Tõstke esile indikaatorite raskusastmed, teisendades need nominatiivseks skaalaks.

      Tabel I Andmed töötlemiseks

õpilased

ülikooli profiil

teadlikkust

peidetud figuurid

jäi vahele

aritmeetika

mõistmine

erand

pilte

analoogia

numbriseeria

järeldused

geomeetriline lisamine

sõnade meeldejätmine

keskmine IQ

ekstraversioon-

introvertsus

neurootilisus

keskmine hinne

Ülikooli profiil: 0 - üliõpilase humanitaarprofiili valik;

1 - õpilase valik matemaatilise või loodusteadusliku profiili vahel

Sotsiaal-majanduslike nähtuste analüüsimisel tuleb sageli auastmeid kasutades kasutada erinevaid tinglikke hinnanguid ning üksikute tunnuste vahelist seost mõõdetakse mitteparameetriliste korrelatsioonikordajate abil.

Ulatus on õppeobjektide tellimise protseduur, mis toimub eelistuse alusel.

Koht- see on atribuutide väärtuste seerianumber, mis on järjestatud nende väärtuste kasvavas või kahanevas järjekorras. Kui iseloomulike väärtuste kvantitatiivne hinnang on sama, võetakse kõigi nende väärtuste järjestus võrdseks nende määratletud kohtade arvu aritmeetilise keskmisega. Neid auastmeid nimetatakse ühendatud.

Ühenduse tiheduse hindamise mitteparameetrilistest meetoditest on suurima tähtsusega Spearmani (p1?/) ja Kendalli (m^) auaste korrelatsioonikordajad. Neid koefitsiente saab kasutada nii kvantitatiivsete kui ka kvalitatiivsete tunnuste vahelise seose lähedase määramiseks.

Aste korrelatsioonikordaja(Spearmani koefitsient) arvutatakse valemiga

kus (11 - järgu erinevuse ruudud; P - vaatluste arv (järgupaaride arv).

Spearmani koefitsient võtab mis tahes väärtuse vahemikus [-1; üks].

Näide. Tuginedes andmetele Vene Föderatsiooni Volga föderaalringkonna subjektide kodanike poolt 2010. aastal krediidiasutuste kaudu ostnud ja müünud ​​valuuta kohta, määrame nende tunnuste vahelise seose Spearmani koefitsiendi abil (tabel 7.14).

Tabel 7.14. Spearmani koefitsiendi arvutamine

Teema

Valuuta ostmine X, miljonit hõõruda.

Valuuta müük y, miljonit hõõruda.

Koht

pop a auastmed

järgu erinevus ruudus

$

To

Ry

1. Baškortostani Vabariik

2. Mari El

3. Mordva Vabariik

4. Tatarstani Vabariik

5. Udmurdi Vabariik

6. Tšuvašš

Vabariik

7. Permi piirkond

8. Kirovi piirkond

9. Nižni Novgorodi piirkond

10. Orenburgi piirkond

11. Penza piirkond

12. Samara piirkond

13. Saratovi oblast

14. Uljanovski oblast

Arvutame Spearmani auastmete korrelatsioonikordaja:

Arvutuse tulemusena tegime kindlaks, et Vene Föderatsiooni Volga föderaalringkonna kodanike poolt 2010. aastal krediidiasutuste kaudu sooritatud valuuta ostu-müügi suhe on tugev, peaaegu funktsionaalne.

Kendalli astme korrelatsioonikordaja kasutatakse ka homogeenseid objekte iseloomustavate ja sama põhimõtte järgi järjestatavate kvalitatiivsete ja kvantitatiivsete tunnuste vahelise seose tiheduse ja suuna mõõtmiseks. Kendalli järgu koefitsiendi arvutamine toimub valemi järgi

kus 5 on jadade arvu ja inversioonide arvu erinevuste summa vastavalt teisele tunnusele; P - vaatluste arv.

Selle koefitsiendi arvutamine toimub järgmises järjestuses.

  • 1. Väärtused X on järjestatud kasvavas või kahanevas järjekorras.
  • 2. Väärtused juures väärtuste järgi järjestatud X.
  • 3. Iga auastme kohta juures määratakse järgmiste auastmete väärtuste arv, mis ületavad selle väärtust. Seega, numbrite liitmisel määratakse väärtus R auastmete jadade fx ja vastavuse mõõt y, mida võetakse arvesse "+" märgiga.
  • 4. Iga auastme kohta juures määratakse järgmiste auastmete väärtuste arv, mis on selle väärtusest väiksemad. Koguväärtust tähistatakse (2 ja fikseeritakse märgiga "-".
  • 5. Selgub kõigi sarja liikmete punktide summa.

Tunnuste vahelist seost peetakse statistiliselt oluliseks, kui Spearmani ja Kendalli järgu korrelatsioonikoefitsiendid on suuremad kui 0,5.

Tabeli järgi. 7.14 tabelis toodud tulemused. 7.15.

Seega on Kendalli astme korrelatsioonikordaja

Tabel 7.15.

mis viitab ka tugevale seosele Vene Föderatsiooni Volga föderaalringkonna subjektide kodanike poolt 2009. aastal krediidiasutuste kaudu sooritatud valuuta ostmise ja müügi vahel.

Mitme astme korrelatsioonikordaja (vastavuskordaja) kasutatakse suvalise arvu järjestatud tunnuste vahelise seose tiheduse määramiseks. See arvutatakse valemiga

kus 5 - auastmete ruutude summa hälve järgu ruutude keskmisest; t - tegurite arv; P - vaatluste arv.

Näide. Teeme kindlaks SRÜ riikidega 2010. aasta tehnoloogiakaubanduse selliste võtmenäitajate nagu ekspordilepingute arv, lepingu eseme maksumus ja raha laekumine (tabel 7.16).

Tabel 7.16. Vastavuskordaja arvutamine

Riik

Lepingute arv

X

Lepingu eseme maksumus y, miljonit dollarit

Raha laekumine aastal d, mln USD

To

Ridade summa

summa ruut

1. Aserbaidžaan

2. Armeenia

3. Valgevene

4. Kasahstan

5. Kõrgõzstan

6. Moldova Vabariik

Näidiselemendi järjestus on selle elemendi järgarv variatsioonireas või teisisõnu valimielementide arv, mis on väiksem või võrdne

Seetõttu vastab valimi väärtus variatsioonirea järjekorrastatistikale.

Valimi järguvektor on arvude 1, 2 permutatsioon, mis saadakse valimi elementide asendamisel nende auastmetega. Astestatistika on järjestusvektori suvaline funktsioon. Auastmealgoritm näeb ette mõne järgustatistika võrdlemise lävega.

Algse valimi saab taastada, kui on teada järjestusstatistika vektor ja järjestusvektor R. Eraldi esindab ükskõik milline neist kahest vektorist algse valimi pöördumatut mittelineaarset teisendust. Homogeense sõltumatu valimi korral on juhuslikud vektorid ja R sõltumatud.

Valimi suuruse elemendi järjestuse ühikuhüppe funktsiooni või märgifunktsiooni abil saab esitada järgmiselt:

(13.168 a)

(13.168 a ja b) järeldub, et pingeridadele on alla kirjutatud statistika valimi väärtuste erinevustest.

Homogeense sõltumatu valimi korral on tõenäosusfunktsioon argumentide permutatsioonirühma suhtes muutumatu. Sellest järeldub, et määratud valimi puhul on kõik järguvektorid võrdselt tõenäolised, olenemata jaotusest, millesse valim kuulub. Võimalike auaste vektorite koguarv, mis vastab suuruse valimile, on võrdne arvude permutatsioonide arvuga, st seetõttu koosneb auaste vektorite valimiruum -dimensioonilise eukleidilise ruumi diskreetsetest punktidest. Tõenäosus, et vaadeldava valimi järjestusvektor R tabab selle diskreetse hulga mis tahes punkti, on st homogeense sõltumatu valimi mis tahes jaotuse korral

Seega on järjestusalgoritm mitteparameetriline seoses hüpoteesiga H, et suvalisest jaotusest pärit valim on homogeenne ja sõltumatu. Alternatiivi K puhul, et sõltumatu valim on heterogeenne, lakkavad auastmed olemast võrdtõenäolised. Astevektori jaotusfunktsiooni määramiseks alternatiiviga K on vaja arvutada integraal

kus ala hõlmab neid näidisruumi punkte, mis järjestatuna vastavad antud vektorile

See integraal

(13.170)

Valemi (13.170) praktiline kasutamine, välja arvatud erijuhud, on seotud raskesti teostatavate arvutustega. Jaotuse keerukuse (13.170) tõttu on optimaalse järjestusalgoritmi süntees hüpoteeside kontrollimiseks Neumann-Pearsoni kriteeriumi järgi lõpliku valimi suurusega praktiliselt teostamatu. See on ka üks põhjusi, miks see süntees viiakse läbi heuristilisel alusel (vt 13.7.4).

Pange tähele, et homogeense sõltumatu valimi järjestusvektor on valimi inertsiaalsele teisendusele invariantne

kuna selline teisendus ei muuda näidiselementide suhtelist asukohta. (13.171) järeldub, et järjestusalgoritm säilitab mitteparameetrilise omaduse ka pärast näidatud mittelineaarset teisendust.