Bliskost linearnog odnosa između slučajnih varijabli. Određivanje bliskosti odnosa između slučajnih varijabli

Regresijska analiza

Obrada eksperimentalnih rezultata metodom

Kada se proučavaju procesi funkcioniranja složenih sustava, mora se raditi s nizom istovremeno djelujućih slučajnih varijabli. Da bismo razumjeli mehanizam pojava, uzročno-posljedične veze među elementima sustava itd., na temelju dobivenih opažanja nastojimo utvrditi odnose između tih veličina.

U matematička analiza ovisnost npr. između dviju veličina izražava se pojmom funkcije

gdje svaka vrijednost jedne varijable odgovara samo jednoj vrijednosti druge. Ta se ovisnost naziva funkcionalni.

Situacija s pojmom ovisnosti slučajnih varijabli mnogo je kompliciranija. U pravilu, između slučajne varijable(slučajni faktori) koji određuju proces funkcioniranja složenih sustava, obično postoji veza u kojoj se s promjenom jedne veličine mijenja raspodjela druge. Ova veza se zove stohastički, ili vjerojatnosni. U ovom slučaju, veličina promjene slučajnog faktora Y, što odgovara promjeni vrijednosti x, može se podijeliti na dvije komponente. Prvi je povezan s ovisnošću. Y iz x, a drugi s utjecajem “vlastitih” slučajnih komponenti Y I x. Ako prva komponenta nedostaje, tada slučajne varijable Y I x su neovisni. Ako nedostaje druga komponenta, onda Y I x funkcionalno ovise. Ako su obje komponente prisutne, odnos između njih određuje snagu ili bliskost veze između slučajnih varijabli Y I x.

Postoje različiti pokazatelji koji karakteriziraju pojedine aspekte stohastičkog odnosa. Tako, linearna ovisnost između slučajnih varijabli x I Y određuje koeficijent korelacije.

gdje su matematička očekivanja slučajnih varijabli X i Y.

– standardne devijacije slučajnih varijabli x I Y.


Linearna vjerojatnosna ovisnost slučajnih varijabli je da kada jedna slučajna varijabla raste, druga teži porastu (ili smanjenju) prema linearnom zakonu. Ako slučajne varijable x I Y povezani su strogom linearnom funkcionalnom ovisnošću, npr.

y=b 0 +b 1 x 1,

tada će koeficijent korelacije biti jednak ; a predznak odgovara predznaku koeficijenta b 1.Ako vrijednosti x I Y povezani proizvoljnom stohastičkom ovisnošću, tada će korelacijski koeficijent varirati unutar

Treba naglasiti da je za nezavisne slučajne varijable koeficijent korelacije nula. Međutim, koeficijent korelacije kao pokazatelj ovisnosti između slučajnih varijabli ima ozbiljne nedostatke. Prvo, iz ravnopravnosti r= 0 ne implicira neovisnost slučajnih varijabli x I Y(osim za slučajne varijable koje podliježu normalnom zakonu distribucije, za koje r= 0 znači ujedno nepostojanje bilo kakve ovisnosti). Drugo, ekstremne vrijednosti također nisu vrlo korisne, jer ne odgovaraju nikakvoj funkcionalnoj ovisnosti, već samo strogo linearnoj.



Potpuni opis ovisnosti Y iz x, i štoviše, izražen u točnim funkcionalnim odnosima, može se dobiti poznavanjem uvjetne funkcije distribucije.

Treba napomenuti da se u ovom slučaju jedna od promatranih varijabli smatra neslučajnom. Istodobnim fiksiranjem vrijednosti dviju slučajnih varijabli x I Y, kada uspoređujemo njihove vrijednosti, sve pogreške možemo pripisati samo vrijednosti Y. Stoga će se pogreška opažanja sastojati od vlastite slučajne pogreške veličine Y te iz pogreške usporedbe nastale zbog činjenice da s vrijednošću Y nije točno ista vrijednost koja se uspoređuje x koji se zapravo i zbio.

Međutim, pronalaženje funkcije uvjetne distribucije u pravilu se pokazuje kao vrlo težak zadatak. Najlakši način za istraživanje odnosa između x I Y s normalnom raspodjelom Y, jer je potpuno određen matematičkim očekivanjem i varijancom. U ovom slučaju, za opis ovisnosti Y iz x nema potrebe za izgradnjom funkcije uvjetne distribucije, već samo naznačite kako kada mijenjate parametar x matematičko očekivanje i varijanca promjene količine Y.

Dakle, dolazimo do potrebe da nađemo samo dvije funkcije:

Ovisnost uvjetne varijance D od parametra x Zove se shodastički ovisnosti. Karakterizira promjenu u točnosti tehnike promatranja kada se parametar promijeni i koristi se vrlo rijetko.

Ovisnost uvjetnog matematičkog očekivanja M iz x Zove se regresija, daje pravu ovisnost količina x I U, bez svih nasumičnih slojeva. Stoga je idealni cilj svakog proučavanja zavisnih varijabli pronaći regresijsku jednadžbu, a varijanca se koristi samo za procjenu točnosti dobivenog rezultata.

Poveznica-statistički odnos između dvije ili više slučajnih varijabli.

Parcijalni koeficijent korelacije karakterizira stupanj linearne ovisnosti između dviju veličina i ima sva svojstva para, tj. varira od -1 do +1. Ako je parcijalni koeficijent korelacije jednak ±1, tada je odnos između dviju veličina funkcionalan, a njegova jednakost nuli označava linearna neovisnost ove količine.

Koeficijent višestruke korelacije, koji karakterizira stupanj linearne ovisnosti između vrijednosti x1 i ostalih varijabli (x2, x3) uključenih u model, varira od 0 do 1.

Redna (redna) varijabla pomaže u poređanju statistički proučavanih objekata prema stupnju do kojeg se u njima očituje analizirano svojstvo

Korelacija ranga je statistički odnos između ordinalnih varijabli (mjerenje statističkog odnosa između dva ili više rangiranja istog konačnog skupa objekata O 1, O 2, ..., O p.)

Rangiranje– ovo je raspored objekata u silaznom redoslijedu prema stupnju manifestacije k-tog svojstva koje se u njima proučava. U ovom slučaju, x(k) se naziva rang i-tog objekta prema k-tom atributu. Bijes karakterizira redno mjesto koje objekt O i zauzima u nizu od n objekata.

39. Koeficijent korelacije, determinacija.

Koeficijent korelacije pokazuje stupanj statističke povezanosti između dvije numeričke varijable. Izračunava se na sljedeći način:

Gdje n– broj promatranja,

x– ulazna varijabla,

y je izlazna varijabla. Vrijednosti koeficijenta korelacije uvijek se kreću od -1 do 1 i tumače se na sljedeći način:

    ako koeficijent ako je korelacija blizu 1, tada postoji pozitivna korelacija između varijabli.

    ako koeficijent korelacija je blizu -1, što znači da postoji negativna korelacija između varijabli

    srednje vrijednosti blizu 0 će ukazivati ​​na slabu korelaciju između varijabli i, prema tome, nisku ovisnost.

Koeficijent determinacije (R 2 )- Ovo je udio objašnjene varijance u odstupanjima zavisne varijable od njezine srednje vrijednosti.

Formula za izračunavanje koeficijenta determinacije:

R 2 = 1 - ∑ i (y i -f i) 2 : ∑ i (y i -y(prim)) 2

Gdje je y i opažena vrijednost zavisne varijable, a f i je vrijednost zavisne varijable predviđena regresijskom jednadžbom, y(prime) je aritmetička sredina zavisne varijable.

Pitanje 16: Metoda sjeverozapadnog kuta

Prema ovoj metodi, rezerve sljedećeg Dobavljača koriste se za zadovoljenje zahtjeva sljedećih Potrošača sve dok se potpuno ne iscrpe. Nakon čega se koriste zalihe sljedećeg dobavljača po broju.

Ispunjavanje tablice transportnih zadataka počinje od gornjeg lijevog kuta i sastoji se od više sličnih koraka. U svakom koraku, na temelju zaliha sljedećeg Dobavljača i zahtjeva sljedećeg Kupca, popunjava se samo jedna ćelija te se sukladno tome jedan Dobavljač ili Potrošač isključuje iz razmatranja.

Da bi se izbjegle pogreške, nakon konstruiranja početnog osnovnog (referentnog) rješenja potrebno je provjeriti je li broj popunjenih ćelija jednak m+n-1.

Između promjena 7 i X. Za procjenu bliskosti odnosa između slučajnih varijabli koriste se indikatori  


Kao što smo već rekli, jedna od glavnih razlika između niza opažanja koji čine vremensku seriju je ta što su članovi vremenske serije, općenito govoreći, statistički međuovisni. Stupanj bliskosti statističke veze između slučajnih varijabli Xt i Xt+T može se mjeriti koeficijentom parne korelacije  

Opći parametar procjenjuje se na temelju pokazatelja uzorka, uzimajući u obzir pogrešku reprezentativnosti. U drugom slučaju, u odnosu na svojstva opće populacije, postavlja se određena hipoteza o vrijednosti sredine, disperziji, prirodi distribucije, obliku i bliskosti odnosa između varijabli. Testiranje hipoteza provodi se na temelju utvrđivanja konzistentnosti empirijskih podataka s hipotetskim (teorijskim) podacima. Ako odstupanje između uspoređivanih vrijednosti ne prelazi granice slučajnih pogrešaka, hipoteza se prihvaća. U ovom slučaju ne donose se zaključci o ispravnosti same hipoteze, govorimo o samo o konzistentnosti uspoređivanih podataka. Osnova za provjeru statističkih hipoteza su podaci iz slučajnih uzoraka. Nema razlike procjenjuju li se hipoteze u odnosu na stvarnu ili hipotetsku populaciju. Potonje otvara put za primjenu ove metode izvan stvarnog uzorka kada se analiziraju rezultati eksperimenta, podaci kontinuiranog promatranja, ali malog broja. U tom slučaju preporuča se provjeriti je li utvrđeni obrazac uzrokovan slučajnošću slučajnih okolnosti i koliko je tipičan za skup uvjeta u kojima se nalazi populacija koja se proučava.  

Ispada da se karakteristike korelacije i regresije kruga (, m]) mogu značajno razlikovati od odgovarajućih karakteristika izvornog (neiskrivljenog) kruga (, l) - Na primjer, u nastavku (vidi odjeljak 1.1.4) prikazano je da superpozicija slučajnih normalnih pogrešaka na izvornu dvodimenzionalnu normalnu shemu (, m) uvijek smanjuje apsolutnu vrijednost regresijskog koeficijenta Ql u odnosu (B. 15), a također slabi stupanj bliskosti veze između njega ( tj. smanjuje apsolutnu vrijednost koeficijenta korelacije r).  

Utjecaj pogrešaka mjerenja na vrijednost koeficijenta korelacije. Želimo procijeniti stupanj bliskosti korelacije između komponenata dvodimenzionalne normalne slučajne varijable (, TJ), ali ih možemo promatrati samo uz neke slučajne pogreške mjerenja es odnosno e (vidi dijagram D2 ovisnost u uvodu). Prema tome, eksperimentalni podaci (xit i/i), i = 1, 2,. .., l, su praktički uzorci vrijednosti iskrivljene dvodimenzionalne slučajne varijable (, r)), gdje je =  

Metoda R.a. sastoji se u izvođenju regresijske jednadžbe (uključujući procjenu njezinih parametara), uz pomoć koje se nalazi prosječna vrijednost slučajne varijable ako je poznata vrijednost druge (ili drugih u slučaju višestruke ili multivarijantne regresije). (Nasuprot tome, korelacijska analiza koristi se za pronalaženje i izražavanje snage odnosa između slučajnih varijabli71.)  

U proučavanju korelacije znakova koji nisu povezani s dosljednom promjenom tijekom vremena, svaki se znak mijenja pod utjecajem mnogih razloga, uzetih kao slučajni. U dinamičkim serijama njima se dodaje promjena vremena svake serije. Ova promjena dovodi do takozvane autokorelacije - utjecaja promjena razina prethodnih serija na sljedeće. Stoga korelacija između razina vremenskih serija ispravno pokazuje blisku povezanost pojava koje se odražavaju u vremenskim serijama samo ako u svakoj od njih ne postoji autokorelacija. Osim toga, autokorelacija dovodi do iskrivljenja vrijednosti srednjih kvadratnih pogrešaka regresijskih koeficijenata, što otežava konstruiranje intervala pouzdanosti za regresijske koeficijente, kao i testiranje njihove značajnosti.  

Teorijski koeficijenti i koeficijenti korelacije uzorka određeni relacijama (1.8), odnosno (1.8), mogu se formalno izračunati za bilo koji dvodimenzionalni sustav promatranja; oni su mjere stupnja bliskosti linearnog statističkog odnosa između analiziranih karakteristika. Međutim, samo u slučaju zajedničke normalne distribucije proučavanih slučajnih varijabli i q korelacijski koeficijent r ima jasno značenje kao karakteristika stupnja tijesne povezanosti između njih. Konkretno, u ovom slučaju omjer r - 1 potvrđuje čisto funkcionalni linearni odnos između proučavanih veličina, a jednadžba r = 0 ukazuje na njihovu potpunu međusobnu neovisnost. Osim toga, koeficijent korelacije, zajedno sa srednjim vrijednostima i varijancama slučajnih varijabli i TJ, čini onih pet parametara koji pružaju sveobuhvatne informacije o

Veza koja postoji između slučajnih varijabli različite naravi, primjerice između vrijednosti X i vrijednosti Y, nije nužno posljedica izravne ovisnosti jedne vrijednosti o drugoj (tzv. funkcionalna veza). U nekim slučajevima obje veličine ovise o čitavom nizu različitih čimbenika zajedničkih objema veličinama, uslijed čega nastaju međusobno povezani obrasci. Kada se pomoću statistike otkrije odnos između slučajnih varijabli, ne možemo tvrditi da smo otkrili uzrok stalne promjene parametara; prije smo vidjeli samo dvije međusobno povezane posljedice.

Primjerice, djeca koja češće gledaju američke akcijske filmove na TV-u manje čitaju. Djeca koja više čitaju bolje uče. Nije tako lako odlučiti gdje su uzroci, a gdje posljedice, ali to nije zadatak statistike. Statistika može samo postaviti hipotezu o postojanju veze i potkrijepiti je brojkama. Ako stvarno postoji veza, kaže se da su dvije slučajne varijable u korelaciji. Ako je povećanje jedne slučajne varijable povezano s povećanjem druge slučajne varijable, korelacija se naziva izravnom. Na primjer, broj pročitanih stranica godišnje i prosječni rezultat (akademski uspjeh). Ako je, naprotiv, povećanje jedne vrijednosti povezano s smanjenjem druge, govorimo o inverznoj korelaciji. Na primjer, broj akcijskih filmova i broj pročitanih stranica.

Međusobna povezanost dviju slučajnih varijabli naziva se korelacija, a korelacijska analiza omogućuje utvrđivanje postojanja takve veze i procjenu koliko je ta veza bliska i značajna. Sve se to izražava kvantitativno.

Kako utvrditi postoji li korelacija između količina? U većini slučajeva to se može vidjeti na običnom grafikonu. Na primjer, za svako dijete iz našeg uzorka možemo odrediti vrijednost X i (broj stranica) i Y i ( GPA godišnja procjena), te podatke zabilježite u obliku tablice. Konstruirajte X i Y osi, a zatim iscrtajte cijeli niz točaka na grafikonu tako da svaka od njih ima određeni par koordinata (X i, Y i) iz naše tablice. Budući da u ovom slučaju teško možemo odrediti što se može smatrati uzrokom, a što posljedicom, nije svejedno koja će os biti okomita, a koja vodoravna.


Ako graf izgleda kao a), to ukazuje na prisutnost izravne korelacije; ako izgleda kao b), tada je korelacija inverzna. Nema korelacije
Pomoću koeficijenta korelacije možete izračunati koliko blizak odnos postoji između vrijednosti.

Neka postoji korelacija između cijene i potražnje za proizvodom. Broj kupljenih jedinica ovisno o cijeni kod različitih prodavača prikazan je u tablici:

Vidi se da se radi o inverznoj korelaciji. Za kvantificiranje bliskosti veze koristi se koeficijent korelacije:

Koeficijent r izračunavamo u Excelu pomoću funkcije f x, zatim statističke funkcije, funkcije CORREL. Na upit programa, mišem unesite dva različita niza (X i Y) u dva odgovarajuća polja. U našem slučaju koeficijent korelacije je r = - 0,988. Treba napomenuti da što je korelacijski koeficijent bliži 0, to je odnos između veličina slabiji. Najbliža povezanost s izravnom korelacijom odgovara koeficijentu r blizu +1. U našem slučaju korelacija je obrnuta, ali također vrlo bliska, a koeficijent je blizu -1.

Što se može reći o slučajnim varijablama čiji koeficijent ima međuvrijednost? Na primjer, ako smo dobili r=0,65. U ovom slučaju statistika nam omogućuje da kažemo da su dvije slučajne varijable djelomično povezane jedna s drugom. Recimo da je 65% utjecaja na broj kupnji izvršio cijena, a za 35% - ostale okolnosti.

I još jednu važnu okolnost treba spomenuti. Budući da je riječ o slučajnim varijablama, uvijek postoji mogućnost da je veza koju primjećujemo slučajna okolnost. Štoviše, vjerojatnost pronalaženja veze tamo gdje je nema posebno je velika kada je u uzorku malo točaka, a prilikom ocjenjivanja niste gradili grafikon, već jednostavno izračunali vrijednost korelacijskog koeficijenta na računalu. Dakle, ako ostavimo samo dva različite točke u bilo kojem slučajnom uzorku, koeficijent korelacije će biti ili +1 ili -1. Iz školski tečaj U geometriji znamo da se ravna crta uvijek može povući kroz dvije točke. Za procjenu statističke pouzdanosti veze koju ste otkrili, korisno je koristiti takozvanu korekciju korelacije:

Dok zadatak korelacijska analiza- utvrditi jesu li te slučajne varijable međusobno povezane; svrha regresijske analize je opisati taj odnos analitičkom ovisnošću, tj. pomoću jednadžbe. Razmotrit ćemo najjednostavniji slučaj, kada se veza između točaka na grafu može prikazati ravnom linijom. Jednadžba ove ravne linije je Y=aX+b, gdje je a=Yprosjek-bXprosjek,

Znajući , možemo pronaći vrijednost funkcije prema vrijednosti argumenta u onim točkama gdje je vrijednost X poznata, ali Y nije. Ove su procjene vrlo korisne, ali se moraju pažljivo koristiti, osobito ako odnos između količina nije preblizak.

Imajte na umu također da je iz usporedbe formula za b i r jasno da koeficijent ne daje vrijednost nagiba linije, već samo pokazuje samu činjenicu prisutnosti veze.

Tvrtka zapošljava 10 ljudi. U tablici 2 prikazani su podaci o njihovom radnom iskustvu i

mjesečna plaća.

Izračunajte pomoću ovih podataka

  • - vrijednost procjene kovarijance uzorka;
  • - vrijednost Pearsonovog koeficijenta korelacije uzorka;
  • - iz dobivenih vrijednosti procijeniti smjer i čvrstoću veze;
  • - utvrditi koliko je opravdano reći da ova tvrtka koristi japanski model upravljanja, koji pretpostavlja da što više vremena zaposlenik provede u određenoj tvrtki, to bi njegova plaća trebala biti veća.

Na temelju korelacijskog polja možemo pretpostaviti (za populaciju) da je odnos između svih mogućih vrijednosti X i Y linearan.

Da bismo izračunali regresijske parametre, napravit ćemo tablicu izračuna.

Uzorak znači.

Odstupanja uzorka:

Procijenjena regresijska jednadžba bit će

y = bx + a + e,

gdje su ei opažene vrijednosti (procjene) pogrešaka ei, a i b, odnosno procjene parametara b i u regresijskom modelu koji treba pronaći.

Za procjenu parametara b i c koristi se metoda najmanjih kvadrata (najmanjih kvadrata).

Sustav normalnih jednadžbi.

a?x + b?x2 = ?y*x

Za naše podatke sustav jednadžbi ima oblik

  • 10a + 307 b = 33300
  • 307 a + 10857 b = 1127700

Pomnožimo jednadžbu (1) sustava s (-30,7), dobivamo sustav koji rješavamo metodom algebarskog zbrajanja.

  • -307a -9424,9 b = -1022310
  • 307 a + 10857 b = 1127700

Dobivamo:

1432.1 b = 105390

Odakle dolazi b = 73,5912?

Nađimo sada koeficijent "a" iz jednadžbe (1):

  • 10a + 307 b = 33300
  • 10a + 307 * 73,5912 = 33300
  • 10a = 10707,49

Dobivamo empirijske koeficijente regresije: b = 73,5912, a = 1070,7492

Jednadžba regresije (jednadžba empirijske regresije):

y = 73,5912 x + 1070,7492

Kovarijanca.

U našem primjeru, veza između osobine Y i faktora X je visoka i izravna.

Stoga sa sigurnošću možemo reći da što više vremena zaposlenik radi u određenoj tvrtki, to mu je veća plaća.

4. Testiranje statističkih hipoteza. Prilikom rješavanja ovog problema, prvi korak je formuliranje provjerljive hipoteze i alternativne.

Provjera jednakosti općih udjela.

Provedeno je istraživanje uspjeha studenata na dva fakulteta. Rezultati za opcije dani su u tablici 3. Može li se reći da oba fakulteta imaju isti postotak izvrsnih studenata?

Jednostavna aritmetička sredina

Testiramo hipotezu o jednakosti općih udjela:

Nađimo eksperimentalnu vrijednost Studentovog kriterija:

Broj stupnjeva slobode

f = nh + nu - 2 = 2 + 2 - 2 = 2

Odredite tkp vrijednost koristeći Studentovu tablicu distribucije

Pomoću Studentove tablice nalazimo:

Ttablica(f;b/2) = Ttablica(2;0,025) = 4,303

Koristeći tablicu kritičnih točaka Studentove distribucije na razini značajnosti b = 0,05 i zadanom broju stupnjeva slobode, nalazimo tcr = 4,303

Jer tob > tcr, tada se nulta hipoteza odbacuje, opći udjeli dvaju uzoraka nisu jednaki.

Provjera ravnomjernosti opće raspodjele.

Sveučilišni dužnosnici žele saznati kako se popularnost humanističkih odjela mijenjala tijekom vremena. Analiziran je broj pristupnika koji su se prijavili na ovaj fakultet u odnosu na ukupan broj pristupnika u odgovarajućoj godini. (Podaci su dati u tablici 4). Ako broj pristupnika smatramo reprezentativnim uzorkom ukupnog broja maturanata godine, možemo li reći da se interes školaraca za specijalnosti ovog fakulteta ne mijenja tijekom vremena?

Opcija 4

Rješenje: Tablica za izračunavanje pokazatelja.

Sredina intervala, xi

Akumulirana frekvencija, S

Učestalost, fi/n

Za procjenu serije distribucije nalazimo sljedeće pokazatelje:

Prosječne težine

Raspon varijacije je razlika između maksimalne i minimalne vrijednosti karakteristike primarne serije.

R = 2008 - 1988 = 20 Disperzija - karakterizira mjeru disperzije oko svoje prosječne vrijednosti (mjera disperzije, tj. odstupanja od prosjeka).

Standardna devijacija (prosječna pogreška uzorkovanja).

Svaka vrijednost niza razlikuje se od prosječne vrijednosti 2002,66 za prosječno 6,32

Provjera hipoteze o ravnomjernom rasporedu stanovništva.

Kako bi se testirala hipoteza o ravnomjernoj distribuciji X, tj. prema zakonu: f(x) = 1/(b-a) u intervalu (a,b) potrebno je:

Procijenite parametre a i b - krajeve intervala u kojem su promatrane moguće vrijednosti X, pomoću formula (znak * označava procjene parametara):

Odredite gustoću vjerojatnosti očekivane distribucije f(x) = 1/(b* - a*)

Pronađite teorijske frekvencije:

n1 = nP1 = n = n*1/(b* - a*)*(x1 - a*)

n2 = n3 = ... = ns-1 = n*1/(b* - a*)*(xi - xi-1)

ns = n*1/(b* - a*)*(b* - xs-1)

Usporedite empirijske i teorijske frekvencije koristeći Pearsonov kriterij, uzimajući broj stupnjeva slobode k = s-3, gdje je s broj početnih intervala uzorkovanja; ako je izvedena kombinacija malih frekvencija, a time i samih intervala, tada je s broj intervala preostalih nakon kombinacije. Nađimo procjene za parametre a* i b* uniformne distribucije pomoću formula:

Nađimo gustoću pretpostavljene uniformne distribucije:

f(x) = 1/(b* - a*) = 1/(2013,62 - 1991,71) = 0,0456

Nađimo teorijske frekvencije:

n1 = n*f(x)(x1 - a*) = 0,77 * 0,0456(1992-1991,71) = 0,0102

n5 = n*f(x)(b* - x4) = 0,77 * 0,0456(2013.62-2008) = 0,2

ns = n*f(x)(xi - xi-1)

Budući da Pearsonova statistika mjeri razliku između empirijske i teorijske distribucije, što je veća njezina promatrana vrijednost Kob, to je jači argument protiv glavne hipoteze.

Stoga je kritično područje za ovu statistiku uvijek desno :)