Atšķirības starp izlases un populācijas dispersiju

Paskaidrojums

Statistikā termins izlases veidā norāda uz apkopotu statistikas datu daļas atlasi, lai iegūtu būtisku informāciju par visu. Apkopotu vai visu statistisko informāciju par visu izmeklēšanas dalībnieku īpašo raksturu sauc par “populāciju” vai “Visumu”. (Das, N.G., 2010). Izvēlēto populācijas daļu, kuru izmanto populācijas vai Visuma raksturlielumu iegūšanai, sauc par “paraugu”. Tiek uzskatīts, ka populāciju veido atsevišķas vienības vai locekļi, un dažas vienības ir iekļautas izlasē. Kopējo populācijas vienību skaitu sauc par populācijas lielumu, bet parauga - par izlases lielumu. Populācija un paraugs var būt ierobežots vai bezgalīgs, un līdzīgi tie var būt vai arī hipotētiski.

Dispersija: Variants ir skaitliska vērtība, kas parāda, cik plaši atsevišķi datu kopas skaitļi izkliedējas par vidējo. Tas ir, cik tālu katrs skaitlis ir no vidējā, tātad viens no otra. Nulles vērtības novirze nozīmē, ka visi dati ir identiski. Jo vairāk dispersijas, jo vairāk ir vērtību, kas sadalītas vidējā, tātad viena no otras. Ja ir mazāka dispersija, mazāk ir vērtību, kas sadalītas vidējā, tātad viena no otras, un dispersija nevar būt negatīva.

Starpība starp populācijas un izlases dispersiju

Galvenā atšķirība starp populācijas dispersiju un izlases dispersiju ir saistīta ar dispersijas aprēķināšanu. Dispersiju aprēķina piecās pakāpēs. Tiek aprēķināts pirmais vidējais, tad mēs aprēķinām novirzes no vidējā, un, treškārt, novirzes tiek sašūtas kvadrātā, ceturtkārt, tiek summētas novirzes kvadrātā un visbeidzot šī summa tiek dalīta ar vienību skaitu, kurām tiek aprēķināta dispersija. Tādējādi dispersija = Σ (xi-x -) / n. Kur xi = i. Skaits, x- = vidējais un n = priekšmetu skaits…

Tagad, kad dispersija jāaprēķina no iedzīvotāju skaita datiem, n ir vienāds ar vienību skaitu. Tātad, ja visu 1000 cilvēku asinsspiediena novirze jāaprēķina no datiem par visu 1000 cilvēku asinsspiedienu, tad n = 1000. Tomēr, aprēķinot novirzi no parauga datiem, 1 jāatskaita no n pirms dalīšanas kvadrātisko noviržu summa. Tādējādi iepriekšminētajā piemērā, ja parauga datiem ir 100 vienības, saucējs būtu 100 - 1 = 99.

Tādēļ no izlases datiem aprēķinātā dispersijas vērtība ir augstāka par vērtību, kuru varēja uzzināt, izmantojot populācijas datus. To darīšanas loģika ir kompensēt mūsu informācijas trūkumu par datiem par iedzīvotājiem. Nav iespējams noskaidrot cilvēku augstuma atšķirības, jo mums absolūti trūkst informācijas par visu dzīvo cilvēku augumiem, nerunājot par nākotni. Pat ja mēs ņemam vērā vienu mērenu piemēru, piemēram, datus par visiem ASV dzīvojošo vīriešu populācijas datiem par augumu, tas ir fiziski iespējams, taču ar to saistītās izmaksas un laiks zaudētu tā aprēķināšanas mērķi. Tas ir iemesls, kāpēc paraugu dati tiek ņemti lielākoties statistikas vajadzībām, un tam līdz ar to trūkst informācijas par lielāko daļu datu. Lai to kompensētu, parauga datu gadījumā dispersijas vērtība un standartnovirze, kas ir kvadrātā ar dispersijas sakni, ir augstāka nekā dispersija no populācijas datiem.

Tas darbojas kā automātisks vairogs analītiķiem un lēmumu pieņēmējiem. Loģika attiecas uz lēmumiem par kapitāla plānošanu, personīgo un biznesa finansēšanu, būvniecību, satiksmes pārvaldību un daudzām piemērojamām jomām. Tas palīdz ieinteresētajam būt drošībā, pieņemot lēmumu vai veicot citus secinājumus.

Kopsavilkums: Populācijas dispersija attiecas uz dispersijas vērtību, ko aprēķina pēc populācijas datiem, un parauga dispersija ir dispersija, kas aprēķināta pēc parauga datiem. Sakarā ar šo saucēja vērtību dispersijas formulā parauga datu gadījumā ir “n-1”, un tas ir “n” attiecībā uz populācijas datiem. Rezultātā gan dispersija, gan standartnovirze, kas iegūta no izlases datiem, ir vairāk nekā tā, kas iegūta no populācijas datiem.