Štatistika je už dlho neoddeliteľnou súčasťou života. Ľudia sa s tým stretávajú všade. Na základe štatistík sa vyvodzujú závery o tom, kde a aké choroby sú bežné, čo je viac žiadané v konkrétnom regióne alebo medzi určitým segmentom obyvateľstva. Aj konštrukcia politických programov kandidátov do vládnych orgánov vychádza zo štatistických údajov. Používajú ich aj obchodné reťazce pri nákupe tovaru a výrobcovia sa týmito údajmi riadia pri svojich návrhoch.
Štatistika hrá dôležitú úlohu v živote spoločnosti a ovplyvňuje každého jej jednotlivého člena aj v maličkostiach. Napríklad, ak podľa štatistík väčšina ľudí uprednostňuje tmavé farby oblečenia v konkrétnom meste alebo regióne, potom bude nájdenie jasne žltého pršiplášťa s kvetinovou potlačou v miestnych predajniach mimoriadne ťažké. Ale aké množstvásčítavajú sa tieto údaje, aby mali taký vplyv? Čo je napríklad „štatisticky významné“? Čo presne znamená táto definícia?
Čo je toto?
Štatistika ako veda sa skladá z kombinácie rôznych veličín a pojmov. Jedným z nich je pojem „štatistická významnosť“. Toto je názov hodnoty premenných, pričom pravdepodobnosť výskytu iných ukazovateľov je zanedbateľná.
Napríklad 9 z 10 ľudí si obuje na nohy gumené topánky počas rannej prechádzky na huby v jesennom lese po daždivej noci. Pravdepodobnosť, že si niekedy 8 z nich navlečie plátené mokasíny, je mizivá. V tomto konkrétnom príklade je teda číslo 9 to, čo sa nazýva „štatistická významnosť“.
Podľa toho, ak uvedený praktický príklad ďalej rozvinieme, predajne obuvi nakupujú gumáky do konca letnej sezóny vo väčšom množstve ako inokedy počas roka. Veľkosť štatistickej hodnoty má teda vplyv na bežný život.
Pri zložitých výpočtoch, povedzme, pri predpovedaní šírenia vírusov sa samozrejme berie do úvahy veľké množstvo premenných. Ale samotná podstata určovania významného ukazovateľa štatistických údajov je podobná, bez ohľadu na zložitosť výpočtov a počet premenných hodnôt.
Ako sa vypočítava?
Používa sa pri výpočte hodnoty ukazovateľa „štatistickej významnosti“rovnice. To znamená, že možno tvrdiť, že v tomto prípade o všetkom rozhoduje matematika. Najjednoduchšou možnosťou výpočtu je reťazec matematických operácií, v ktorom sú zahrnuté nasledujúce parametre:
- dva typy výsledkov získaných z prieskumov alebo štúdia objektívnych údajov, ako je množstvo nákupov, označené písmenami aab;
- indikátor veľkosti vzorky pre obe skupiny – n;
- hodnota kombinovaného podielu vzorky - p;
- štandardná chyba – SE.
Ďalším krokom je určenie celkového skóre testu – t, jeho hodnota sa porovná s číslom 1,96.
Často vyvstáva otázka, aký je rozdiel medzi hodnotami n a p. Túto nuanciu je ľahké objasniť príkladom. Povedzme, že sa vypočíta štatistická významnosť lojality k akémukoľvek produktu alebo značke mužov a žien.
V tomto prípade budú za písmenami nasledovať nasledovné:
- n – počet respondentov;
- p - počet spokojných s produktom.
Počet opýtaných žien v tomto prípade bude označený ako n1. V súlade s tým muži - n2. Rovnaká hodnota bude mať čísla "1" a "2" symbolu p.
Porovnanie skóre testu s priemerom študentských tabuliek sa stáva tým, čo sa nazýva „štatistická významnosť“.
Čo znamená overenie?
Výsledky akéhokoľvek matematického výpočtu sa dajú vždy skontrolovať, učia sa to deti na základnej škole. Je logické predpokladaťže keďže sa štatistiky určujú pomocou reťazca výpočtov, potom sa kontrolujú.
Testovanie štatistickej významnosti však nie je len matematika. Štatistika sa zaoberá veľkým množstvom premenných a rôznych pravdepodobností, ktoré sa ani zďaleka nedajú vždy vypočítať. Totiž, ak sa vrátime k príkladu gumených topánok na začiatku článku, tak logickú konštrukciu štatistických údajov, o ktoré sa budú nákupcovia tovaru pre obchody spoliehať, môže narušiť suché a horúce počasie, ktoré nie je typické pre jeseň.. V dôsledku tohto javu sa zníži počet ľudí nakupujúcich gumené čižmy a predajne utrpia straty. Samozrejme, matematický vzorec nie je schopný predvídať anomáliu počasia. Tento moment sa nazýva „chyba“.
To je len pravdepodobnosť takýchto chýb a berie do úvahy kontrolu hladiny vypočítanej významnosti. Zohľadňuje vypočítané ukazovatele a akceptované úrovne významnosti, ako aj veličiny bežne nazývané hypotézy.
Aká je úroveň významnosti?
Pojem „úroveň“je zahrnutý medzi hlavné kritériá štatistickej významnosti. Používa sa v aplikovanej a praktickej štatistike. Ide o druh hodnoty, ktorá zohľadňuje pravdepodobnosť možných odchýlok alebo chýb.
Úroveň je založená na identifikácii rozdielov v hotových vzorkách, umožňuje stanoviť ich významnosť alebo naopak náhodnosť. Tento pojem má nielen digitálne významy, ale aj ich zvláštne interpretácie. Vysvetľujúako potrebujete pochopiť hodnotu a samotná úroveň je určená porovnaním výsledku s priemerným indexom, čo odhaľuje stupeň spoľahlivosti rozdielov.
Pojem úroveň si teda môžeme predstaviť jednoducho - je to indikátor prijateľnej, pravdepodobnej chyby alebo chyby v záveroch vyvodených zo získaných štatistických údajov.
Aké úrovne významnosti sa používajú?
Štatistická významnosť koeficientov pravdepodobnosti chýb v praxi je založená na troch základných úrovniach.
Prvá úroveň je hranica, pri ktorej je hodnota 5 %. To znamená, že pravdepodobnosť chyby nepresiahne hladinu významnosti 5 %. To znamená, že dôvera v bezchybnosť a neomylnosť záverov urobených na základe štatistických výskumných údajov je 95 %.
Druhou úrovňou je hranica 1 %. V súlade s tým tento údaj znamená, že sa možno riadiť údajmi získanými počas štatistických výpočtov s 99% istotou.
Tretia úroveň – 0,1 %. Pri tejto hodnote sa pravdepodobnosť chyby rovná zlomku percenta, to znamená, že chyby sú prakticky vylúčené.
Čo je to hypotéza v štatistike?
Chyby ako koncept sú rozdelené do dvoch oblastí, týkajúcich sa prijatia alebo zamietnutia nulovej hypotézy. Hypotéza je pojem, za ktorým sa podľa definície skrýva súbor výsledkov prieskumu, iných údajov alebo tvrdení. Teda popis rozdelenia pravdepodobnosti niečoho, čo súvisí s predmetom štatistického účtovníctva.
V jednoduchých výpočtoch existujú dve hypotézy – nulová a alternatívna. Rozdiel medzi nimi je v tom, že nulová hypotéza je založená na myšlienke, že medzi vzorkami zapojenými do určovania štatistickej významnosti neexistujú zásadné rozdiely a alternatívna hypotéza je jej úplne opačná. To znamená, že alternatívna hypotéza je založená na prítomnosti významného rozdielu v týchto vzorkách.
Aké sú chyby?
Chyby ako pojem v štatistike sú priamo úmerné akceptovaniu tej či onej hypotézy ako pravdivej. Môžu byť rozdelené do dvoch smerov alebo typov:
- prvý typ je spôsobený prijatím nulovej hypotézy, ktorá sa ukázala ako nesprávna;
- sekunda – spôsobené sledovaním alternatívy.
Prvý typ chyby sa nazýva falošne pozitívny a je celkom bežný vo všetkých oblastiach, kde sa používajú štatistiky. Preto sa chyba druhého typu nazýva falošne negatívna.
Prečo potrebujeme regresiu v štatistikách?
Štatistická významnosť regresie spočíva v tom, že pomocou nej je možné zistiť, nakoľko model rôznych závislostí vypočítaný na základe údajov zodpovedá skutočnosti; vám umožňuje identifikovať dostatok alebo nedostatok faktorov pre účtovníctvo a závery.
Regresná hodnota je určená porovnaním výsledkov s údajmi uvedenými vo Fisherových tabuľkách. Alebo pomocou analýzy rozptylu. Regresné ukazovatele sú dôležité prikomplexné štatistické štúdie a výpočty zahŕňajúce veľké množstvo premenných, náhodných údajov a pravdepodobných zmien.