Hüpoteesi testimine

Lihtne ja lühike õpetus hüpoteesi testimise kohta Pythoni abil

Pilt saidilt: http://www.advanceinnovationgroup.com/blog/median-based-hypothesis-testing

Selles blogis annan lühikese õpetuse hüpoteesi testimisest, kasutades Pythoni statistilisi meetodeid. Hüpoteesi testimine on osa teaduslikust meetodist, millega me kõik oleme tuttavad, midagi, mida me ilmselt õppisime oma varajastel haridusaastatel. Kuid statistikas tehakse populatsiooni valimi osas palju katseid.

„Selleks, et määratleda, mida vaatlusvalimite komplekt meile pakutud seletuse kohta ütleb, on üldjuhul vaja teha järeldused, või nagu me statistikud seda nimetame, ebakindluse põhjuseks. Ebakindlusega põhjendamine on statistiliste järelduste tuum ja seda tehakse tavaliselt meetodi abil, mida nimetatakse nullhüpoteesi olulisuse testimiseks. ” - Ahjud.

Selle ajaveebi näitena kasutan Kaggle'ist leitud Euroopa jalgpalliandmete komplekti ja viin läbi hüpoteesi testimist. Andmekogumi leiate siit.

Samm 1

Tehke tähelepanek

Esimene samm on nähtuste vaatlemine. Sel juhul on see järgmine: Kas kaitsealarünnaku mõju on keskmiselt lubatud eesmärkidel?

2. samm

Uurige uurimistööd

Hea mõtteviis on töö targem, mitte raskem. Üks hea asi on näha, kas teie vaatlusega seotud uuringud on juba olemas. Kui jah, võib see aidata meie küsimusele vastata. Juba olemasolevate teadusuuringute või katsete teadmine aitab meil oma katset paremini struktureerida või võib-olla isegi vastata meie küsimusele ega pea eksperimenti läbi viima.

3. samm

Moodustage nullhüpotees ja alternatiivne hüpotees

Alternatiivne hüpotees on meie haritud oletus ja nullhüpotees on lihtsalt vastupidine. Kui alternatiivse hüpoteesi kohaselt on kahe muutuja vahel oluline seos, siis nullhüpoteesi kohaselt puudub oluline seos.

Meie nullhüpotees on järgmine: Meeskondadel, kelle kaitsealane agressiivsus on vähemalt 65 või suurem, ei ole lubatud eesmärkide erinevust, võrrelduna alla 65-aastaste meeskondadega.

Alternatiivne hüpotees: meeskondadel, kelle kaitsealane agressiivsus on vähemalt 65 või alla selle, on lubatud eesmärkides lubatud statistiline erinevus, võrreldes 65-aastaste võistkondadega.

4. samm

Tehke kindlaks, kas meie hüpotees on ühe- või kahepoolne test.

Ühesuunaline test

"Kui kasutate olulisuse taset 0,05, võimaldab ühepoolne test kõigil teie alfa-liikmetel statistilist olulisust ühes huvipakkuvas suunas testida." Ühepoolse testi näide on "Jalgpallimeeskonnad, kelle agressiivsuse reiting on alla 65, lubavad statistiliselt oluliselt rohkem eesmärke kui meeskonnad, kelle reiting on alla 65."

Kahe sabaga test

„Kui kasutate olulisuse taset 0,05, võimaldab kahepoolne test pooltel alfadest testida statistilist olulisust ühes suunas ja poolel alfadel statistilise olulisuse kontrollimiseks teises suunas. See tähendab, et 0,025 on teie testi statistika jaotuse igas sabas. ”

Kahepoolse testiga katsetate statistilist olulisust mõlemas suunas. Meie puhul testime statistilist olulisust mõlemas suunas.

5. samm

Määrake olulisuse läve tase (alfa)

(alfa väärtus): piirväärtus, mille juures nullhüpoteesi tagasilükkamisega on meil kõik korras. Alfaväärtuseks võib olla mis tahes väärtus, mille seame vahemikku 0 kuni 1. Kuid kõige levinum alfa väärtus teaduses on 0,05. Kui väärtuseks 0,05 on alfa, tähendab see, et nullhüpoteesi lükkame meiega õigesti, isegi kui on 5% või vähem tõenäosus, et tulemused on tingitud juhuslikkusest.

P-väärtus: nende andmete juhusliku saabumise arvutatud tõenäosus.

Kui arvutame p-väärtuse ja see tuleb 0,03, võime seda tõlgendada nii, et öeldakse: "On 3% tõenäosus, et tulemused, mida ma näen, on tegelikult juhuslikkuse või puhta õnne tulemus".

Pilt saidil Learn.co

Meie eesmärk on arvutada p-väärtus ja võrrelda seda meie alfa-ga. Mida madalam on alfa, seda rangem on test.

6. samm

Tehke proovivõtt

Siin on meie andmekogu jalgpall. Testi jaoks on meie andmekogumis vaja ainult kahte veergu: team_def_aggr_rating ja goals_allowed. Filtreerime selle välja nende kahe veeru järgi ja loome seejärel kaks alamrühma meeskondadele, kelle kaitsealase agressiivsuse reiting on vähemalt 65 või võrdne, ja meeskondadele, kelle kaitsealase agressiooni reiting on alla 65.

Meenutame lihtsalt hüpoteesikatset:

Kaitsealase agressiooni mõju keskmiselt lubatud eesmärkidele. Nullhüpotees: võistkondadel, mille kaitsealane agressiivsus on üle 65 või sellega võrdne, ei ole statistilisi erinevusi eesmärkides, võrreldes 65-aastaste meeskonnaga, kelle kaitsealane agressiivsus on kõrgem. Alternatiivne hüpotees: kõrgema kaitsealase agressiivsuse reitinguga meeskondade lubatud eesmärkide eesmärk on erinev vähem kui 65 või vähem kui 65-aastased võistkonnad. Kahepoolne testalfa: 0,05

Nüüd on meil kaks proovide loendit, millega saame statistilisi teste läbi viia. Enne seda sammu joonistan visuaalse pildi saamiseks kaks jaotust.

7. samm

Tehke kaheprooviline T-test

Kahe valimi t-testi kasutatakse selleks, et teha kindlaks, kas kahe populatsiooni keskmine on võrdne. Selleks kasutame Pythoni moodulit nimega statsmodels. Ma ei hakka statsmodellide osas liiga detailselt laskma, aga dokumente näete siit.

8. samm

Hinnake ja tehke järeldus

Tuletame meelde, et meie seatud alfa oli a = 0,05. Nagu meie katsetulemustest näeme, on p-väärtus väiksem kui meie alfa. Võime oma nullhüpoteesi tagasi lükata ja nõustuda oma alternatiivse hüpoteesiga 95% kindlusega.

Aitäh, et lugesite! Hüpoteeside testimise kohta saate põhjalikumat teavet selle GitHubi grupiprojekti kohta, millest ma siin osalesin.

Ressursid:

Ahjud, Matthew. „Statistika ja“ teaduslik meetod ”on hangitud saidist YourStatsGuru. https://www.yourstatsguru.com/secrets/scimethod-stats/?v=4442e4af0916

Sissejuhatus SAS-i. UCLA: statistikaalane nõustamisrühm. saidilt https://stats.idre.ucla.edu/other/mult-pkg/faq/general/faq-what-are-the-differences-between-one-tailed-and-two-tailed-tests/ (juurde pääseb mais 16, 2019).

Inseneristatistika käsiraamat. https://www.itl.nist.gov/div898/handbook/eda/section3/eda353.htm