8. Ályktanir um talnabreytur
Í þessum kafla munum við skoða aðferðir til að kanna ályktanir um meðaltöl og dreifni talnabreyta. Tilgátur rannsakenda miðast oft að því að því að kanna meðaltöl, oftar en ekki að bera tvö meðaltöl saman. Áður en það er gert er þó ávallt gott (oft nauðsynlegt) að kanna hvort breytileiki í þýðunum/breytunum sem við erum að rannsaka sé svipaður.
Við byrjum á að kanna mun á dreifni í tveimur (var.test()
) eða
fleiri normaldreifðum þýðum (bartlett.test()
). Við vindum okkur svo
í að framkvæma tilgátupróf og smíða öryggisbil fyrir meðaltöl í einu eða
tveimur þýðum. Ef úrtak er nægjanlega stór má ætíð framkvæma slík próf
með z-prófi og sé úrtakið lítið má nota t-próf ef breytan er
normaldreifð. T-prófið er íhaldssamara en z-prófið, þ.e.a.s. ef við
framkvæmum bæði t-próf og z-próf á sömu gögnunum þá mun t-prófið
hafa minni villulíkur. Því er hægt að réttlæta notkun t-prófs alltaf
þegar skilyrði fyrir z-próf eru uppfyllt. Gætið ykkar að það gildir ekki
í hina áttina. Því eru t-próf innbyggð í flest tölfræðiforrit, þar með
talið R, en z-próf eru minna notuð. Viljum við kanna meðaltöl í fleirum
en tveimur þýðum er það gert með einþátta fervikagreiningu en hún er
umfjöllunarefni kafla 9.
8.1. Ályktanir um dreifni
8.1.1. Dreifni í tveimur þýðum
8.1.1.1. var.test()
Athugið
Inntak: nöfn á tveimur talnabreytum eða nafn á talnabreytu og flokkabreytu
Úttak: gildi á prófstærð, p-gildi, öryggisbil og fleira
Helstu stillingar: alternative, conf.level
Við mötum var.test()
aðferðina á mismunandi hátt eftir því hvort
gögnin okkar séu á löngu eða víðu sniði (sjá kafla 2.7).
Algengast er að gögn séu á löngu sniði en þá inniheldur ein breyta
mælingar á talnabreytunni og gildin á annarri breytu gefa til kynna
hvaða hópi hver og ein mæling tilheyrir. Hins vegar geta gögnin verið á
víðu sniði þar sem búið er að skipta talnabreytunni upp í tvær breytur,
eina fyrir hvorn hóp.
Gerum nú ráð fyrir að við höfum normaldreifða breytu mælda í tveimur
þýðum og látum \(\sigma_1^2\) tákna dreifni þýðis 1 og
\(\sigma_2^2\) tákna dreifni þýðis 2. Gerum fyrst ráð fyrir að
mælingarnar séu vistaðar á víðu sniði, í breytunum
breyta1
og breyta2
. Til að kanna hvort dreifni þýðanna sé mismunandi
notum við:
var.test(breyta1,breyta2)
Ef við erum aftur á móti með mælingarnar okkar á löngu sniði þar sem
mælingarnar okkar eru geymdar í breytunni maeling
og flokkabreytan
(hopur
) inniheldur gildi sem gefa til kynna í hvaða flokki
mælingarnar tilheyra mötum við aðferðina með:
var.test(maeling~hopur)
Núlltilgátan er: \(H_0: \sigma^2_1 = \sigma^2_2\), en með
stillingunni alternative
ráðum við gagntilgátunni.
stilling |
gagntilgáta |
---|---|
alternative=“two.sided” |
\(H_1: \sigma^2_1 \neq \sigma^2_2\) |
alternative=“greater” |
\(H_1: \sigma^2_1 > \sigma^2_2\) |
alternative=“less” |
\(H_1: \sigma^2_1 < \sigma^2_2\) |
Viljum við kanna hvort dreifni í púls sé mismunandi á milli kynjanna gerum við það með (takið eftir að gögnin eru á löngu sniði):
var.test(puls$fyrriPuls~puls$kyn)
##
## F test to compare two variances
##
## data: puls$fyrriPuls by puls$kyn
## F = 1.2512, num df = 293, denom df = 159, p-value = 0.1155
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
## 0.9461411 1.6360633
## sample estimates:
## ratio of variances
## 1.251186
Úr úttakinu má lesa m.a. eftirfarandi:
Gildið á prófstærðinni: \(f\) = 1.2512
p-gildið: 0.1155
Öryggisbilið: 95 percent confidence interval: \([0.9461411, 1.6360633]\)
Við sjáum að p-gildið er hátt svo við höfnum ekki núlltilgátunni (m.v. \(\alpha = 0.05\)) og drögum því enga ályktun. Við sjáum líka að 95% öryggisbil fyrir hlutfallið á dreifninni er \([0.9461411, 1.6360633]\). Hlutlausa ástandið er að hlutfallið sé 1 (því þá er dreifnin jöfn í báðum hópum) og þar sem öryggisbilið inniheldur töluna 1 höfnum við ekki núlltilgátunni í samræmi við það sem p-gildið segir.
8.1.2. Dreifni í fleiri þýðum
8.1.2.1. bartlett.test()
Athugið
Inntak: nöfn á talnabreytu og flokkabreytu
Úttak: gildi á prófstærð, p-gildi, öryggisbil og fleira
Helstu stillingar:
Þegar þýðin/hóparnir eru fleiri en tveir má nota bartlett.test()
aðferðina. Við þurfum að mata aðferðina með vigri sem inniheldur
mælingarnar okkar og annan vigur sem tilgreinir hvaða hópi mælingarnar
tilheyra. Við notum svo bartlett.test()
aðferðina til að kanna hvort
munur sé á dreifni hópanna. Við mötum aðferðina með
bartlett.test(maeling ~ hopur)
Viljum við kanna hvort dreifnin er ólík í púlsmælingum í líkamsræktarhópunum þremur gerum við það með:
bartlett.test(puls$fyrriPuls ~ puls$likamsraektf)
##
## Bartlett test of homogeneity of variances
##
## data: puls$fyrriPuls by puls$likamsraektf
## Bartlett's K-squared = 4.1246, df = 2, p-value = 0.1272
Við sjáum að gildið á prófstærðinni er \(4.1246\) og p-gildið er \(0.1272\). P-gildið er hærra en 0.05 og því getum við ekki ályktað að dreifnin sé misjöfn í hópunum.
8.2. Ályktanir um meðaltöl
8.2.1. Ályktanir um meðaltöl
8.2.1.1. t.test()
Athugið
Inntak: nöfn á einni eða tveimur talnabreytum eða nafn á talnabreytu og flokkabreytu
Úttak: gildi á prófstærð, p-gildi, öryggisbil og fleira
Helstu stillingar: paired, mu, alternative, conf.level
T-próf eru framkvæmd með skipuninni t.test()
. Hana má nota nota til
að draga ályktanir um meðaltöl eins þýðis, samanburð tveggja þýða jafnt
og samanburð paraðra mælinga, allt eftir því á hverju hún er mötuð og
hvaða stillingar eru gefnar. Fyrst munum við sjá hvernig skipunin er
notuð til að draga ályktanir um meðaltal þýðis. Að því loknu sjáum við
hvernig við berum saman meðaltöl tveggja þýða og að lokum berum við
saman paraðar mælingar.
8.2.2. Ályktanir um eitt meðaltal
Þegar skipunin t.test()
er mötuð með einungis einni breytu
framkvæmir hún t-próf fyrir eitt meðaltal. Aðrar stillingar eru:
mu
: Við prófum tilgátuprófið \(H_0: \mu =\)mu
.mu
er því viðmiðunargildi núlltilgátunnar.alternative
: Við gefum skipuninaalternative="two.sided"
ef gagntilgátan er tvíhliða,alternative="greater"
ef gagntilgátan er \(\mu > \mu_0\) ogalternative="less"
ef gagntilgátan er \(\mu < \mu_0\). Sjálfgefið er að hafa tvíhliða gagntilgátu.conf.level
: Þar tilgreinum við hvert öryggið (og þá um leið villulíkurnar) á að vera fyrir tilgátuprófið og öryggisbilið. Sjálfgefið er að hafa öryggið \(1-\alpha\) = 0.95.
Sjálfgefið er að kanna núlltilgátuna: \(H_0: \mu=0\). Slíkur
samanburður er óáhugaverður ef við viljum t.d. kanna fyrri púls nemenda
því vonandi voru nemendurnir ekki dauðir úr öllum æðum á þeim
mánudagsmorgnum sem tilraunin var framkvæmd. Könnum frekar hvort púlsinn
sé frábrugðinn 70 og tilgreinum það með stillingunni mu
.
t.test(puls$fyrriPuls,mu=70)
##
## One Sample t-test
##
## data: puls$fyrriPuls
## t = 3.5612, df = 453, p-value = 0.0004082
## alternative hypothesis: true mean is not equal to 70
## 95 percent confidence interval:
## 70.88843 73.07633
## sample estimates:
## mean of x
## 71.98238
Í úttakinu eru fólgnar gífurlegar upplýsingar. Við fáum:
Prófstærðina: t = 3.5612
Fjölda frígráða: 453
p-gildið: \(4.0820624\times 10^{-4}\)
Öryggisbilið, með örygginu tilgreindu: 95 percent confidence interval: \([70.8884,73.0763]\)
Úrtaksmeðaltalið: mean of x 71.9824
8.2.3. Ályktanir um mismun tveggja meðaltala
Þegar draga á ályktanir um mismun meðaltala tveggja þýða \(\mu_1-\mu_2\) og þegar framkvæma á tilgátupróf fyrir paraðar mælingar geta gögnin okkar verið á mismunandi formi. Annars vegar geta gögnin verið á löngu sniði, þar sem að ein breyta inniheldur mælingarnar á talnabreytunni og önnur breyta tilgreinir hvaða hópi hver og ein mæling tilheyrir. Algengast er að gögn séu geymd á slíku sniði og eru púlsgögnin dæmi. Hins vegar geta gögnin verið á víðu sniði þar sem búið er að skipta talnabreytunni upp í tvær breytur, eina fyrir hvorn hóp.
Við mötum t.test()
aðferðina á mismunandi vegu eftir því á hvaða
sniði gögnin eru. Enn fremur er hægt að gefa eftirfarandi stillingar
mu
: Við prófum tilgátuprófið \(H_0: \mu_1 - \mu_2 =\)mu
.mu
er því viðmiðunargildi núlltilgátunnar.conf.level
: Þar tilgreinum við hvert öryggið (og þá um leið villulíkurnar) á að vera fyrir tilgátuprófið og öryggisbilið. Sjálfgefið er að hafa öryggið \(1-\alpha\) = 0.95.alternative
: Við gefum skipuninaalternative="two.sided"
ef gagntilgátan er tvíhliða,alternative="greater"
ef gagntilgátan er \(\mu_1 - \mu_2 > \delta\) ogalternative="less"
ef gagntilgátan er \(\mu_1 - \mu_2 < \delta\). Sjálfgefið er að hafa tvíhliða gagntilgátu.
Segjum sem svo að við viljum bera saman fyrri púls nemenda eftir kynjum. Þar sem púls gögnin eru á löngu sniði gefum við skipunina:
t.test(puls$fyrriPuls~puls$kyn)
##
## Welch Two Sample t-test
##
## data: puls$fyrriPuls by puls$kyn
## t = 2.6808, df = 358.94, p-value = 0.007684
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## 0.8000951 5.2065375
## sample estimates:
## mean in group kvk mean in group kk
## 73.04082 70.03750
Í úttakinu eru fólgnar gífurlegar upplýsingar. Við fáum:
Prófstærðina: t = 2.6808
Fjölda frígráða: 358.9407899
p-gildið: 0.0076844
Öryggisbilið, með örygginu tilgreindu: 95 percent confidence interval: \([0.8001,5.2065]\)
Úrtaksmeðaltölin: 73.0408, 70.0375
Séu gögnin á víðu sniði er t.test()
mötuð með breytunum tveimur sem
bera á saman. Í þessu tilviki komum við púlsgögnunum á vítt snið með
aðstoð skipunarinnar spread()
, sem kynnt var í kassa
2.7.1.4.
pulsvid <- spread(puls, kyn, fyrriPuls)
Hérna framkvæmum við sama t-prófið með skipuninni:
t.test(pulsvid$kvk, pulsvid$kk)
##
## Welch Two Sample t-test
##
## data: pulsvid$kvk and pulsvid$kk
## t = 2.6808, df = 358.94, p-value = 0.007684
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## 0.8000951 5.2065375
## sample estimates:
## mean of x mean of y
## 73.04082 70.03750
8.2.4. Ályktanir um mismun fleiri meðaltala
Eins og fjallað hefur verið um má nota z- og t-próf til að kanna mun á meðaltölum í tveimur þýðum. Viljum við kanna mun á meðaltölum í fleiri en tveimur þýðum notum við einþátta fervikagreiningu en hún er umfjöllunarefni kafla 9.
8.2.5. Ályktanir um mismun meðaltala paraðra mælinga
Þegar t-próf er framkvæmt fyrir mismun paraðra mælinga er skipunin
t.test()
mötuð með stillingunni:
paired=TRUE
Annars er skipunin mötuð á nákvæmlega sama hátt og í kafla 8.2.3 þegar borin eru saman tvö meðaltöl.
Þegar t-próf er framkvæmt til að bera saman mismun paraðra mælinga er enn fremur hægt að gefa aðferðinni eftirfarandi stillingar:
mu
: Við prófum tilgátuprófið \(H_0: \mu_d=\)mu
.mu
er því viðmiðunargildi núlltilgátunnar.conf.level
. Þar tilgreinum við hvert öryggið (og þá um leið villulíkurnar) á að vera fyrir tilgátuprófið og öryggisbilið. Sjálfgefið er að hafa öryggið \(1-\alpha\) = 0.95.alternative
: Við gefum skipuninaalternative=”two.sided”
ef gagntilgátan er tvíhliða,alternative=”greater”
ef gagntilgátan er \(\mu_d > \delta\) ogalternative=”less”
ef gagntilgátan er \(\mu_d < \delta\). Sjálfgefið er að hafa tvíhliða gagntilgátu.conf.level
: Þar tilgreinum við hvert öryggið (og þá um leið villulíkurnar) á að vera fyrir tilgátuprófið og öryggisbilið. Sjálfgefið er að hafa öryggið \(1-\alpha\) = 0.95.
Í púlsgögnunum liggur beint við að bera saman fyrri og seinni púls þeirra nemenda sem að hlupu í eina mínútu. Einnig væri áhugavert að kanna mun á fyrri og seinni. Byrjum á því að búa til tvær minni gagnatöflur, eina fyrir þá nemendur sem hlupu og aðra fyrir þá sem hlupu ekki.
pulshljop <- filter(puls, inngrip=='hljop')
pulskyrr<- filter(puls, inngrip=='sat_kyrr')
Könnum tilgátuna að púlsinn sé frábrugðinn fyrir og eftir krónukastið fyrir þá sem hlupu. Athugið að núna eru pöruðu mælingarnar tvær geymdar í tveimur dálkum og því eru gögnin á víðu sniði með því tilliti. Því mötum við skipunina á eftirfarandi hátt:
t.test(pulshljop$fyrriPuls, pulshljop$seinniPuls, paired=TRUE)
##
## Paired t-test
##
## data: pulshljop$fyrriPuls and pulshljop$seinniPuls
## t = -19.421, df = 179, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -28.40310 -23.16357
## sample estimates:
## mean of the differences
## -25.78333
Í úttakinu sjáum við:
Prófstærðina: t = \(-19.421\)
Fjölda frígráða: 179
p-gildið: \(6.1948544\times 10^{-46}\)
Öryggisbilið, með örygginu tilgreindu: 95 percent confidence interval: \(-28.4031\), \(-23.1636\)
Úrtaksmeðaltal mismunanna: mean of the differences \([-28.4031,-23.1636]\)
Við höfnum því núlltilgátunni og fullyrðum að munur sé á fyrri og seinni púls þeirra nemenda sem hlupu í eina mínútu.
Berum því næst saman púls þeirra nemenda sem sátu kyrrir á meðan hinir púluðu.
t.test(pulskyrr$fyrriPuls, pulskyrr$seinniPuls, paired=TRUE)
##
## Paired t-test
##
## data: pulskyrr$fyrriPuls and pulskyrr$seinniPuls
## t = -0.22089, df = 273, p-value = 0.8253
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -0.7597236 0.6064389
## sample estimates:
## mean of the differences
## -0.07664234
Hér er p-gildið \(0.825344\) og þar af leiðandi getum við ekki hafnað núlltilgátunni og megum því ekki draga ályktanir út frá tilgátuprófinu. Við megum þó ekki gleyma því að heilmiklar upplýsingar eru fólgnar í öryggisbilinu fyrir mismun mælinganna. Öryggisbilið er \([-0.7597,0.6064]\) svo við getum fullyrt með 95% vissu að púlsinn hafi ekki minnkað um meira en \(-0.7597\) slög á mínútu og ekki hækkað um meira en \(0.6064\) slög á mínútu. Við getum því hæglega fullyrt að breyting púlsins sé innan við eitt slag á mínútu.
8.3. Levene próf fyrir dreifni\(^\ast\)
Ef gögnin okkar fylgja normaldreifingu er Bartlett prófið sem fjallað
var um hér að framan besta prófið að nota til að kanna hvort munur sé á
dreifni hópanna. Ef gögnin fylgja ekki normaldreifingu er betra að nota
svo kallað Levene-próf. Skipunin leveneTest()
sem tilheyrir car
pakkanum framkvæmir Levene próf.
8.4. Stikalaus próf\(^\ast\)
8.4.1. Stikalaus próf\(^\ast\)
Ef skilyrði þess að hægt sé að framkvæma t-próf eru ekki uppfyllt er í
sumum tilvikum hægt að nota stikalaus próf þeirra í stað. Algengasta
stikalausa prófið er Wilcox prófið sem hægt er framkvæma með skipuninni
wilcox.test()
.
8.4.1.1. wilcox.test()
Athugið
Inntak: nöfn á einni eða tveimur talnabreytum eða nafn á talnabreytu og flokkabreytu
Úttak: gildi á prófstærð, p-gildi
Helstu stillingar: paired, mu, alternative
Prófið má framkvæma til að kanna eitt miðgildi eða bera saman tvö
miðgildi og þá einnig fyrir paraðar mælingar. Skipunin er mötuð á sama
hátt og t.test()
. Gætið ykkar að stikalaus próf geta einnig verið
skilyrðum háð. Sem dæmi þá krefst óparaða Wilcox prófið þess að eini
munurinn á dreifingu breytanna tveggja sé hliðrun um fasta tölu og því á
það ekki við ef breytileiki breytanna er ólíkur.
Hér fyrir neðan má sjá sömu dæmi og hér að ofan framkvæmd með
wilcos.test()
:
wilcox.test(puls$fyrriPuls,mu=70)
##
## Wilcoxon signed rank test with continuity correction
##
## data: puls$fyrriPuls
## V = 51812, p-value = 0.003055
## alternative hypothesis: true location is not equal to 70
##
## Wilcoxon rank sum test with continuity correction
##
## data: puls$fyrriPuls by puls$kyn
## W = 26878, p-value = 0.01187
## alternative hypothesis: true location shift is not equal to 0
wilcox.test(pulshljop$fyrriPuls, pulshljop$seinniPuls, paired=TRUE)
##
## Wilcoxon signed rank test with continuity correction
##
## data: pulshljop$fyrriPuls and pulshljop$seinniPuls
## V = 8, p-value < 2.2e-16
## alternative hypothesis: true location shift is not equal to 0
wilcox.test(pulskyrr$fyrriPuls, pulskyrr$seinniPuls, paired=TRUE)
##
## Wilcoxon signed rank test with continuity correction
##
## data: pulskyrr$fyrriPuls and pulskyrr$seinniPuls
## V = 13897, p-value = 0.9758
## alternative hypothesis: true location shift is not equal to 0
8.5. Leiksvæði fyrir R kóða
Hér fyrir neðan er hægt að skrifa R kóða og keyra hann. Notið þetta svæði til að prófa ykkur áfram með skipanir kaflans. Athugið að við höfum þegar sett inn skipun til að lesa inn puls
gögnin sem eru notuð gegnum alla bókina.
# Gogn sott og sett i breytuna puls.
puls <- read.table ("https://raw.githubusercontent.com/edbook/haskoli-islands/main/pulsAll.csv", header=TRUE, sep=";")
# Setjid ykkar eigin koda her fyrir nedan:
# Sem daemi, skipunin head(puls) skilar fyrstu nokkrar radirnar i gognunum
# asamt dalkarheitum.
head(puls)