Traustleiki dreifigreiningar Forsendur dreifigreiningar

Tölfræðileg próf sem notuð eru til að prófa tilgátur, byggja yfirleitt á tilteknum forsendum um þýðið sem úrtakið er fengið úr. Tvær helstu forsendur dreifigreiningar eru þær að gert er ráð fyrir að gögnin komi úr normaldreifðu og einsleitu þýði. Frávillingar skipta líka máli því þeir skemma bæði normaldreifingu og einsleitni.

Normaldreifing leifar. Til að hægt sé að reikna marktektarpróf þarf dreifing helst að vera normaldreifð í hverju hólfi frumbreytunnar, því þetta endurspeglar normaldreifingu leifar. Frávik frá normaldreifingu hefur misjöfn áhrif á afköst og höfnunarmistök: Ef dreifing víkur frá normaldreifingu, minnka afköst dreifigreiningar. Á hinn bóginn hefur skekkja í dreifingu ein og sér, lítil áhrif á höfnunarmistök. En ef skekkjunni fylgja frávillingar eða misleitni í hólfum, þá magnast höfnunarmistök einnig.

Einsleitni leifar. Misleitni dreifingar er alvarlegra vandamál en frávik frá normaldreifingu. Vandinn fer þó mikið eftir því hve mjög dreifingin víkur frá því að vera einsleit. Misleitni hefur neikvæð áhrif á afköst og dregur úr þeim. Misleitni getur einnig aukið líkur á höfnunarmistökum, en það fer þó eftir því hvort lítil dreifing er í fjölmennu eða fámennu hólfunum. Í heildina er dreifigreining þó mjög traust gagnvart litlum og meðalstórum frávikum frá einsleitni í hólfum. Þumalputtaregla er að hlutfallið milli stærsta og minnsta staðalfráviks í hólfum sé ekki meira en tvöfalt.

Frávillingar. Gert er ráð fyrir því að ekki séu frávillingar í gögnum. Þeir bæði draga úr afköstum og auka höfnunarmistök dreifigreiningar.

Hægt er að finna frávillinga, kanna frávik frá normaldreifingu og athuga misleitni í hólfum með myndrænni framsetningu gagna. Hafa kassarit reynst sérlega vel í þessu sambandi. Auk þess er hægt að fá tölulegar upplýsingar um einsleitni dreifingar með því að reikna þar til gerð marktektarpróf, svo sem Levens marktektarpróf.

Jafn fjöldi í hólfum. Gerður er greinarmunur á dreifigreiningu með jafnan fjölda í hólfum (balanced ANOVA) og ójafnan fjölda (unbalanced ANOVA). Jafn fjöldi í hólfum er talinn draga úr hættu á auknum höfnunarmistökum þegar misleitni er til staðar en heimildum ber þó ekki saman um þetta. Ójafn fjöldi í hólfum hefur yfirleitt neikvæð áhrif á afköst nema þegar jaðargildin eru í fjölmennustu hólfunum.