Vefverkefni Frávillingar (öfgagildi, outliers)

Öfgagildi (útlagi, frávillingur, outlier) er mæligildi sem er mjög óvenjulegt í samanburði við önnur mæligildi í sama gagnasafni og ástæður fyrir öfgagildum eru ekki alltaf þær sömu. Ef öfgagildi eru í gögnum geta bæði lýsandi tölfræði og ályktunar tölfræði gefið mjög villandi mynd. Rannsóknir snúast iðulega um samanburð meðaltala og niðurstaða verður mjög villandi þegar meðaltal er ekki lýsandi fyrir hóp. Eins og á við um áhrif öfgagilda á meðaltöl geta þau líka haft veruleg áhrif á staðalfrávik og á það sérstaklega við ef úrtök eru lítil. Þar sem staðalvilla byggir m.a. á staðalfráviki hafa öfgagildi einnig áhrif á staðalvilluna.

Þegar ályktað er um þýðið er verið að búa til líkan af því. Öfgagildi í gagnasafni geta haft þau áhrif að líkanið verður skekkt og getur það rýrt traustleika niðurstaðna. Frávillingar geta haft áhrif á niðurstöður aðfallsgreiningar, svo sem forspárjöfnu, sérstaklega í litlum úrtökum. Dreifigreining er einnig næm fyrir frávillingum og getur aðeins einn slíkur eyðilagt niðurstöður en í dreifigreiningu er verið að meta mun á meðaltölum.

Við mat á fráviksgildum er gott að teikna myndrit. Á þeim verða frávillingar augljósari en með talnagildum.

Eins og fram hefur komið minnka öfgagildi traustleika niðurstaðna og á það sérstaklega við ef úrtök eru lítil. Nauðsynlegt gæti reynst að fjarlægja þau úr gögnum til að auka traustleika, einkum þegar úrtak er smátt. Það ætti þó aldrei að fjarlægja öfgagildi úr gögnum, bara vegna þess að þau eru öfgagildi. Þau gætu verið mikilvægur hluti gagnasafns.