TölfræðiSpurt og svarað

Hér eru svör við nokkrum algengum spurningum nemenda í námskeiðinu. Þær eru lauslega flokkaðar eftir verkefnum og viðfangsefnum. Að jafnaði eru spurningarnar byggðar á raunverulegum spurningum frá nemendum, stundum lítillega breyttum.

Sökum breytinga á námskeiðsfyrirkomulagi eru spurningar sem ekki eiga við, t.d. spurningar um verkefni sem ekki eru hluti af námskeiðinu í ár.

Forverkefni

Hvað á að vera í inngangi?

Á inngangurinn að fjalla á fræðilegan hátt um málþroska og þ.a.l að vitna í hvað hefur verið sýnt fram á að hafi áhrif á málþroska? Eða á að koma fram í inngangi að við fengum þetta gagnasafn að láni og í hvaða tilgangi við fengum það að láni og að þetta sé nemendaverkefni (eins og okkur var sagt að gera í Tölfræði III) , eða eignum við okkur gagnasafnið og fjöllum um efnið í inngangi eins og við höfum gert þessa rannsókn (sem er þó frekar fáránlegt). Eða þá einn möguleikinn enn, á að vera fræðileg umfjöllun um dreifigreiningu í inngangi?

Síðan er það vandinn með aðferðina. Eina sem við vitum er fjöldi þátttakenda, hverjar breyturnar eru og hvað mælitæki var notað. Getum við nálgast fleiri upplýsingar einhversstaðar eða setjum við bara inn í aðferð að ekki sé vitað um hvernig rannsóknin var gerð o.fl.?

Síðan er það varðandi vísun í heimildir: Við eigum að setja heimild í heimildaskrá um hvar við fengum gagnasafnið. Setjum við linkinn þinn þ.e http://www.gba.is/cpad/verkefni/nursery.txt eða óvirka linkinn sem er á gagnasafnsblaðinu þ.e http://research.ed.asu.edu/siip/webdata/?

Ég held að þú verðir að tala dálítið um málþroska í inngangi en ekki samt mjög mikið. Það er ýmislegt sem þú veist, svo sem að málþroski sé mikilvægur og að það sé mikilvægt að vanda til umönnunar barna. Þau ykkar sem eruð nógu gömul munið kanski eftir umræðu frá því þegar D-listinn var síðast með borgina, þá voru sumir stjórnmálamenn sem töldu að betra væri fyrir börnin að vera heima en í daggæslu. Sú umræða er enn eldri, þ.e. hvort það sé rétt að vera heima og hugsa um eigin börn eða fara út af heimilinu og láta aðra annast um þau. Ég nefni þetta sem dæmi um samhengi sem svona gögn gætu tiltölulega sjálfkrafa farið inn í og er á valdi ykkar flestra/allra. Jafnvel þótt þú þekkir ekki þessa umræðu, hefur þú án efa töluverða bakgrunnsþekkingu til að setja þessi gögn í eitthvert samhengi.

En gerðu það fyrir mig, EKKI leita heimilda. Þú myndir væntanlega hafa ítarlega fræðilega umfjöllun með vísunum ef þú værir að rita verkefni um málþroska, en þótt þú þurfir að tala eitthvað svolítið um málþroska er það ekki meginviðfangsefni verkefnisins.

Inngangi er ætlað að styðja við Umræðu. Þú setur efni í Inngang til að skapa ramma um verkefnið en þó fyrst og fremst til að skapa samhengi fyrir Umræðuna. Þú vilt því eyða mestu púðrinu í Inngangi í það sem þú kemur til með að fjalla um í Umræðu. Um hvað verður Umræðan?

Í verkefnislýsingu er minnst á þrjár spurningar sem þarf að svara. Í stuttu máli snúast þær um (a) eiginleika gagna, (b) ályktanir og (c) traustleika niðurstaðna. Það þýðir væntanlega að þú þarft að undirbyggja þá umræðu. Það gerir þú í Inngangi. Af því leiðir að í innganginum þarf að öllum líkindum að vera umtalsverð tölfræðileg umræða. Ég gæti ímyndað mér að þar væri fjallað um hverjir séu helstu eiginleikar gagna, hvernig sé best að skoða þá, hvaða ályktanir má draga og hvernig og hvaða andstyggilegheit séu alvarlegust og hversu traust úrvinnsla sé gagnvart þeim. Ekki líta á þetta sem uppskrift, en geturðu fjallað um þessa hluti í Umræðu án þess að þeim hafi verið gerð skil í Inngangi?

Varðandi vísun í gagnasafnið, þá eru upplýsingar um vefvísanir á www.apastyle.org. Ef þú kemst ekki í skjalið, hvernig geturðu sagt til um hvernær það hafi verið sótt?

Varðandi Aðferð, þá geturðu eðlilega ekki sett inn upplýsingar sem þú hefur ekki. En þú hefur hins vegar fullt af upplýsingum. T.d. veistu að þetta er nemendaverkefni, veist hvernig gögnin eru fengin (frá kennaranum), hefur ákveðnar upplýsingar í gagnaskránni sjálfri, veist hvernig próf Peabody er; ég held að Aðferð verði ekki vandamál, þótt auðvitað gæti hún orðið efnisrýrari en hún væri ef þetta gögn aflað með þínum eigin höndum.

2006-09-09a

Dreifigreining sem línulegt líkan

Nú er ég að hefjast handa við línulega líkanið og er í vanda með syntax skrána. Það er að segja með að allar aðgerðir sem ég geri fari inn í syntaxið. Þegar þú sýndir þetta í tímanum þá fórst þú inn í einhverja valmynd og hakaðir við eitthvað til að allar aðgerðir vistuðust.

Þú opnar SPSS og ferð í Edit/Options. Þar geturðu hakað við Record syntax in journal. Veldu einnig Append þar fyrir neðan. Farðu síðan í Browse og vistaðu (dag)álinn (journal) á F-drifið hjá þér; þú lýkur þessu með því að smella á Save.

Upp frá þessu vistast allar aðgerðir í skrá sem venjulega heitir spss.jnl. Þú hefur valið að geyma hana á F-drifinu og því hefurðu alltaf aðgang að henni. Þetta getur verið gott ef þú vilt geta nálgast skipanirnar sem þú hefur verið að nota í gegnum valmyndirnar.

Önnur leið ekki síðri er að fara í valmynd, hvaða valmynd sem er. Gera það sem þú ætlar þér að gera en í stað þess að ýta í lokin á OK smellirðu á Paste. Þá kemur afrit af viðkomandi skipun í skipanagluggann (syntax window). Þannig geturðu safnað skipunum í skipanagluggann og keyrt þær þaðan. Í lokin geturðu síðan vistað alla skipanaskrána ýmist sem heimild eða til notkunar síðar.

Ég er að vinna að samanburðarkóðuninni. Er það ekki rétt skilið hjá mér að þar geta samanburðirðnir orðið jafn margir eða fleiri en flokkarnir? Ég er bara með þrjá flokka.

Samanburðirnir geta verið jafnmargir frígráðununum, þ.e. df= k-1. Í þínu tilfelli er k= 2 og því hefurðu tvo óháða samanburði til ráðstöfunar.

Má ég þá kóða með hvaða tölu sem er til að ná að leggja kóðana saman í 0? Ef einn kóðinn er t.d. 2 túlka ég þá þann stuðul sem kemur út á einhvern annan hátt en ef kóði væri 1? Samanburðarkóðunin er sem sagt að vefjast fyrir mér og Howell er ekki hjálplegur!

Það má nota hvaða vogtölu sem er en það er misauðvelt að túlka þær. Best er að nota vogtölur sem lýsa skýrt muni meðaltala eða muni á meðaltölum meðaltala. Ef þú notar t.d. samanburðinn [2 –1 –1] má deila í gegn með 2 og fá úr [1 –1/2 –1/2]. Í þeirri mynd er þetta greinilega samanburður á annars vegar fyrsta hópnum og hins vegar meðaltali hinna tveggja, þ.e. [X1 – 0,5*(X2 + X3)].

Um samanburði er fjallað á bls. 377 – 384 í Howell. Á bls. 383 er farið ítarlega í það hvernig hægt er að tryggja að samanburðir verði óháðir. Einnig er farið í þetta efni í Klockars og Sax.

Var það rétt skilið hjá mér að það þarf ekki að endurgera meðaltöl fyrir samanburðakóðunina (eða að það sé í lagi að þau gangi ekki upp—þar sem ójafn fjöldi í hólfum hefur áhrif…)? Ég fæ meðaltölin ekki til að ganga upp fyrir samanburðakóðun…. Er ég á villigötum?

Þegar ég lít á verkefnalýsinguna núna í þessu og sé ekki að ég biðji um það.

Eins og þú bendir á verður ójafn fjöldi í hólfum til að rugla myndina aðeins og því hugsanlegt að meðaltölin endurgerist ekki fullkomlega.

Ef samanburðirnir eru ekki óháðir er ekki ástæða til að ætla að hægt sé að endurgera meðaltölin, þótt í sumum tilvikum sé það engu að síður mögulegt.

Ég myndi því ekki líta á það sem vísbendingu um mistök þótt meðaltölin endurgerist ekki nákvæmlega. Ef þú ert langt frá því að ná að endurgera þau, væri ástæða til að hafa áhyggjur.

2001-11-01a

Hvort er mælt með því að reikna samanburði einn í einu eða þá keyra þá alla í einu í einni skipun?

Ef samanburðirnir eru óháðir og jafnt er í hólfum, skiptir það ekki máli. Ef þeir eru háðir, leiðréttast þeir hver fyrir annan. Því er skynsamlegast að reikna slíka samanburði hvern í sínu lagi, því leiðréttingin breytir samanburðunum svo þeir verða óháðir. Niðurstöðuna er ekki auðvelt að túlka.

Ef samanburðirnir eru óháðir en einhverju munar á fjölda í hólfum, verður leiðréttingin til þess að breyta niðurstöðunni lítillega. Það ætti þó ekki að muna ýkja miklu. Það er fyrst þegar verulegu munar á fjöldanum sem þetta fer að breyta einhverju.

Ekki gleyma að þetta er fyrst og fremst kóðunarverkefni. Því skiptir mestu máli að þið áttið ykkur á að hægt er að endurgera dreifigreiningartöfluna með samanburðum, en minna máli skiptir hvort blæbrigði í túlkun samanburðanna haldi sér.

2001-11-02a

Getur einhver sagt mér ensku heitin á staðgengilskóðun, áhrifakóðun og samanburðarkóðun? Mér finnst efnið í verkefninu vera dreift út um alla bók (Howell) og virðist ekki geta fundið neitt bitastætt.

Einnig var ég að spá í því hvort nóg væri að nota Enter aðferð í GLM (þegar búið er að kóða) eða hvort maður þyrfti að fara út í Stepwise eða þaðan af verra.

Staðgengilskóðun: dummy coding
Áhrifakóðun: effect coding
Samanburðarkóðun: contrast coding eða coding specific comparisons eða eitthvað í þá áttina.

Ef þú notar GLM, þarftu ekkert að kóða er það? Þess vegna er miðað við að notuð sé aðfallsgreining (Analyze/Regression/Linear). Þar myndirðu vissulega geta notað Enter.

Það er ekki tilefni til að tala mikið um aðfallsgreiningu að öðru leyti, en þó rétt að benda á að Stepwise á sjaldnast við þegar unnið er með línulega líkanið.

2003-10-17a

Ég er hér með nokkrar spurningar sem gott væri að fá svar við.

1. Hvað er átt við með stöðluð og óstöðluð áhrif fyrir megináhrif í heild sinni? Eru óstöðluðu áhrifin hallartala fastans sbr. 6,32 og 5,64 á glæru 11 (Dreifigr. sem línulegt líkan)?

2. Á ekki bara að framkvæma aðfallsgreiningu? Hvað er verið að tala um fí' og Cohens d í kommentunum frá 2001?

3. Mér sýnist mín samanburðarkóðun ekki vera hornrétt, er samt eitthvað varið í að framkvæma aðfallsgreiningu á henni?

1. Óstöðluð áhrif eru á kvarða fylgibreytunnar. Dæmi um þetta eru mimunur meðaltala, hallatölur í aðfallsgreiningu, σt o.s.frv. Stöðluð áhrif er það þegar reynt er að setja allar niðurstöður á sama kvarða óháð kvarða fylgibreytunnar. Yfirleitt eru slík áhrif á kvarða staðalfráviks. Dæmi um þetta eru φ', Cohens d, η2 o.s.frv.

2. Jú, það er verið að biðja um aðfallsgreiningu. Ef þú kóðar flokkabreytu, þá samsvarar það dreifigreiningu. Þú ert því að vinna með meðaltöl og ert í reynd að gera dreifigreiningu. Það er því ekkert í veginum fyrir því að reikna þessar áhrifastærðir, þrátt fyrir að við kjósum að fara lengri leiðina með því að kóða meðaltölin sjálf í aðfallsgreiningu í stað þess að láta dreifigreiningarforrit gera það fyrir okkur.

3. Hafðu samanburðina hornrétta ef þú mögulega getur. Athugaðu að þeir þurfa að vera hornréttur með tilliti til meðaltalanna. Þær gætu orðið háðir (hornskakkir) vegna ójafns fjölda í hólfunum en það skiptir litlu máli.

2003-10-20a

Niðurstöðurnar mínar, fyrir summu kvaðrata, eru sýndar svona t.d 7,58E+09. Má ég sýna þær svona í skýrslunni? Eða villtu fá alla töluna, svona 7579453854,576. Mér finnst þetta svo voðalegt bákn. Því vill ég bara spyrja þig, hvað er venjan með svona langar tölur?

Talan 7,58E+09 þýðir að þetta er 7,58·109, þ.e. 7,58 margfaldað með 1.000.000.000 eða 7,58 milljarðar.

Ég hef eðlilega lítinn áhuga á 10 stafa tölum. En gætirðu ekki einfaldlega skrifað þetta út eins og ég sýni, þ.e. 7,58·109. Hugsanlega vilt þú einnig rita aðrar niðurstöðutölur í sömu úrvinnslu í milljörðum. Einfaldast leiðin til þess er að einfaldlega búa til nýja fylgibreytu sem er í milljörðum. Það gerirðu einfaldlega með því að deila með 1.000.000.000 í gömlu fylgibreytuna.

2003-11-03a

k×(k−1)/2 eða k−1 samanburðir

Í gögnunum sem ég er með er enginn eiginlegur samanburðarhópur, heldur er ég að bera saman laun fólks sem útskrifast hefur með háskólagráður af 3 mismunandi sviðum. Ég er að velta því fyrir mér hvort að ég þurfi þá ekki að gera alla 6 samanburðina sem þetta mynstur bíður upp á?

Svar frá samnemanda: Ég er með sömu gögn og þú, er ekki nóg að gera þrjá samanburði, 1, berð hóp 1(einhvern) við hina þrjá, 2, berð saman hóp 2 og 3, og 3, berð hóp 4, saman við hóp 2 og 3. Sem er í raun alveg eins samanburður og er gerður í dæminu sem Guðmundur setti inn á heimasíðuna sína.

Við erum sjaldnast með samanburðarhóp. Almennt ættum við að gera þá samanburði sem við höfum áhuga á eða gögnin gefa tilefni til. Með 3 hópa er ekki líklegt að við höfum áhuga á öllum mögulegum samanburðum og sjaldnast mjög mörgum.

Hvað varðar verkefnið, þá miða ég við að þið setjið upp k–1 óháða samanburði og sýnið þannig hvernig samanburðarkóðun endurgerir úrvinnsluna á sama hátt og staðgengils- og áhrifakóðun.

2003-11-03b

Betastuðlar, marktekt og endurgerð meðaltala

Hér eru nokkrar vangaveltur um túlkun:

  1. Er hægt að túlka staðlaðan hallastuðul Beta þegar frumbreytan er ekki samfelld? Ef svo er, hvernig þá?
  2. Hvernig endurgeri ég meðaltöl fyrir samanburðarkóðun?
  3. Hvernig gef ég upp marktekt fyrir einstaka hallastuðla, þ.e. t-próf, hvar finn ég viðeigandi frígráður?
  1. Yfirleitt höfum við lítinn áhuga á stöðluðum hallastuðlum. Ef frumbreytan er tvískipt, er auðvitað beinlínis spurning um merkinguna eins og þú virðist gefa í skyn.
  2. Endurgerðin er nákvæmlega eins og í öðrum kóðunum. Þú getur notað aðfallsjöfnuna til að búa til spágildi og spágildið ætti að vera jafnt úrtaksmeðaltalinu. Ef kóðunin er ekki óháð getur skapast vandi.
  3. Nákvæmlega eins og með önnur t-próf, þ.e. frígráður leifarinnar. F-próf hefur tvær frígráður, t-próf hefur aðeins einar. Það er hægt að birta F í stað t en þá yrði fyrri frígráðan 1.

2004-10-31a

Túlkun hallastuðla

Á að túlka hvern og einn hallastuðul í staðgengilskóðun, áhrifakóðun og samanburðarkóðun eða bara þá sem eru marktækir?

Er túlkun hallastuðlanna ekki eitthvað á þessa leið: Ef krabbamein í maga breytist í að vera krabbamein í lungnapípu minnkar líftími fólks um 1,18 einingu?

Þú túlkar alla hallastuðlana.

Jú, túlkunin virkar ekki út í hött en hvað er þetta með 1,18 einingar? Hvaða einingar eru þetta?

2006-11-01a

Túlkun hallastuðla í umbreyttum gögnum

Ég er eitthvað að reyna að bjarga mér fyrir horn þar sem líftími er ekki lengur í dögum heldur kvaðratrótum. Hvernig er hægt að leysa túlkunina án þess að fara að keyra allt aftur án kvaðratrótarumbreytingarinnar?

Þú ert að vinna í kvaðratrótardögum. Lestu vel það sem Howell segir um efnið í kafla 11.10. Í 6. útgáfu bókarinnar eru meginatriðin í annarri og þriðju síðustu málsgreinunum á undan undirkaflanum Logarithmic Transformations á bls. 319.

Howell mælir með því að bakumbreyta niðurstöðunum en gera það með mikilli varkárni. Hann sem sé viðurkennir í reynd, en segir það ekki beint út, að tæknilega er þetta rangt. Praktískt séð þá getur þetta vissulega hjálpað.

Ekki eru þó allir jafnsannfærðir og Howell þótt ég geti fallist á aðferð Howell sem praktíska nálgun ef varfærni er gætt. Ég fann texta í Grissom (2000). Heterogeneity of Variance in Clinical Data. Journal of Consulting and Clinical Psychology, 68, 155-165, þar sem hann er mjög gagnrýninn á túlkun umbreyttra gagna.

„Interpretation of analyses of transformed data can be problematic. Rejected or accepted null hypotheses, obtained p levels, and confidence levels apply to the means of the transformed data, not to the means of the original data (Games & Lucas, 1966; Hettmansperger, 1984), and caution is required when detransforming descriptive statistics from transformed data. …“ (bls. 158)

2006-11-01b

Kjörefni og wiki

Hvernig getur maður sett myndir og töflur inn í wiki?

Ég er búin að vera að reyna að læra að setja töflur og myndir úr SPSS, Word og Excel í Wiki en get það ekki. Það er annað hvort ekki val um að líma þær inn eða þegar töflur eru settar koma þær án allra lína eða allar í rugli. Er einhver sérstök leið til að gera það eða á að búa til töflur og myndir í Wiki?

Varstu búin að sjá neðst á forsíðunni: Þú getur geymt myndir í myndabankanum.

Einfaldlega vistið myndina ykkar megin, ég man ekki hvað það heitir í SPSS en ef þú hægri smellir á að koma valmynd sem býður upp á Export eða Save image eða eitthvað álíka. Þú þarft að gæta þess að myndin sé vistuð sem PNG eða GIF. Þú getur einnig notað JPG en það er síðra. BMP er einnig möguleiki en þá færðu mjög stórt skjal.

Þegar þú ert búin að vista myndina þín megin ferðu í myndabankann, smellir á Browse og velur skjalið með myndinni og smellir síðan á Upload. Þá ætti myndin að birtast í myndabankanum en stundum þarf þó að fara í Edit og þar í Preview til að hún sjáist. En aðalatriðið er að í Edit sérðu hvað þú þarft að skrifa til að nota myndina á síðunni þinni. Prófaðu t.d. að skrifa [Upload:ahrif.GIF] einhvers staðar á síðunni þinni og sjáðu myndina sem þá birtist.

Töflur gerir þú á svipaðan hátt. Þú byrjar á því að gera töfluna tilbúna í Word. Þegar taflan er tilbúin, velurðu hana alla og ferð í Edit/Copy. Síðan færirðu þig á nýjan stað í skjalinu, ferð í Edit/Paste special og velur þar picture. Þá klippist taflan inn í Word sem mynd.

Nú gæti verið gott að fara í Tools/ Options / Web options og fara þar í flipann Pictures og haka við Allow PNG as output format. Einnig er mikilvægt að ekki sé hakað við valkostinn Rely on VML for displaying graphics in browsers. Ég rita þetta eins og það birtist mér í Office 2000, auðvitað getur þetta litið öðru vísi út hjá þér. En það er ómaksins vert að kanna þetta þín megin. Það er líka hugsanlegt að þessi valkostur sé horfinn í nýrri útgáfum forritsins.

Að þessu loknu ferðu einfaldlega í File / Save as web page og vistar skjalið með einhverju minnistæðu nafni. Leitaðu síðan að möppunni með skjalinu, þar finnurðu skjalið en einnig undirmöppu með öllum myndunum í skjalinu. Ef skjalið heitir t.d. Doc1.htm muntu finna möppu sem heitir doc1_files. Þú einfaldlega leitar að myndinni í möppunni, taflan gæti t.d. birst sem myndaskjal sem heitir image002.png. Einfaldlega tvísmelltu á skjalið og sjáðu hvað í þvi er. Þá ertu búin að finna myndina af töflunni og getur upload-að henni eins og hverri annarri mynd eins og útskýrt er hér að ofan.

2006-10-06a

Marghliða dreifigreining

Ég er ekki alveg viss um marghliða dreifigreiningu, hvað heitir það nákvæmlega á ensku?

Marghliða er sama og „multiple“ þ.e. fleiri en ein frumbreyta, t.d. tvær.

Ég var búin að finna gagnasafn en kannski hentar það ekki. Má ráða því hvað eru frumbreytur til dæmis með því að flokka breytu í færri gildi, s.s. fjármagn sem birt er í tölum—flokka það í tvennt, mikið og lítið eða eitthvað í þá veruna?

Ég sé fátt því til fyrirstöðu að gera eins og þú segir. Þú vilt hugsanlega hafa það í huga við túlkun niðurstaðna að frumbreytan er þar með megindleg þótt þú breytir henni þannig í flokkabreytu.

Almennt verður slík flokkun á megindlegri frumbreytu til þess að minnka afköst (power), en stundum aðeins lítillega, samanborið við að nota frumbreytuna óbreytta í t.d. aðfallslíkani. Á móti kemur að línuleg aðfallsgreining gerir ráð fyrir því að slík frumbreyta hafi línuleg tengsl við fylgibreytuna, ólíkt dreifigreiningu sem leyfir hvaða mynstur meðaltala sem fyrir flokkuðu frumbreytuna.

Við erum hér nokkrar upp í Odda að dunda okkur við að finna stöðluð og óstöðluð áhrif. Út frá hvaða upplýsingum er best að reikna áhrifin?

Áhrif eru ýmist reiknuð sem mismunur tveggja meðaltala, staðalfrávik tveggja eða fleiri meðaltala eða sem það hlutfall af dreifingu fylgibreytunnar sem skýra má með dreifingu frumbreytu.

Og hvernig finnum við villuna? Er það „Mean Square - Residual“ talan úr ANOVA töflunni, eða er það kvaðratrótin af henni?

Kvaðratrótin, þ.e. ef þið viljið fá staðalfrávik villunnar. MSe er dreifitala villunnar.

Á einni glærunni segir þú að einfaldast sé að meta áhrifastærð samvirknihrifa með því að reikna dreifingu áhrifa. Hvernig geri ég þetta með GLM?

Áhrif í dreifigreiningu eru skilgreind sem frávik frá heildarmeðaltalinu, sbr. glæruna Dreifigreingarlíkanið í Einföld dreifigreining. Til þess að fá þessi áhrif þarf að nota áhrifakóðun eins og algengast er að dreifigreiningarforrit geri. GLM notar hins vegar staðgengilskóðun sem truflar myndina verulega. Þegar staðgengilskóðun er notuð, fáum við ekki þessa samsvörun milli dreifingu hallatalna og dreifingu samvirknimeðaltalna (þ.e. meðaltalna eftir að áhrif megináhrifa hafa verið fjarlægð).

Einfalda leiðin út úr þessu er einfaldlega að fá hallatölur fyrir áhrifakóðun. Það er hægt með MANOVA forritinu (í stað GLM) en dæmi um það hef ég sett í skipanaskrána fyrir marghliða dreifigreiningu. Hana getið þið nálgast á heimasíðu námskeiðsins.

Almennt séð er langauðveldast að nota áhrifakóðun í dreifigreiningu þar sem mun auðveldara er að skilja hallatölurnar. T.d. í dæminu okkar má endurgera meðaltöl miðað við að aðeins fastinn lýsi öllum meðaltölunum, miðað við að aðeins áhrif dekkja (og fastinn) séu fyrir hendi í þýði, aðeins áhrif hraða sé í þýði og að aðeins samvirkni (auk fasta) sé í þýði. Í sjálfu sér má gera þetta einnig á auðveldan hátt þótt staðgengilskóðun (dummy coding) sé notuð. Það gæti hins vegar reynst flókið að endurgera samvirknimeðaltölin á grunni staðgengilskóðunar en mjög auðvelt að gera það á grunni áhrifakóðunar. Hafið þetta í huga áður en þið farið að skoða nákvæmlega hallatölurnar sem fást út úr GLM forritinu.

Við höfum aðeins verið að ræða saman og það sem við erum sammála um er hvort það mætti ekki sleppa umfjöllun sem hefur verið farið í áður á sömu gögnum í fyrri verkefnum? Það mætti þá kannski einfaldlega vísa í þau verkefni, eða segja að þetta hafi verið gert. Annars erum við að vissu leyti að endurgera hluta af síðasta verkefni og fyrsta verkefninu. Einnig var einhver spurning um hvað við ættum að leggja aðaláherslu á í inngangi.

Einhvern veginn þannig hafði ég skilið það, sbr. setninguna: „Gögnin þarf að kanna, ef það hefur verið gert áður má stytta þá umfjöllun og vísa í viðkomandi verkefni.“

Ég miða sem sé við að ekki sé hægt að virða þessa umfjöllun að vettugi en hins vegar sé óþarfi að endurtaka hana frá fyrra verkefni. Þetta er að einhverju leyti háð ykkar eigin dómgreind en ég gæti séð fyrir mér að í sumum tilvikum væri hægt að einfaldlega tilgreina að ákveðin atriði hafi verið könnuð í verkefni 1 (leitarverkefni?), hver þau voru og hver niðurstaða þess var. Ef í ljós komu einhver afbrigði þarf að sjálfsögðu að ræða þau með tilliti til þessa verkefnis.

Nú kann að vera að notuð séu ný gögn eða forsendur dreifigreiningar hafi ekki verið könnuð miðað við þær frumbreytur sem nú eru notaðar. Þá virðist bersýnilegt að skoða þurfi þessi atriði sérstaklega og gera grein fyrir þeim í þessu verkefni.

Hugsið þetta eins og þið væruð að skrifa röð greina í tímarit. Þá mynduð þið vísa í niðurstöður fyrri greina um sömu gögn eftir því sem þurfa þykir. Þið mynduð þó engu að síður gera stuttlega grein fyrir því sem skipti máli, svo lesandi neyðist ekki til að leita uppi eldri greinina. Hins vegar yrði umfjöllunin verulega stytt frá því sem áður var enda óþarft að endurtaka sig.

Í lokaskilum geri ég síðan ráð fyrir því að svona atriði verði leyst með því að öllum verkefnum sé skilað í einu og myndi ákveðna heild, þ.e. annað hvort kaflaskipt verkefni í endurgerð eða röð verkefna sem heyra saman og hægt er að vísa á milli.

Það er erfitt að tjá sig um áhersluatriði í inngangi því það fer að sjálfsögðu eftir því hverjar niðurstöðurnar eru. Einhver umfjöllun um þessi efni sem tengjast marghliða dreifigreiningu virðist eiga heima þar. Ef þið fáið markverða samvirkni, þá væri t.d. eðlilegt að fjalla dálítið um túlkun á samvirkni, valkostum og álitamálum í því sambandi. Sú umfjöllun yrði væntanlega mun efnisminni ef engin samvirkni er í gögnunum. Þannig hljóta efnistök að fara að verulegu leyti eftir því hvernig verkefnið er í heild sinni.

Flettið síðasta fyrirlestri og sjáið hvaða atriði við höfum rætt. Einnig er skynsamlegt að skoða umræðuna í Howell. Veljið síðan og hafnið eins og þið teljið henta til að úr verði samhæft og sannfærandi verkefni.

Varðandi verkefnalýsinguna. Er ekki hægt að sleppa því sem hefur áður verið gert með þessi gögn þ.e. myndrænni greiningu o.fl.? Einnig langaði mig að spyrja hvort að inngangurinn ætti að vera um samanburði eða almennt um marghliða dreifigreiningu eða um bæði.

Að einhverju leyti hef ég svarað þessu áður, láttu mig vita ef eitthvað fer enn milli mála.

Inngangur ætti væntanlega að vera um marghliða dreifigreiningu og álitamál í því sambandi. Hvort fjallað er ítarlega um marga samanburði er dálítið álitamál sem þú verður sjálf að taka afstöðu til. Við höfum auðvitað ekki haft neitt sérstakt verkefni um það efni og því tilefni til umræðu. En hugsanlega er ekki tóm til að fjalla ítarlega um ýmis dýpri mál, svo sem nákvæmlega um villutíðni, ólík próf o.s.frv.

Hins vegar sýnist mér líklegt að eitthvað þurfi að ræða samanburði því þú munt jú beita þeim í verkefninu. Kanski má leysa það með því að ræða fyrst og fremst um það próf sem þú velur að nota og hugsanlega hvernig það stjórnar villutíðninni, án þess að fara djúpt í það hugtak sem slíkt.

Á það hlýtur þó að þurfa að líta að þú velur að gera t.d. eftir á samanburði og hlýtur því að vilja setja þá ákvörðun í eitthvert samhengi til að sýna fram á það að skynsamlega sé staðið að verki. Það er jú alltaf tilgangur inngangs, að setja það sem á eftir kemur í samhengi í þeim tilgangi að sannfæra lesandann.

Ég er ekki alveg viss með þessa samanburði; gerir maður samanburði ef ekki er samvirkni í gögnunum?

Samanburðir geta ýmist verið innan meginhrifa eða innan samvirknihrifa.

Samanburðir innan meginhrifa eru algengastir en þá er hægt að fá með CONTRAST undirskipuninni í GLM (eða UNIANOVA). Athugið að þið þurfið að skilgreina þá með skipunum sbr. dæmi sem þið hafið fengið.

Þess fyrir utan má nota paraða samanburði en þá fáið þið með POST HOC undirskipuninni. Yfirleitt biðjum við aðeins um þá innan meginhrifa og í SPSS er ekki gert ráð fyrir þeim möguleika að fá þá innan samvirknihrifa.

Ég ákvað að gera samanburði eins og hér er sýnt. Það sem ég held að ég sé að gera og mér finnst niðurstaðan segja mér er að samanburðirnir eru gerðir á milli aldursflokka fyrir annað gildið á hópabreytunni. Er þetta rétt skilið? Og hvernig veit SPSS hvorn hópinn hún er að nota, eða ég vil nota?

* Dæmi um samanburð .
* Ber saman hóp 1 og hóp 3.
* Ber saman hóp 2 og hóp 3.

GLM
medalmsl BY group Ageflokk
/CONTRAST (Ageflokk)=Special (-1 0 1)
/CONTRAST (Ageflokk)=Special (0 -1 1)
/METHOD = SSTYPE(3)
/DESIGN .

Mér sýnist þetta vera eins og þú segir, þ.e. sá fyrri ber saman hópa 1 og 3 og sá seinni hópa 2 og 3. Athugaðu að samanburðirnir eru ekki óháðir; þetta er samanburður við samanburðarhóp og því gæti hentað að nota próf Dunnetts.

SPSS veit hverjir hóparnir eru vegna þess að röðin gefur það til kynna. Vektorinn [-1 0 1] er settur á hópana í sömu röð og þeir koma fyrir í frumbreytunni, þ.e. hópur 1 fær vægir -1, hópur tvö fær vægið 0, og hópur þrjú fær vægið +1.

Í töflu á bls. 447 útskýrir Howell hvarnig eigi að reikna omega í marhliða dreifigreiningu. Þar kemur fram að maður þarf að deila með fjölda í hóp (n). Hvað gerir maður ef það er ójafn fjöldi í hópum? Finn ég meðalfjöldann? Ég finn ekkert um akkúrat þetta í Howell.

Þar tekurðu mig í bólinu. Ég hef ekki séð neina lausn á þeim vanda. Ef ekki munar miklu á fjöldanum í hólfunum, ætti meðalfjöldinn þó að duga sem ákveðin nálgun. Prófaðu það og ef þú færð niðurstöðu sem er ótrúverðug ættirðu einfaldlega að útskýra málið og reikna etu í staðinn.

Er í lagi að skella saman niðurstöðu- og umræðukaflanum eins og stundum er gert? Þannig yrði þægilegra að ræða niðurstöðurnar.

Já, það er innan þess sveigjanlega ramma sem maður hefur yfirleitt þegar rituð er fræðigrein. Farðu samt varlega í það, þ.e. spyrðu fyrst og rökstyddu fyrir sjálfri þér að það verði skýrara og einfaldara en að halda þeim aðskildum. Sjálfur sé ég ýmsa möguleika í báðum valkostum og það er því ykkar að velja bestu framsetninguna að þessu leyti.

Eftir á samanburður

Má nota pairwise-eftir á samanburði í stað Sheffé eða Tukey? Ég prófaði að keyra syntax skrá (svipaða og var á heimasíðu Guðmundar) og þá kom upp pairwise samanburður.

Paraðir samanburðir eru algengasta tegund samanburða eins og þið sjáið með því að skoða nokkrar greinar. Ástæðan er sennilega sökum þess að forritin gera þessa samanburði sjálfkrafa auk þess sem hægt er að búa til einfalda reglu um úrvinnsluna. Það er þar með hægt að segja fólki einfaldlega að gera Tukey og sjá þannig hvaða meðaltöl eru ólík hverjum.

Vandi paraðra samanburða er hversu ómarkvissir þeir eru. Einnig verða niðurstöður oft órökrænar svo sem þegar A≠B, B≠C en samt sem áður er A>C.

En auðvitað er ekkert rangt við að nota paraða samanburði þegar þeir eiga við. Sheffé samanburðir hafa hins vegar mikilvæga kosti. Athugaðu að Tukey prófið miðast við paraða samanburði og að ef þú biður um Sheffé í SPSS farðu paraða samanburði með Sheffé en það er ekki mjög skynsamlegt.

2004-11-28a

Paraðir samanburðir

Ef SPSS output gefur upp pairwaise comparison er það þá sjálfkrafa að reikna með Tukey HSD? Hvernig get ég vitað hvort paraður samanburður er reiknaður með Tukey HSD eða prófi Ryans?

Nei aldeilis ekki.

Þú biður um þá leiðréttingu sem þú vilt nota og þá er henni beitt. Auk þess geturðu lesið vel textann sem fylgir viðkomandi töflu í niðurstöðunni sem kemur frá SPSS til að ganga úr skugga um að þú sért að skoða rétt próf.

SPSS gerir paraða samanburði með t-prófi (LSD), Sheffé, Tukey og mörgum öðrum valkostum. Viðmiðið við gerð SPSS var því miður það að notandinn verði að passa sig sjálfur. Forritið er því hvorki nemenda- né notendavænt að þessu leyti.

2004-11-28b

Athugun á dreifingu leifar vs. athugun á dreifingu fylgibreytunnar

Ég hef verið að skoða fyrirlestra vetrarins, fyrirlestra í tölfræði III og gamlar fyrirspurnir og er orðin frekar rugluð í hvaða myndrit eru birt til að sýna hvort leif normaldreifist. Í einum af fyrstu fyrirlestrunum í vetur talaðir þú um að það ætti ekki að nota Q-Q plot til að athuga leifina því hún sýndi ekki gildi fylgibreytunnar á x ásnum. Mér finnst eins og ég hafi verið að misskilja þig þá því það að skoða fylgibreytuna á móti væntigildi normaldreifingar hlýtur að vera athugun á því hvort fylgibreytan, en ekki leifin, sé normaldreifð. Það er engin forsenda í dreifigreiningu um að fylgibreytan þurfi að vera noramldreifð, er það nokkuð?

Er ekki rétt skilið hjá mér að það er mikilvægt að skoða normalrit og kassarit af fylgibreytu og birta slík myndrit en það þurfi einnig að birta normalrit og kassarit fyrir leif (þ.e. setja studentized residual í dependent í explore) svo hægt sé að meta hvort forsendan um normaldreifingu leifar sé fyrir hendi?

Eitt í viðbót. Þegar meta á hvort umbreyta þarf gögnum vegna skekkju, er þá ekki rétt hjá mér að matið er gert út frá dreifingu leifar? Eða er það gert út frá dreifingu fylgibreytunnar?

Þegar þú vilt fá normalrit yfir leif hef ég bent á að Analyze/Examine (eða var það Explore) er betri leið en Graphs/Q-Q plot.

Það getur verið gott að skoða fylgibreytuna en það er leifin sem gildir eins og þú réttilega bendir á. Þú skoðar fylgibreytuna fyrst og fremst til að kynnast gögnunum. Það er mikilvægt en forsenduna um normaldreifingu skoðar þú í lefinni.

Ef þú ert að hugleiða umbreytingu, getur fyrsta skref verið að biðja um Spread-Level plot í Examine; ef þú hakar rétt við færðu formúlu fyrir neðan sem gefur ágiskun um skástu umbreytingu. En matið þarftu að gera út frá leifinni; þú getur einnig skoðað krossað kassarit. Það eru einhverjar hugleiðingar um einmitt þetta efni í fyrsta fyrirlestri vetrarins að mig minnir.

2006-12-06a

Mynd fyrir afköst eftir hópastærð

Mér tekst ómögulega að flytja myndina fyrir afköst eftir hópastærð og mismunadi áhrifastærð úr R yfir í Word. Er til einhver einföld leið til þess eða þá flókin ef þörf er á því? Eða þurfum við kannski ekki að birta slíka mynd í skýrslunni?

Nemandi svarar: Í fyrirlestri sagði Guðmundur að til þess að færa mynd úr R yfir í Word yrðum við að gera Copy as metafile í R, opna svo Word og gera Paste special - Picture. Ég er reyndar ekki búin að gera þetta sjálf því ég er ekki komin að þessu en endilega prófaðu þetta.

2006-12-06b

Öryggisbil fyrir meginhrif og samvirknihrif

Getur þú bent á einhverja leið í SPSS til að fá öryggisbil fyrir meginhrifin tvö og samvirknihrif?

Ég er búin að reyna allar leiðir sem mér dettur í hug í SPSS og skoða Howell til að sjá hvort hægt sé að reikna það handvirkt. Ég er farin að hallast að því að það sé ekki merkingarbært og sé í raun ekki þörf á að fá öryggisbil fyrir hrifin þar sem ég finn ekkert um þetta. Er þörf á að túlka öryggisbil fyrir marktæk hrif eða á kannski bara að túlka öryggisbil fyrir samanburði?

Athugaðu að Aldur hefur eina frígráðu og því samsvara meginhrifin t-prófi. Þú getur því reiknað öryggisbil fyrir þau.

Úrvinnslustig er með 4 frígráður og því eru engin ein hrif sem þú getur skoðað með öryggisbili; þetta eru 5 meðaltöl og því enginn einn mismunur sem skilgreinir meginhrifin. Ef þú getur skilgreint einhvern samanburð getur þú hins vegar reiknað öryggisbil fyrir hann.

Það er nú jafnvel mikilvægara að skoða öryggisbil fyrir ómarktæk hrif en eins og ég segi, þá er aðeins hægt að reikna öryggisbil í kringum einhverja þýðistölu, t.d. mismun meðaltala eða eitthvað slíkt. Meginhrif með df= 4 gefa ekki kost á einhverjum augljósu öryggisbili sem lýsir meginhrifunum.

2006-12-08a

F-próf með Contrast skipun eða t-próf til að prófa fyrirfram samanburði?

Segjum sem svo að ég ætli í þessu verkefni að prófa fyrirfram samanburð (sem er í raun ekki fyrirfram heldur fræðilega mikilvægur). Þá bendir þú og aðrir á að það eigi að nota einfalt t-próf til að athuga mun á meðaltölum en einnig gefur þú upp þann möguleika að nota Contrast-skipun til að prófa aðra samanburði en þá sem eru POST HOC.

Er einhver reginmunur á þessum aðferðum þegar prófaðir eru fyrirfram samanburðir?

Á að nota t-próf frekar en F-próf dreifigreiningar (Contrast skipun) þegar prófaðir eru fyrirfram samanburðir?

Nei, það er enginn reginmunur á því að nota t-próf eða Contrast-skipunina í SPSS.

Contrast-skipunin óleiðrétt samsvarar t-prófi. En auðvitað hugsum við oft um t-próf sem próf á mismun tveggja meðaltala en samanburðir víkka það töluvert út, ekki satt?

2006-12-09a

Varðandi afköst og hvað eigi að birta í skýrslu

Þegar maður talar um afköst og fjölda þátttakenda í næstu rannsókn í skýrslunni, á maður að birta afkastakúrvur fyrir öll hrifin (meginhrifin tvö og samvirknihrif) eða velja úr þau hrif sem maður telur vera merkingarbærust?

Velja úr það sem þér finnst merkingarbærast.

Þú vilt að lesandinn hugsi: Já, hún kann greinilega að gera afkastagreiningu og gerir það skynsamlega.

Þú vilt ekki að lesandi hugsi: Hún virðist kunna þetta tæknilega en skilur ekki tilganginn; hjálp, ég er að drukkna í afkastagreiningum.

Spurðu þig: Hvað er mikilvægasta niðurstaðan, hvaða niðurstöðu myndirðu vilja endurtaka í annarri rannsókn? Veldu þau hrif fyrir afkastagreininguna.

2006-12-12a

SPSS og skipanaskrár

Textabreytu breytt í talnabreytu

Hvernig breytir maður string breytum í numeric? það er að segja án þess að þurfa að stimpla þær allar inn aftur.

Einfaldast er að einfaldlega breyta skilgreiningu breytunnar, það er velja Numeric í stað String undir Type. Þetta verður að gera með valmyndum. Byrjaðu á að taka afrit af breytunni (Compute) og berðu niðurstöðurnar saman við afritið til að vera viss um að umbreytingin hafi heppnast.

Einnig má skrifa breyturnar út og lesa inn aftur. Breyturnar eru skrifaðar út með skipuninni LIST. Síðan er lesið inn með DATA LIST. Þetta þarf að gera með skipunum.

Hægt er að nota fallið Number. Það krefst þess að komman sé tilgreind í öllum tölunum eða engri þeirra. Annars er hætt við villu.

2001-09-26a

Punktar við endi skipana

Ég er búin að setja upp Syntax skrá og búin að prófa að keyra hana og það gengur allt vel nema það koma ekki inn gildi (values)breytunnar. Ég passaði mig samt á að láta hverja línu enda á punkti.

Algengt er að skíra gildi breytunnar KYN. Það hefur komið fyrir á nokkrum ykkar að gera það sí svona (sem er rangt):
VALUE LABELS Kyn.
1 "karl".
2 "kona".

Rétt væri að gera þetta svona, þ.e. aðeins hafa punkt í lok skipunarinnar.

VALUE LABELS Kyn
1 "karl"
2 "kona".

Sama regla á við um aðrar skipanir, þ.e. punkturinn táknar endi skipunarinnar, en ein skipun getur náð yfir margar línur.

Athugið að ofangreint dæmi má rita á marga vegu sem allir leiða til sömu niðurstöðu svo fremi að punkturinn sé aðeins í endann.
Dæmi 1
VALUE LABELS kyn
1 "karl"  2 "kona".

Dæmi 2
VALUE LABELS kyn 1 "karl"  2 "kona".

Dæmi 3 (ekki er sérstaklega mælt með þessu en það er leyfilegt)
VALUE
LABELS
kyn
1 "karl" 
2 "kona".

2001-09-27a

Meiri upplýsingar um skipanir

Ég á í erfiðleikum með SPSS skipanaskrárnar. Geturðu gefið mér meiri upplýsingar um hvernig eigi að gera skipanirnar?

Hér koma nokkrar ábendingar með hliðsjón af algengum mistökum við gerð skipanaskráa.

Algengast er að skipanaskrár séu með athugasemdum með skýringartextum í upphafi og annað slagið innan um skipanir neðar í skránni. Gættu að því að slíkar athugasemdir þurfa að byrja á * og enda á punkti. Því þyrftir þú að láta hverja línu í upphafstextanum byrja á * og hver lína þyrfti að enda á punkti.

Það þarf alltaf að vera DATA LIST skipun, svo gögnin séu lesin inn. Hún ætti að koma strax á undan BEGIN DATA skipuninni.

Allar skipanir þurfa að enda á punkti, einnig VALUE LABELS og VARIABLE LABELS.

Athugið hvort skipanaskráin er keyranleg áður en þið sendið mér hana. Ef það koma villuboð, þarf að grafast fyrir um ástæðu þeirra.

Hægt er að fá hjálp og „syntax guide“ fyrir allar þessar skipanir í gegnum hjálpina. Það er sjálfssagt að notfæra sér það; hjálpin er þó stundum dálítið yfirgengileg og því misgagnleg—sjálfsagt þó að láta á hana reyna.

Leitarverkefnið

Hvað er í hverjum kafla verkefnisins?

En mér langar að spyrja þig í sambandi við næsta verkefni …. Þú talaðir um að við þyrftum að setja verkefnið upp í APA stíl.

Er það rétt skilið hjá mér að við lýsum gagnasafninu í inngangi þ.e. bakgrunni þess og skýrum frá breytunum. Í aðferðakafla að lýsa því hvernig við fundum það og hvar, hvernig við lásum það inn og hvernig við unnum úr gögnunum. Í niðustöðukafla þá lýsandi tölfræðina (töflur og myndir) og í umræðu að ræða það hvort að við teljum einhverja annmarka á gögnum eða gagnasöfnun?

Jú, mér virðist eðlilegt og sanngjarnt að lesa verkefnislýsinguna þannig. Fljótt á litið sýnist mér því þessi lýsing þín í fullu samræmi við lýsinguna og almennt í samræmi við það sem ég vænti í námskeiðinu.

Umræðan býður jafnvel upp á ítarlegri umfjöllun en þá sem þú nefnir; það er sem sé ekki ástæða til að einblína á annmarkana í umræðunni heldur má draga þar fleira inn. Annmarkar gagnanna eða skortur þeirra sýnist mér þó geta verið veigamesti hluti umræðunnar.

Að öðru leyti verður hvert verkefni auðvitað að lúta eigin lögmálum, svipað eins og þú værir að skrifa grein í fræðirit. Þá myndir þú fylgja APA forminu en móta það stundum lítillega í höndum þér til að þjóna markmiðum frásagnarinnar.

2001-10-10a

Hvernig geri ég rækilega grein fyrir leitinni?

Ég hef verið að velta fyrir mér hvað felist í því þegar þú segir í verkefnalýsingu fyrir leitarverkefni að við eigum að gera rækilega grein fyrir hvar við leitum. Eigum við að skrá á hvaða síður við fórum og allar leiðir sem við kónnum innan hverrar síðu? Er kanski nóg að segja hvaða síður við fórum á og svona segja almennt hvað fyrir augu bar fremur en að lýsa nákvæmlega hvar við smelltum og hvað birtist þá

Ég hef hið seinna í huga en einnig almennt um það hvar þið leituðuð þar sem tilgreindar væru nokkrar slóðir og hvers þú varst vísari. Það þarf sem sé ekki að skrá smásmugulega hverja síðu sem þú skoðar en svona almennt hvaða vefsetur þú skoðaðir helst (með viðkomandi slóðum) og almennt séð hvers þú varst vísari eða ástæður þess almennt séð að gögnin hentuðu ekki.

Svo er annað mál, ef ég finn nú ekkert þá er til mikið af gögnum hér á vinnustaðnum mínum sem ég gæti notað. Þetta eru yfirleitt mjög stór gagnasöfn með miklum fjölda breyta.

Ef þú finnur ekkert þá þarftu eðlilegra að leggja aðeins meira í lýsinguna á þessum vefleiðangri þínum. Þú þarft sem sé að sannfæra lesandann um að þú hafir skoðað tiltölulega vel nokkurn fjölda álitlegra vefsetra. Þú þarft einnig að gera það sennilegt fyrir sanngjörnum lesanda að sú niðurstaða að gögnin hafi ekki hentað sé byggð á ígrunduðu og skynsömu mati.

Þegar sú niðurstaða liggur fyrir er sjálfsagt að líta sér nær svo sem í gögnin á vinnustaðnum þínum. Ég mæli með að þú biðjir um notkunarheimild. Einnig þyrftir þú að tilgreina ef einhver takmörk eru á heimilli notkun af hendi vinnustaðarins, þ.e. hvort t.d. ég eða aðrir nemendur megi hagnýta okkur gögnin sem sýnishorn eða til æfingar.

2001-10-10b

Þarf að lýsa öllum breytunum?

Þyrfti ég að lýsa óllum breytum gagnasafnsins eða væri nóg að taka þær breytur sem ég vildi nota í einni einni greiningu og gera rækilega grein fyrir þeim og vinna svo með þær?

Í aðalatriðum það seinna. Hins vegar getur verið að aðrar breytur fljóti með í gagnasafninu og þá þarf einhverja lágmarkslýsingu á þeim, sbr. t.d. lýsingu á aukabreytunni í forverkefninu.

Athugaðu að ég er að gera ráð fyrir því að gögnin muni fylgja verkefninu. Ég sé að ég tilgreindi ekkert slíkt í verkefnislýsingunni en hugmyndin var að ég fengi gögnin og gæti því hugsanlega kannað álitamál auk þess sem ég gæti sýnt þau í tíma.

Ef gagnasafnið er mjög stórt væri tilvalið að taka úrtak úr því. Einnig er sjálfsagt að fækka breytum sem mest og hafa í aðalatriðum aðeins þær breytur sem þú kýst að vinna úr.

2001-10-10c

Hvaða breytur fara í breytulistann?

Í verkefnalýsingunni stendur að eigi að gera lista yfir allar breytur í gagnasafninu. Skil ég það rétt að þá eigi einnig að hafa með á listanum breytur sem við ætlum ekki að nota í dreifigreiningunni þó þær geti verið æði margar? Er nóg að taka fram hve mörg gildi breyturnar hafa eða þarf að taka fram nánari skilgreiningu á hverju gildi fyrir sig. Spyr því þetta gæti orðið æði tímafrekt ef ég finn stórt gagnasafn og þarf að gera lista yfir allt klabbið.

Ég var ekki búinn að sjá þetta fyrir þar sem ég var með fremur lítil gagnasöfn í huga.

Beittu eigin dómgreind í því hve mörgum breytum þú lýsir. Almennt séð áskil ég aðeins að þú lýsir þeim breytum sem þú hyggst nota.

Varðandi það hvernig skuli lýsa breytunum, þá gefur lýsingin á forverkefninu dæmi um hvernig það skuli gert. Það er einnig mikilvægt að lýsa öllum gildum flokkabreyta. Dæmi um hvernig það megi gera er í Verkefni 2 á heimasíðu Valnámskeiðs í aðferðafræði.

2003-09-12a

Hvernig eiga skipanaskrárnar að vera?

Hvernig eigum við að hafa skipanaskrárnar sem eiga að fylgja verkefnunum?

Gögnin ykkar þyrftu að fylgja leitarverkefninu. Ég óska eftir því að þau séu sett upp í SPSS skipanaskrá ef þess er nokkur kostur. Það þýðir að hægt er að lesa þau auðveldlega inn í SPSS eða önnur forrit og skilgreiningar fylgja gögnunum.

Ég hef sett dæmi um svona skipanaskrá inn á heimasvæði námskeiðsins.

Datalist getið þið notað óbreytt eins í dæminu nema breytuheiti verða önnur. Gögnin sjálf rammið þið inn í BEGIN DATA … END DATA. Munið að enda END DATA á punkti.

Takið eftir að ég skilgreini gögnin í sjálfri skipanaskránni og tiltek bæði umgengnisrétt og aðila sem getur svarað spurningum. Vinsamlega tilgreinið uppruna gagnanna (t.d. veffang) og allar takmarkanir sem kunna að vera á notkun gagnanna. Við gætum viljað sýna gögnin í tímum, hugsanlega gætu nemendur framtíðar viljað vinna úr gögnunum, ég gæti notað þau í dæmum eða rituðum texta og þau gætu jafnvel farið inn á vefinn. Því er mikilvægt að þið tilgreinið eins nákvæmlega og ykkur er unnt hvaða umgengni er heimil, tilgreinið höfundarrétt þar sem hann er fyrir hendi og gefið upp aðila sem gæti skorið úr um álitamál.

2001-10-10d

Lítið gagnasafn

Fann eitt lítið gagnasafn þar sem hægt er að beita marghliða dreifigreiningu en fjöldi þátttakenda er einungis 30. Frumbreyturnar eru 2, önnur með 2 gildi og hin með 3. Er fjödinn hér í hópunum vandamál eða get ég notað þetta?

Úrtaksstærðin skiptir ekki höfuðmáli. Með 30 stök og sex (2x3) hólf er u.þ.b. fimm stök í hverju hólfi.

Hins vegar gefur ögn stærra gagnasafn meiri möguleika. Þú vilt því kanski leita að stærra gagnasafni en hafa þetta bak við eyrað ef þú finnur ekkert betra fljótlega.

2003-09-12b

Hvernig eru frumbreytur krossaðar?

Ég hef verið að lesa greinargerðina um verkefni 2 og þar er talað um að gera kassarit með frumbreyturnar krossaðar. Hvernig gerir maður það?

Graph/Boxplot/Clustered (passa að velja Summaries for Groups of Cases). Þá birtist valmyndin Define Clustered Boxplot. Þar þarf að gæta að því hvor frumbreytan sé látin skilgreina klasana. Ef þú ert óviss, getur borgað sig að prófa þetta á báða vegu og sjá hvort kemur betur út.

2003-09-17a

Hvaða skipanir eru notaðar til að skoða leif?

Undir lok tímans var fjallað í örfáum orðum um það að skoða leif en það var ekki sagt hvernig ætti að gefa skipanir til að fá það myndrit sem þarf. Hvernig er það gert?

Leif er Raungildi − Spágildi. Spágildin eru yfirleitt meðaltölin í hverju hólfi fyrir sig.

Hægt er að láta SPSS reikna þetta fyrir sig og þá er einnig hægt að fá staðlaða leif. Analyse/General Linear Model/Univariate…. Smella þar á Save… og haka þar við Studentized undir Residuals. Þetta mun birtast sem ný breyta í gagnaskránni. Niðurstöðuna má síðan skoða með Descriptives/Explore.

Nánari upplýsingar um leif og greiningarstuðla í línulega líkani er að finna í Leiðbeiningarblöðum í aðferðafræði. Skoðið þar leiðbeiningarblaðið Greiningastuðla í leif.

2003-09-17b

Fækka flokkum í frumbreytu

Í gagnasafninu mínu eru 3 frumbreytur sem ég ætla að nota. Ein þeirra er námsgrein, sú er flokkuð í 8 flokka, mig langar að breyta henni þannig að hún sé bara tveir, iðngreinar og Annað, af því þannig skiptast í rauninni greinarnar, og fjöldi nemenda innan greinanna átta er mjög ójafn (einnig í þýðinu). Mig langaði bara að spyrja hvort það sé ekki í lagi ef ég rökstyð þá umkóðun? Hinar tvær frumbreyturnar eru kyn (x2) og útskrift (x4).

Að sjálfsögðu er það í lagi ef þú rökstyður þá umkóðun! Sá rökstuðningur getur verið tvenns konar.

Best er ef báðar tegundir raka eru fyrir hendi. Almennt séð er þetta ekki skothelt nema svo sé.

Svo má ekki gleyma að þetta er hugsað sem þjálfun. Þú kemst hugsanlega langt með því að færa fram praktíst rök, þ.e. að flokkum sé fækkað einfaldlega til að gera þetta viðráðanlegt sem nemendaverkefni. Slíkur rökstuðningur væri þó ekki eins flottur og ef þú gætir sett fram tiltölulega skotheldan rökstuðning eins og nefnt var hér að ofan. Sennilega þyrfti hvort sem er að vera hægt að segja að samsteypa flokka í einhverjum skilningi komi ekki verulega að sök.

2003-09-19a

Hvernig nota ég Explore til að skoða leifina?

Ég skil ekki nógu vel hvað eigi að koma út úr þessu með að fara í Descriptive/Explore, á ég að setja leifina í dependent, og breytuna sem ég vill skoða á móti í factor list.

Eftir að ég var búinn að reikna út leifina með þeirri aðferð sem kennt var í tíma (Analyse/General Linear Model/Univariate…, smella þar á Save… og haka þar við Studentized undir Residuals. Þetta mun birtast sem ný breyta í gagnaskránni.) þá fór ég í Graphs/Q Q og hafði nýju breytuna Studentized Deleted Residual í variables og Test distribution hafði ég Normal. Þetta kom út frekar svipað og það sem er í kennsluefninu en samt ekki eins.

Þið munið kanski að ég sagði að Q-Q gefur að því að virðist ekki mæligildin á móti væntigildi normaldreifingar eins og venjuleg normalrit. Þess vegna benti ég á Explore hér fyrir ofan.

Explore krefst þess ekki að settar séu inn frumbreytur. Einfaldlega setjið leifina inn sem dependent, ýtið á Plots… og veljið Normality plots with tests.

Ritin sem fást með GLM Univariate eru ekki normalrit heldur hefðbundin leifarrit fyrir aðfallsgreiningu. Hægt er að fá ágæt normalrit yfir leif með því að nota MANOVA en þá þarf að nota skipanir. Skipunin fyrir MANOVA er nánast eins og fyrir UNIVARIATE. Undirskipunin /Residual= Plot gæfi þá normalrit auk fleiri myndrita.

2003-09-19b

Frumbreytur og vistun leifar

Þegar maður er að vista leifina á þá bara að nota fylgibreytuna, þ.e. setja hana í dependent eða á að nota líka frumbreyturnar og setja þær þá í independent?

Þú þarft að setja frumbreyturnar inn og hafa þannig líkanið alveg eins og þú vilt hafa það að öllu leyti. Þannig færðu leif sem metur villuna í samsvarandi líkani í þýði. Með því að skoða leifina færðu vísbendingu um það hvaða eiginleika villan hefur.

Ef líkanið er rangt, þ.e. einhverjar breytur vantar sem þú vilt hafa í því, þá verður leifin einnig röng þ.e. metur villuna í líkaninu sem þú setur inn í SPSS en ekki villuna í líkaninu sem þú vildir skoða.

2004-09-26a

Hvernig leif er best að nota?

Á maður að nota unstandardized eðu studentized leif þegar maður er meta villuna?

Ef þið skoðið leiðbeiningarblaðið Greiningarstuðlar í leif þá er þar bent á studentized deleted residual sem ákjósanlegasta matið á villunni.

Studentized táknar að það er búið að fullstaðla breytuna og deleted þýðir að reynt er að gera leifina óháða (eins og villan á að vera) með því að fjarlægja viðkomandi gildi út úr aðfallsjöfnunni og endurreikna hana áður en leifin er reiknuð.

Auðvitað má nota óstaðlaða leif og ekkert rangt við það. Kosturinn við staðlaða leif er sá að talnagildið hefur til kynna hversu langt út í hala dreifingarinnar við erum komin.

Það er tenging á leiðbeiningarblaðið á heimasíðu námskeiðsins en ég bendi jafnframt á að leiðbeiningarblöðin eru fleiri og einhver þeirra gætu verið ykkur til gagns.

2004-09-26b

Mat á rannsóknargrein

Áhrifastærðir: Tvö og tvö en einnig mörg meðaltöl saman.

Mig vantar hjálp með eina setningu í leiðbeiningunum fyrir verkefnið. Setningin er svona: Reiknaðu út áhrifastærðir, bæði þar sem meðaltöl eru borin tvö og tvö saman, en einnig fyrir mörg meðaltöl tekin saman…. Er það rétt skilið hjá mér að fyrri stærðin (tvö og tvö) sé Cohens d en sú seinni (mörg meðaltöl saman)sé fí merkt?

Ef fyrri stærðin er Cohens d þá er það vandamál að við erum með úrtaksmeðaltöl en ekki þýðismeðaltöl. Á þá að nota aðferðina sem kennd er á bls. 205 í Howell, þ.e. að nota úrtaksmeðaltöl deilt með the square root of the pooled variance?

Já, þetta er allt saman rétt skilið.

2003-09-10a

φ′, F og leiðrétting fyrir afkastahermi Lenths

Ef maður hefur ekki nægar upplýsingar til að reikna fí merkt út frá formúlunni á bls. 358 í Howell og reiknar í staðinn fí merkt út frá F og frígráðum þarf maður þá samt að nota leiðréttingarformúluna áður en maður fer með þetta í afkastahermi Lenth?

Lenth skilur SDt öðru vísi en Cohen. Þess vegna þarf að leiðrétta allar formúlurnar áður en þær fara inn í afkastagreini hans. Einfaldlega reiknið út SDt eða fí merkt, leiðréttið með Excel-skjalinu og setjið niðurstöðu inn hjá Lenth.

2003-10-10a

Hvað fer í hvaða hólf í afkastahermi Lenths?

Ég er stödd í afkastahermi Lenths og átta mig ekki alveg á hvað á að fara í hvert hólf þar. Eins og Model, Levels, Random factor og svo er næsti gluggi ekkert betri. Gætirðu komið með smá leiðbeiningar. Hjálpin í forritinu hjálpaði mér lítið.

Láttu allt eiga sig í fyrsta glugganum, þ.e. breyttu ekki Model, Levels, Random factor, o.s.frv. Ýttu einfaldlega á F-tests.

Í næsta glugga skaltu breyta „levels“ í samræmi við fjölda gilda á frumbreytunni hjá þér. Taktu eftir að ég geri ráð fyrir einhliða dreifigreiningu enda er það auðveldast að hugsa þetta svo. Þú breytur þessu með því að draga sleðann eða ýta á litla ferhyrninginn og slá síðan inn töluna (auðveldara).

Síðan breytir fjölda í hverju hólfi (n[within]) annað hvort með því að draga sleðann eða smella á ferninginn og slá inn viðeigandi tölu.

Þá stillirðu villudreifinguna (SD[within]) notaðu sömu aðferð og fyrr.

Að síðustu stillirðu inn staðalfrávik fyrir meðaltölin. Þú getur ýmist reiknað það út sjálf í höndunum út frá meðaltölum eða farið í Options/Effect SD helper.

Ef þú reiknar út frá áhrifsstærð t.d. reiknaðri út frá F-prófi, þá skaltu stilla SD[within] á 1.0 og SD[treatment] á stærð áhrifsstærðarinnar. Þú þarft þá einnig að leiðrétta áhrifsstærðina.

ódagsett

Hvað fer á ása myndritins í afkastahermi Lenths?

Þegar maður býr til grafið í Lenth er þá Power(treatment) á y-ás og n(within) á x-ás?

Já, einmitt!

2003-10-10b

Jafna fyrir staðalfrávik

Við erum með jafna skiptingu í hópa. Hvaða jöfnu eigum við að nota til að reikna út staðalfrávikið fyrir Cohens d. Höfum verið að fá gildi eins og 2,58 með aðferðunum í Howell (pooled variance). Getur það verið rétt? Hversu hátt getur d orðið?

Samlögð dreifitala samsvarar MSe í dreifigreiningartöflunni. Taktu kvaðratrót af því og þá færðu mat þitt á staðalfrávikinu í þýði.

Það eru engin takmörk á stærð Cohens d, það getur orðið óendanlega hátt. Tæplega 2,6 er afar mikil áhrif en samt möguleg. En þú sérð á einfaldan hátt hvort niðurstaðan fær staðist, þ.e. einfaldlega athugar muninn á meðaltölunum samanborið við kvaðratrótina af MSe.

2004-10-09a

Tvíhliða dreifigreining í afkastahermi Lenths

Við erum með gagnasafn með tveimur frumbreytum. Önnur er tvíkosta (eldri og yngri) en hin er minnisaðferð en hún tekur fimm gildi. Hvernig setjum við þetta í herminn?

Farið á afkastahermi Lenths t.d. með því að smella á viðeigandi tengiorð á heimasíðu námskeiðsins.

Bíða meðan java-forritlingurinn kemur upp. Velja Balanced ANOVA (any model) og ýta á Run selection. Þá sprettur upp gluggi með nokkrum valkostum.

Í efsta fellilistanum vel ég Two-way ANOVA. Í textareit merktum Levels breyti ég tölustafnum 3 í tölustafinn 5. Þá ætti að standa nákvæmlega row 2 col 5 í þessum reit. Smella síðan á takka sem er merktur með F tests (þú gætir þurft að stækka gluggann lítillega til að sjá hann.

Þá sprettur upp nýr og flóknari gluggi. Þar gætir þú þess að SD[Within] sé 1,0. Settu N[Within] á þann fjölda sem þú fyrirhugar í hverju hólfi sniðsins. Síðan stillir þú SD[row] og SD[col] á það fí-merkt sem þú vilt skoða. (Passaðu þig á að hafa leiðrétt það með Excel-síðunni á heimasíðu námskeiðsins.)

Þú getur prófað þig áfram með fí-merkt, fjölda í hverju hólfi eða afköstin sem þú vilt ná. Einnig er hægt að fá myndræna frammistöðu með því að fara í Options/Graph.

Gættu að einu. Við höfum aldrei getað fengið afköst fyrir samvirkni rétta með afkastareikni Lenths. Ég veit ekki í hverju meinið er fólgið. Það stendur alltaf til að kanna málið í fullri dýpt en önnur verkefni eru stöðugt í forgangi.

2004-10-09b

Cohens d er neikvæður

Ég átta mig ekki alveg á því hvað það merkir þegar d er í mínus. Hvernig túlkar maður það?(Smá meinloka í gangi).

Setjum sem svo að í úrtaki sé meðalhæð karla 180 cm og kvenna 170 cm og samlagt staðalfrávik sé 7,0 cm.

Ég get þá reiknað: d= (180−170)/7= 10/7= 1,4. Það þýðir að meðalhæð karla sé að jafnaði 1,4 staðalfrávikum meiri en meðalhæð kvenna.

En ég gæti einnig reiknað þetta svona: d= (170−180)/7= −10/7= −1,4. Það þýðir að meðalhæð kvenna sé að jafnaði 1,4 staðalfrávikum lægri en karla.

Í einu tilviki er niðurstaðan í mínus og í öðru í plús en niðurstaðan er ein og hin saman. Hér er eingöngu spurning um hvort kynið er haft til viðmiðunar. Við túlkum því neikvætt Cohens d alveg eins og jákvætt en verðum auðvitað alltaf að hafa í huga í hvora átt mismunurinn er (þ.e. hvort það sé körlum eða konum í hag í þessu tiltekna dæmi).

2004-10-12a

Endurgerð verkefna

Hvaða verkefni á að endurgera?

Ég er ekki með það á hreinu hvaða verkefni á að endurgera. Samkvæmt námskeiðslýsingu eiga lokaskil að innihalda öll verkefnin nema forverkefnið og væntanlega vefverkefnið. Hvað með gerð línulegs líkans? Á lokaverkefnið að innihalda allar kóðanirnar sem gerðar voru þar?

Á að skila skipanaskrá?

Það þarf að skila öllum verkefnum nema forverkefninu endurgerðu.

Það þarf að skila skipanaskrá með öllu þessu efni.

Ég miða við að endurgerðin verði heildstætt verkefni, þ.e. svipað og verkefni 6. Gagnrýni á rannsóknargrein stendur sér og því er eðlilegt að því sé skilað sér eða sem sérstökum kafla. Línulegt líkan gæti einnig staðið sér því sennilega fer það illa sem hluti af öðrum verkefnum. Vefverkefnið er eðli samkvæmt aðskilið.

Þetta myndu þá gera þrjú aðskilin verkefni, eitt þeirra langveigamest--og síðan vefverkefnið.

Gætið þess að keyra skipanaskrána (skránar) ykkar megin áður en þið sendið þær til mín. Slökkvið alveg á SPSS. Tvísmellið á skipanaskrána. Farið í Run/All. Yfirfarið niðurstöðurnar í niðurstöðuglugganum og gangið úr skugga um að allt virki. Skil á skipanaskrá er forsenda þess að ég geti farið yfir verkefnið.

2004-12-13a