Prosjekt-/masteroppgaver eksakte tester

Eksakt testing i diskrete fordelinger med plageparametre

I hypotesetesting ønsker vi at sannsynligheten for at p-verdien skal bli mindre enn eller lik signifikansnivået alltid er mindre enn eller lik dette signifikansnivået – for alle parametre som tilfredsstiller nullhypotesen, og uansett hvordan vi velger signifikansnivået. Vi kaller slike p-verdier gyldige.

Hvis nullhyptesen for eksempel er at forventningsverdien i en normalfordeling er mindre enn eller lik null, oppnår vi dette ved å finne p-verdier ved hjelp av den vanlige t-observatoren i tilfellet der nullhypotesen er vanskeligst å avsløre, nemlig når forventningsverdien er lik null.

I andre tilfeller er det vanskeligere. Hvis nullhypotesen er at to binomiske sannsynligheter er like, er det vanskelig å identifisere en «vanskeligst mulig» plassering av parametrene, som vi kan basere undersøkelsen av en observator på. Én måte å angripe problemet på, er å bruke asymptotisk fordeling av en observator (som den klassiske khikvadratobservatoren for en 2 × 2-kontingenstabell, som asymptotisk er khikvadratfordelt med én frihetsgrad). P-verdiene vi finner ved en slik tilnærming er imidlertid ikke gyldige i den forstand som nevnt ovenfor. Det fins også eksakte tester, som Fishers eksakte test, som er basert på betinging med hensyn på det totale antall suksesser i de to binomiske fordelingene. Denne testen gir gyldige p-verdier.

Det fins imidlertid tester som ikke er basert på betinging, og som gir gyldige p-verdier og bedre teststyrke enn Fishers test. Disse er gjerne regnekrevende, og er basert på maksimal p-verdi når vi lar parametrene gjennomløpe det området nullhypotesen spesifiserer, eller et konfidensområde for parametrene under hullhypotesen. En mulighet som ikke gir gyldige p-verdier, er å erstatte de ukjente parametrene med sannsynlighetsmaksimeringsestimatene under nullhypotesen.

Relevante problemstillinger er da:

På hvilke observatorer skal slike metoder baseres for at teststyrken skal bli størst mulig?
Vi kan betrakte p-verdier – gyldige eller ugyldige – som observatorer, noe som legger til rette for å kombinere metoder som de nevnt ovenfor. Hvordan skal dette gjøres for å oppnå god teststyrke?
Hva er gode mål for teststyrke over hele parameterrommet?
Hvilke typer tester er disse metodene velegnet for?

I oppgaver innen dette temaet vil programmering og databehandling være sentralt – for å finne maksima numerisk og mer generelt å finne gode algoritmer, for å undersøke teststyrke og for å framstille resultater grafisk. Ta kontakt med Mette Langaas eller Øyvind Bakke hvis du vil høre mer om disse testmetodene.

Referanser

Berger, R. L. og Boos, D. D. (1994): «P-values maximized over a confidence set for the nuisance parameter», Journal of the American Statistical Association (89), nr. 427, s. 1012–1016

Boschloo, R. D. (1970): «Raised conditional level of significance for the 2 × 2-table when testing the equality of two probabilities», Statistica Neerlandica (24), nr. 1, s. 1–35

Lloyd, C. J. (2008): «Exact p-values for discrete models obtained by estimation and maximization», Australian & New Zealand Journal of Statistics (50), nr. 4, s. 329–345