Permutationstest i linjär regression
Abstract
Inom statistisk dataanalys är linjär regression en metod som används för att anpassa en linje till datapunkter. Metoden kan användas för att studera och dra slutsatser kring samband mellan olika faktorer, vilket exempelvis kan vara relevant inom medicinska studier för att undersöka effekten av en viss behandling. När en linjär modell anpassats till en uppsättning datapunkter används ofta parametriska statistiska test för att dra slutsatser kring samband mellan olika variabler i modellen, där t-test är en typ av test som vanligen används. Som ett alternativ till konventionella parametriska test har permutationstestet börjat användas allt mer under de senaste decennierna. I permutationstest konstrueras en referensfördelning genom permutationer under nollhypotes, istället för att utgå från en redan existerande referensfördelning som t-testet gör. Permutationstest är beräkningstunga och kräver andra antagenden än t-test, som förutsätter normalfördelade feltermer med väntevärde 0 och konstant varians. I denna rapport presenteras en del av teorin för permutationstest inklusive kravet på utbytbarhet, samt testets tillämpning inom linjär regression. Med hjälp av simuleringar studeras data med feltermer från olika fördelningar för att jämföra hur permutationstest presterar jämfört med t-testet. Datan som undersöks har feltermer med tunga svansar, skev fördelning, utstickare och icke-konstant varians. Resultaten visar att t-testet verkar vara robust för alla typer av avvikelser förutom icke-konstant varians. Permutationstest bevarar signifikansnivån för samtliga datasimuleringar och är giltigt även för icke-konstant varians. Permutationstest presterar därmed ibland bättre, men aldrig sämre, än t-test för de undersökta datatyperna.
Degree
Student essay
Collections
View/ Open
Date
2019-06-26Author
Christopher Backström
Adina Berg
Marcus Forsberg
Daniel Skorczynski
Samuel Vrede