Storskalig nätverksestimering Utvärdering av en ny metod för glesa nätverk
Sammanfattning
Partiell korrelation mellan variabler kan implicit erhållas genom precisionsmatrisen. För att estimera denna kan den empiriska kovariansmatrisen inverteras. Problem uppstår när antalet variabler p är större än antalet observationer n, eftersom kovariansmatrisen då får låg rang och inte kan inverteras. Tidigare metoder för att lösa detta problem är osäkra och därför har en metod vid namn k-glasso utvecklats. I oktober 2017 publicerades artikeln “Improving the Graphical Lasso Estimation for the Precision Matrix Through Roots of the Sample Covariance Matrix” [1], där k-glasso presenterades. I artikeln konstaterades att denna metod presterar bättre än föregående metoder. Syftet med denna studie var att undersöka hur väl k-glasso presterar i att estimera stora glesa precisionsmatriser som liknar nätverk från tillämpningar. I simuleringen genererades två blockdiagonala precisionsmatriser för olika värden på p, där de underliggande nätverken hade en fördelning av typ scale-free. Dessutom undersöktes en nätverksmodell från originalartikeln i två variationer. Den k:te roten ur den empiriska kovariansmatrisen beräknades genom att ta k-roten ur diagonalen i dess egenvärdesdekomposition. R-funktionen huge() användes för att beräkna k-glassoestimaten. Sedan transformerades estimatet tillbaka genom att upphöja estimatet till k. Genom 100 replikat beräknades ett medelvärde för olika utvärderingsmått. Metoden applicerades även på verklig cancerdata. Resultaten från denna studie var inte samstämmiga med originalartikelns resultat. Slutsatsen av den här studien är att metodens prestation verkar vara databeroende.
Examinationsnivå
Student essay
Samlingar
Fil(er)
Datum
2019-06-18Författare
Andersson, Jenny
Bertilsson, Rebecka
Foogde, Helena
Köllerström, Lovisa
Lindström, Robin