Gjerdes Hjørne
FOTO: TONE RISE

Løgn, forbannet løgn og statistikk

Du får beskjed av legen din om at de nye p-pillene dine øker risikoen for å få livstruende blodpropp med 100 prosent. Tar du dem?

Problemet med relativ risiko er at det ikke sier noe om hva som er risikoen i utgangspunktet. En hundre prosent økning i risiko kan (…) bety en økning fra én til to personer.

Da det britiske svaret på Legemiddelverket (CSM) i 1995 informerte om en slik risikoøkning ved å gå over på tredje generasjons p-piller, ble det slått stort opp i mediene, og mange kvinner bestemte seg forståelig nok for å kutte ut pillene (Hope, 1996). Ifølge Ann Furedi (1999) førte det til 13 000 flere aborter i England og Wales året etter, mens helseutgiftene økte med 46 millioner pund og antallet fødsler ble langt høyere enn i «normalår» (da er det kanskje en slags dyster ironi i at risikoen for blodpropp ved normal fødsel er dobbelt så høy som risikoen for å få det ved bruk av pillene (Mills 1996 i Furedi 1999)).

Men hvor mye er egentlig 100 prosent? Studiene advarselen bygget på, viste at av 7000 som tok den tidligere generasjonen p-piller, ville én få blodpropp. Dette antallet økte til to ved tredjegenerasjonspillen.

Den relative risikoen økte altså med 100 prosent. Men den absolutte risikoen økte med én person blant de 7000. Hadde tallene blitt rapportert i absolutt risiko, er det liten grunn til å tro at så mange hadde blitt uroet.

Problemet med relativ risiko er at det ikke sier noe om hva som er risikoen i utgangspunktet. En hundre prosent økning i risiko kan, som i eksemplet over, bety en økning fra én til to personer. Men det kan like gjerne bety en økning fra 2000 til 4000 personer. Undersøkelser har da også vist at folk sliter med å forstå relativ risiko (Covey 2007). Likevel ser vi til stadighet at mediene presenterer risiko i relative termer. Det gir kanskje mer oppmerksomhet og bedre overskrifter, men fører også med seg unødig uro når det er risikoøkninger som rapporteres.

Et godt eksempel kan hentes fra nyhetsbildet den siste tiden. Du har sikkert sett medieoppslag om at bearbeidet rødt kjøtt kan føre til kreft. Faktisk har Verdens helseorganisasjon (WHO) klassifisert bearbeidet rødt kjøtt i samme kategori som røyking, asbest og plutonium (dette betyr naturligvis ikke at disse er like farlig, det betyr at det foreligger tilstrekkelig bevis for at de fører til kreft).

Motsatt kan det gi urealistiske forhåpninger når risikoreduksjonen presenteres i relative former. Mange kvinner deltar for eksempel i mammografiscreening. Sier vi at deltakelse i mammografiscreeningprogrammet reduserer risikoen for å dø av brystkreft med 25 prosent, høres det veldig bra ut. Den relative risikoreduksjonen får det til å fremstå slik. I absolutt risiko kan det imidlertid innebære at tre av 1000 kvinner vil dø av brystkreft i stedet for fire av 1000 (Gaissmaier og Gigerenzer, 2008). Fortsatt er det bra, naturligvis, men vi ser med en gang at hvordan tallene fremstilles, er viktig for hvilket inntrykk vi danner oss og for hvor godt de setter oss i stand til å treffe informerte valg og beslutninger.

Hadde tallene blitt rapportert i absolutt risiko, er det liten grunn til å tro at så mange hadde blitt uroet.

Dette illustrerer et mer generelt problem: Mange sliter med å forstå helt vesentlig informasjon som presenteres av helsevesen, medikamentprodusenter og behandlingstilbydere. Særlig gjelder dette når man vurderer omfanget av falske positive resultater ved diagnostiske tester.

La oss gå tilbake til mammografiscreeningen. Den kan korrekt indikere at du har kreft, og den kan korrekt indikere at du ikke har kreft. Men den kan også indikere at du ikke har kreft, selv om du faktisk har det. Men dette er heldigvis sjelden. Mer vanlig er det at testen indikerer kreft, på tross av at du ikke har det – falsk positiv.

Basert på tall fra det amerikanske helsevesenet gjorde Gerd Gigerenzer (2008) og hans kolleger ved Harding Center for Risk Literacy en undersøkelse blant tyske og amerikanske leger, hvor legene ble bedt om å estimere sannsynligheten for at en symptomfri kvinne på mellom 40 og 50 år med positiv mammografiscreening faktisk har brystkreft, basert på følgende:

Sannsynligheten for at en kvinne har brystkreft, er 0.8 prosent
Dersom en kvinne har brystkreft, er det 90 prosent sannsynlighet for at hun tester positivt i screeningen (testsensitivitet)
Dersom en kvinne ikke har brystkreft, er det likevel syv prosent sannsynlighet for at hun tester positivt i screeningen (falsk positiv-rate).

Blant de tyske legene konkluderte en tredjedel med at sannsynligheten for kreft var rundt 90 prosent, median-svaret var 70 prosent. I den amerikanske gruppen anslo 95 av 100 leger at sannsynligheten lå rundt 75 prosent.

Det riktige svaret er 9 prosent.

Dette kan lettere forklares ved å gjøre andelene om til frekvenser (telle antall forekomster):
0,08 prosent kvinner har brystkreft, altså 8 av 1000.
Av disse åtte, vil syv få det korrekt bekreftet i mammografitesten.
Av de resterende 992 kvinnene som ikke har brystkreft, vil rundt 70 (syv prosent) likevel teste positivt i screeningen.

Da kan vi sette dette sammen: syv korrekte positive tester + 70 falske positive tester = 77 kvinner med positive tester. Av disse har syv faktisk brystkreft. Sannsynligheten for at de som tester positivt, har brystkreft, blir altså 7 av 77, tilsvarende 1 av 11, eller omtrent 9 prosent. Når vi skal forklare dette til pasienter, er det kanskje mest hensiktsmessig å sette det opp i et diagram (Gigerenzer 2008):


Flere undersøkelser har vist at mange av de som har fått beskjed om at de har testet positivt på brystkreft, i ettertid – selv etter de har funnet ut at de faktisk ikke har det – sliter med uro og angst. Det gjør dette ekstra viktig. Noen testresultater er dessuten mer skremmende og dramatiske enn andre. Ved en konferanse om AIDS i 1987 rapporterte daværende senator i Florida Lawton Chiles at av 22 blodgivere i Florida som hadde fått beskjed om at de hadde testet positivt for HIV, hadde syv begått selvmord (og man kan bare spekulere på hvordan et slikt testresultat slo ut i livene til de øvrige 15). Dette blir om mulig enda mer tragisk når det senere kom frem at selv om resultatet av denne spesifikke testen (Enzyme-Linked Immunosorbent Assay, ELISA) viste at noen hadde HIV (testet positivt), var sjansen for at vedkommende faktisk var smittet bare femti prosent (Gerald Stine 1999).

Men før du lar din harme gå utover testmakerne, merk dette: testen var særdeles nøyaktig! ELISA ga rundt 0,1 % sjanse for falsk positiv og 0.01 % sjanse for falsk negativ.

Så hvordan går dette opp?
Det må ses i lys av at blant 10.000 menn med det som omtales som «low-risk behaviour», var det én som virkelig hadde HIV, og som da også testet positivt. Av de resterende 9.999 mennene som ikke hadde HIV, ville 9.998 teste negativt, mens én ville teste falskt positivt. Med andre ord: en falsk positiv for hver andre positive test, 50–50. Dette er åpenbart informasjon som alle som tester seg, må få forklart på en måte de forstår.


FOTO: ILLUSTRASJONEN ER BASERT PÅ FOTOGRAFIER FRA ISTOCK

Å ha en viss grunnleggende forståelse for slike tall er også viktig når vi gjøres til kunder først, pasienter siden. Vi bombarderes med tilbud, reklamer og annonser om medikamenter, behandlinger og lignende. Budskapene i disse kan utnytte statistiske vanskeligheter, for å overbevise oss om at vi er i faresonen for det ene eller det andre. Kreftsenteret Sloan-Kettering kjørte for eksempel følgende annonse i New York Times (Woloshin m.fl., 2008):

De tidlige tegnene på at du har tykktarmskreft:
Du føler deg bra
Du har god appetitt
Du er bare 50 år

Det er klart at det her mangler en del viktig informasjon – først og fremst hvor sannsynlig det er at man får tykktarmskreft i utgangspunktet. Da kunne man tenkte seg at det ble oppgitt i annonsen at 150 000 amerikanere rammes. Et urovekkende stort tall. Men den oppmerksomme leser vil da spørre seg: 150 000 av hvor mange?

Siden vi her snakker om USA, må det bli 150 000 av rundt 300 millioner. 150 000 delt på 300 millioner, er 0,0005, altså 5 av 10 000, eller 0,05 prosent. Hvorvidt man mener disse tallene alene (uten å ta hensyn til familiehistorikk, symptomer, osv.) er grunn til bekymring, er en vurdering den enkelte selv må gjøre. Men da må man først gis et grunnlag for å forstå tallene.

Kostnadene av at pasienter og potensielle pasienter ikke fullt ut forstår informasjonen de får, kan være store. Først og fremst for den enkelte, ved at unødig uro og bekymringer kan gå utover helse og livskvalitet, det kan gi unødige økonomiske belastninger og det kan medføre unødvendig behandling med tilhørende bieffekter. I tillegg vet vi at overdiagnostisering har vesentlige samfunnsmessige kostnader. Og mest av alt: Pasienter har i alle tilfeller rett til å få vite fordeler og ulemper med behandlinger, og å få presentert disse på en måte som setter dem i stand til å gjøre informerte og veloverveide valg for det som i ytterste konsekvens kan være et spørsmål om liv og død.
ole.andre.gjerde@radiograf.no

Til toppen