OBIETTIVO:
apprendere l'enunciato della "Legge dei grandi numeri" e l'esistenza di una probabilità "a posteriori"
Chiunque, con un minimo di ragionamento e di buon senso, può arrivare alla conclusione che, lanciando una moneta, la probabilità teorica che esca una delle due facce è pari a 1/2. Se vuoi verificare se-e-quanto la teoria corrisponde alla pratica, non devi far altro che armarti di molta pazienza e lanciare la moneta più volte, registrando i risultati e poi studiarli da un punto di vista statistico.
Supponiamo che tu abbia effettuato tre serie di 10, 100, e 1000 lanci, ottenendo i risultati riassunti nella tabella che segue.
Puoi osservare che, aumentando il numero dei lanci, le frequenze percentuali tendono ad avvicinarsi al valore 50, che è la probabilità teorica che esca ognuna delle due facce.
Generalizzando i risultati, si può affermare che, esaminando un gran numero di eventi, la frequenza relativa di un evento aleatorio si avvicina alla probabilità teorica dell'evento. In altre parole: la differenza fra il valore osservato nella pratica e il valore teorico atteso tende a diminuire all'aumentare del numero di prove che si eseguono. Questa affermazione rappresenta la legge dei grandi numeri.
A questo punto bisogna sottolineare che, in epidemiologia, molto spesso si studiano eventi aleatori per i quali non è possibile calcolare la probabilità teorica a priori. In questi casi torna utile la legge dei grandi numeri: infatti accettiamo come probabilità, che chiamiamo "probabilità statistica", la frequenza relativa di un evento che si ottiene da un numero abbastanza elevato di prove o di osservazioni, tutte effettuate nelle stesse condizioni.
Ad esempio, non è possibile sapere la probabilità che esca "testa" lanciando una moneta truccata. L'unico modo per conoscere tale probabilità è di lanciare un gran numero di volte la moneta registrando i risultati. Ad esempio, su 1000 lanci otteniamo 612 volte testa. Allora puoi stimare che la probabilità di ottenere testa con quella moneta sia pari a 0.612. Questa probabilità ottenuta empiricamente può essere soltanto stimata, ma non calcolata con precisione. Quasi certamente se tu facessi un'altra serie di 1000 lanci otterresti un risultato lievemente diverso! Ovviamente, più alto è il numero di prove e maggiore è la precisione della stima.
Studiando le malattie a livello di popolazione si possono raccogliere dati indispensabili per rispondere a quesiti che coinvolgono la probabilità statistica. Ad esempio, potrebbe essere interessante rispondere a domande del tipo:
Evidentemente si tratta di domande per le quali non può essere calcolata una probabilità teorica (a priori). È invece necessario procedere empiricamente, raccogliendo dati sul fenomeno che ci interessa e poi calcolare la probabilità a posteriori sfruttando la legge dei grandi numeri.
Un metodo statistico basato sulla probabilità a posteriori viene utilizzato per calcolare la probabilità di una persona di essere in vita o di morire in un certo periodo di tempo. La Tabella a lato rappresenta la distribuzione della popolazione italiana nell'anno 2000 (fonte dei dati: ISTAT) rapportata a 100.000 individui. In essa viene riportato, separatamente per maschi e femmine, il numero di persone in vita a età raggruppate in classi di ampiezza 5 anni. Sulla base dei dati contenuti nella tabella si possono calcolare sia le probabilità di morte che di vita per una persona appartenente a ogni classe di età.
Per esempio, per trovare la probabilità che un maschio di 45 anni muoia nei 5 anni successivi occorre considerare che nel periodo sono morti 1308 individui (ossia 96089-94781) su 96089 in vita all'inizio del periodo stesso. La probabilità di morte si ottiene calcolando il rapporto fra il numero di morti nel quinquennio considerato e il numero di vivi a 40 anni:
Confrontando i dati delle tavole di mortalità di anni diversi si può monitorare indirettamente lo stato di salute complessivo di una popolazione e i progressi dell'assistenza medica. Ad esempio, nell'anno 1987 la probabilità di morte nei 5 anni successivi per un maschio di 45 anni era dell'1.84%, mentre nel 2000 tale probabilità era scesa a 1.36%.
Oltre alla probabilità di morte, si può calcolare la probabilità di sopravvivenza. Ad esempio, la probabilità che una persona di sesso maschile di 45 anni resti in vita nei 5 anni successivi si ottiene con il rapporto fra il numero dei maschi vivi a 50 anni e il numero di vivi a 45 anni:
Nota che la somma (probabilità di essere in vita)+(probabilità di morire) deve essere pari a 1. Quindi, una volta nota la probabilità di morte, la probabilità di sopravvivenza si può ottenere anche facendone il complemento a 1: probabilità di sopravvivere = 1 - probabilità di morire.
Se si raccolgono dati riguardanti l'andamento della mortalità nei pazienti affetti da una certa malattia, si possono compilare tavole utili a esprimere con una certa precisione il destino di un paziente (quantificare la prognosi). Ad esempio, per il cancro della prostata si potrebbero ottenere i dati riassunti nella Tabella a lato. In tal modo, alla domanda del paziente cui venisse diagnosticata la malattia, il medico potrebbe rispondere affermando che il 90% dei pazienti di quel tipo è ancora in vita dopo 1 anno, e che tale percentuale scende a 67 anni dopo 5 anni, e si riduce a 58 dopo 10 anni.
AFTER HOURS: Errori sulla strada della ragione
NELLA PROSSIMA UNITÀ:
inizia il capitolo «Campionamento». In essa si spiega perché, per convenienza o necessità, molto spesso si studia un campione invece dell'intera popolazione.