OBIETTIVO:
differenziare, anche con l'aiuto di un semplice esempio, un modello deterministico da un modello stocastico
Una delle classificazioni più attuali dei modelli matematici utilizzati nei diversi settori delle Scienze, compreso quello dell'epidemiologia, prevede l'inquadramento nelle seguenti due tipologie:
I modelli deterministici sono i più semplici; in essi, le variabili di input assumono valori fissi. E' vero che i risultati (output) generati da questi modelli possono tener conto, entro certi limiti, della variabilità e dell'effetto del caso (ad esempio, con appropriati metodi statistici possono essere calcolati gli intervalli di confidenza); tuttavia, si tratta sempre di elaborazioni di tipo deterministico, in quanto non si tiene in considerazione l'incertezza associata alle variabili di input.
L'ideale deterministico, tipico della cultura dell'era newtoniana, prevede che i fenomeni naturali possano essere considerati in una logica basata sul presupposto che ogni evento sia ricollegabile a una causa che lo provoca. Sulla base di questo principio, formalizzato inizialmente da Laplace (1749-1827), molti scienziati ritennero che, una volta noto lo stato iniziale di un sistema e le forze agenti su di esso, fosse possibile individuare con precisione pressoché assoluta l'evolversi del sistema applicando le leggi della meccanica newtoniana. Pertanto, si riteneva che fosse possibile, almeno in via di principio, ottenere metodi di misura così precisi da eliminare ogni indeterminazione sui valori misurati.
Attualmente questo approccio è stato abbandonato, in quanto incompatibile con il "principio di indeterminazione di Heisenberg", a favore della concezione probabilistica introdotta dalla meccanica quantistica.
Al contrario, i modelli stocastici (stocastico = dovuto al caso, aleatorio, dal greco stochastikòs=congetturale) tengono in considerazione le variazioni (causali e non) delle variabili di input, e quindi forniscono risultati in termini di "probabilità". È importante sottolineare che ciò che differenzia i modelli deterministici da quelli stocastici è che in questi ultimi si tiene conto della variabilità dei dati di input.
In genere i modelli stocastici hanno una struttura più complessa di quelli deterministici. Di maggiore complessità sono i calcoli, che vengono eseguiti sempre con l'ausilio del computer. Esistono anche applicazioni dedicate specificamente a questo scopo, fra le quali una delle più note è "@RISK" (Palisade Corp.).
Ovviamente i modelli stocastici sono anche più affidabili in quanto, proprio perché tengono conto del caso, sono capaci di fornire risultati più aderenti alla realtà.
Supponiamo che, in base a un nostro semplice e immaginario modello, la incidenza di una malattia sia desumibile dal prodotto di due sole variabili, v1 e v2, ciascuna delle quali può assumere un valore compreso fra 0 e 1. Possiamo allora creare il seguente modello:
Purtroppo non conosciamo con esattezza il valore di v1 e v2, anche perché nel "mondo reale" questi valori sono soggetti a variazioni. Abbiamo però elementi che testimoniano che v1 può oscillare fra 0.2 e 0.3 e che v2 può oscillare fra 0.4 e 0.6.
L'approccio deterministico è molto semplice. Ad esempio, la cosa più ragionevole potrebbe essere quella di utilizzare come input del modello i valori medi di v1 e v2 per calcolare uno scenario "medio"; alternativamente si potrebbero scegliere i valori estremi per calcolare il migliore o il peggiore scenario. Si otterrebbero rispettivamente i seguenti valori di incidenza:
scenario medio: i1 = 0.25 * 0.5 = 0.125 = 12.5%
scenario migliore: i2 = 0.2 * 0.4 = 0.08 = 8%
scenario peggiore: i3 = 0.3 * 0.6 = 0.18 = 18 %
Il limite del modello è che fra le possibilità calcolate (migliore e peggiore) ve ne sono infinite altre che, per quanto possiamo dedurre dal modello, sono tutte egualmente probabili.
L'approccio stocastico tiene invece conto della variabilità delle due variabili di input, i cui valori potrebbero assumere - ad esempio - una distribuzione simile a quella indicata nei due grafici sottostanti (generati con @Risk) ove le barre orizzontali sotto agli istogrammi indicano il 5° e il 95° percentile.
Successivamente, il calcolo dell'incidenza viene effettuato attraverso una simulazione con il metodo "Montecarlo". In pratica, il programma ha estratto a caso, tenendo conto delle suddette distribuzioni di frequenza, un valore per v1 e un valore per v2. I due valori sono stati moltiplicati fra loro, ottenendo un valore di incidenza. Questo processo di estrazione e moltiplicazione di coppie di valori è stato ripetuto per centinaia di volte, ottenendo centinaia di valori diversi di incidenza, che sono stati utilizzati per generare la seguente distribuzione di frequenza.
Nota che il valore medio dell'incidenza (0.124) è analogo a quello medio ottenuto con il modello deterministico. Con il modello stocastico, si ha l'incomparabile vantaggio di poter prevedere - su base probabilistica - l'intera gamma di possibilità di andamento del fenomeno in studio. Ad esempio, dall'istogramma della distribuzione per incidenza si può desumere che: (1) la probabilità che l'incidenza sia <0.1023 è del 5%; (2) la probabilità che l'incidenza sia >a 0.1488 è del 5%; (3) la probabilità che l'incidenza sia compresa sia compresa fra 0.1023 e 0.1488 è del 90%.
AFTER HOURS: Il determinismo di Laplace
NELLA PROSSIMA UNITÀ:
si illustra a scopo didattico il classico, e ormai storico, modello di Reed e Frost, e si verifica la sua efficienza nella simulazione di una epidemia.