Medicina Popolare Disclaimer MedPop Galenica domestica
♕ Correlazioni statistiche e causalità Biometria
HOME .php .html .pdf Biometria Epidemiologia Statistica

Autore: Peter Forster


clic per accedere

MedPop Medicina popolare
a cura di D. Rüegg

Dei dati statistici possono per definizione illuminare solo delle correlazioni e mai delle dipendenze causali.

È un insegnamento sin' dai tempi degli antichi filosofi greci, che il "cum hoc ergo propter hoc" (assieme quindi dipendente) è un grave errore di deduzione logica.
Malgrado sia banale questa differenza terminologica, si incontrano numerosissime "statistiche" che cortocircuitano correlato e causale tirando così molto spesso delle conclusioni completamente errate - non solo dei giornalisti, politici e responsabili di marketing, ma anche dei ricercatori stessi che si squalificano da brutto con simili mosse (forse perché non è più di moda l'insegnamento di logica formale). Personalmente smetto a leggere un tale elaborato appena me ne accorgo, → cestino. Se mi capita più volte nella stessa rivista, in futuro non la guardo più e mi dedico a qualcosa di meno futile o più divertente. 8>)__ .

Sono trattati i seguenti argomenti:
Correlazione e causalità Analisi di regressione Statistiche di paragone

1.  Correlazione verso causalità

Correlazione (statistica) it.Wikipedia Causalità it.Wikipedia Sincronicità it.Wikipedia Cum hoc ergo propter hoc de.Wikipedia Correlation does not imply causation en.Wikipedia

cum hoc ergo propter hoc (lat. ca. "assieme quindi dipendente") indica un'errore logico con il quale due eventi coincidenti vengono dichiarati come causa ed effetto. Chi commette questo duplice errore:

Si tratta di uno dei più divulgati errori logici dei nostri tempi (e forse anche di tempi passati), riportati ad infinitum dai mass media.

Esempio (secondo Bobby Henderson): La stima di pirati sui mari del globo, che ancora nel 1820 era di 35'000 si è ridotto fino al 2000 su 17. Nel medesimo lasso di tempo, la temperatura aerea globale è salita da 14.2°C a 15.8°C. Conoscendo i due "eventi":

Un quarto non scrive niente in merito (perché lo ritiene una coincidenza completamente casuale) e viene poi seriamente chiamato all'ordine dal suo capo redattore, perché non prende posizione incirca l'esistenziale discorso pubblico in merito alla pirateria e il riscaldamento globale.

Approfondimenti vedi → Classificazione delle fallacie: Fallacie di presupposizione it.Wikipedia.

Sono trattati i seguenti argomenti:
Una correlazione rappresentata come causalità Dalla correlazione alla causalità Implicazioni della confusione

1.1  Correlazione ≠ causalità

(Una correlazione rappresentata come causalità)
Di seguito un esempio di apparenza scientifica pubblicato di associazione di pediatri Statunitensi, commentato poi da Salman Khan dalla KHANacademy


cliccare per accedere

Collazione combatte l'obesità di adolescenti
In questo studio, pubblicato in Pediatrics dei ricercatori analizzarono i dati di 2'216 adolescenti durante un periodo di 5 anni dalle scuole pubbliche a Minneapolis-St.Paul, Minnesota.

I ricercatori scrivono, che gli adolescenti che fanno regolarmente collazione consumano meno grassi saturi ma più fibre vegetali e carboidrati che i loro compagni che saltano questo pasto. In più quelli che fanno regolarmente collazione sembrano più attivi fisicamente che i loro compagni saltapasti.

Nel tempo, costatarono i ricercatori, gli adolescenti che fanno regolarmente collazione aumentano meno di peso e hanno un'indice di peso corporeo inferiore che quelli "salta-collazione".

Salman Khan commenta questo peccato mortale (anti)scientifico (suberbia & acedia) ca. al seguente:


Pirati e riscaldamento climatico


◦⦆─────⦅◦

1.2  Dalla correlazione alle ipotetiche causalità

Dai dati statistici, rilevati o misurati ed elaborati regola d'arte (come descritto nel capitolo sulla statistica descrittiva) si possono dedurre delle coincidenze (correlazioni) più o meno strette e con vari indicatori sulla distribuzione e l'affidibilità del campione. Ulteriori elaborazioni inferenziali riescono poi a chiarire variabilità e significatività correlativa.

Non si riesce a dimostrare delle causalità con dei strumenti statistici.

Non si riesce p.es. a decifrare, se la correlazione tra colazione ↔ obesità dimostrata è dovuto al fatto:

A partire da questo punto non sono più richieste delle conoscenze statistiche bensì di creatività mentale, professionalità nel tema trattato, una dose di scetticismo, abitudine di formulare delle ipotesi e di falsificarli. Alla fine rimangono (forse) poche supposizioni plausibili.
Bisogna poi formularli, giustificarli e commentarli; cioè mettersi in discussione (che non è cosa di tutti).

Chi non si sente a fare tutto questo lavoro speculativo e di ragionamento pubblico per arrivare a una ipotesi (plausibile e stringente), meglio che ponga delle domande sugli punti non evidenti e non chiari. Partecipa meglio così alla progressione di sapere che sparando un'altro giudizio o un'ulteriore credenza (che non tiene) alla pattumiera esistente in merito.

◦⦆─────⦅◦

1.3  Implicazioni della confusione

Per evitare delle brutte figure (come nell'esempio cui sopra), le riviste scientifiche serie usano il metodo del "Peer Review" (revisione paritaria): sottopongono un'articolo del genere (anonimizzato) a degli collaudati esperti scientifici, sia del tema trattato che di statistica, chiedendo una valutazione formalizzata. Certo che queste procedure sono impegnative, ma una rivista scientifica rinomata si mantiene la ficucia dei lettori solo in questo modo.

I politici, giornalisti e manager del marketing coinvolti usano comunque questi testi per i loro scopi, anche se raramente sono interessati (o capaci) di interpretare le "sfumature" ragionevoli (che sarebbero le causalità).

Gli effetti sociali possiamo poi ammirare nella pubblicità televisiva per i musli a colazione che si servono spudoratamente di queste oscenità "scientifiche".

2.  Analisi di regressione

Regressione it.Wikipedia Regression analysis en.Wikipedia

Delle ipotesi formulate (come descritto sopra) sono al solito controllate con la "curva intercetta dei minimi quadrati". Il metodo più divulgato è chiamata regressione lineare, con la quale si tenta di stimare la "bontà di adattamento" della ipotesi e la significatività statistica dei parametri stimati. Si riesce a farsi un'idea, se un'ipotesi può essere plausibile o se è da scartare.

Visto che il metodo richiede specifiche conoscenze statistiche (e non solo) non intendo di approfondire il tema. Di seguito le spiegazioni di it.Wikipedia.

L'analisi della regressione è una tecnica usata per modellare ed analizzare una serie di dati che consistono in una variabile dipendente e una o più variabili indipendenti. La variabile dipendente nella equazione di regressione è modellata come una funzione delle variabili indipendenti più un termine d'errore. Quest'ultimo è una variabile casuale e rappresenta una variazione non controllabile e imprevedibile nella variabile dipendente. I parametri sono stimati in modo da descrivere al meglio i dati. Il metodo più comunemente utilizzato per ottenere le migliori stime è il metodo dei "minimi quadrati" (OLS), ma sono utilizzati anche altri metodi.

L'analisi della regressione può essere usata per effettuare previsioni (ad esempio per prevedere dati futuri di una serie temporale), inferenza statistica, per testare ipotesi o per modellare delle relazioni di dipendenza. Questi usi della regressione dipendono fortemente dal fatto che le assunzioni di partenza siano verificate. L'uso dell'analisi della regressione è stato criticato in diversi casi in cui le ipotesi di partenza non possono essere verificate. Un fattore che contribuisce all'uso improprio della regressione è che richiede più competenze per criticare un modello che per adattarlo. it.Wikipedia

3.  Statistiche di paragone

Placebo it.Wikipedia Nocebo it.Wikipedia Trattato su placebo e nocebo MmP

Il gratticapo di correlazione ➙ causalità non si pone in delle statistiche di paragone (confrontative): si paragonano direttamente i correlati di due statistiche (p.es. due medicamenti per la stessa malattia o di un medicamento e un placebo).

La difficoltà in questo caso è di garantire delle condizioni paragonabili (più simili possibile) per le "due statistiche". Questo richiede una meticolosa pianificazione del progetto e la garanzia, che i partecipanti ai test siano all'ignoto (p.es. della somministrazione di medicamento o placebo in un indagine a doppio cieco).

Arrivando al dunque, si trae la differenza tra le due correlazioni per poter giudicare l'effetto delle due misure.

Nell'esempio (finto) cui sopra, i medici seri parleranno di un successo del medicamento del ca. 20%, mentre i responsabili del commercio parlerebbero probabilmente di un un successo del ca. 50% (dimenticandosi che l'effetto placebico è del ca. 30%).

N.B. In gergo medico si chiamano "placebo" e "nocebo" questo che statisticamente sono delle variabili casuali e parametri ignoti, che creano degli effetti al di là del medicamento. Un classico esempio di arroganza medica per non dover studiare degli effetti oltre farmacologici che influiscono evidentemente anche il percorso di una malattia.

Statisticamente sarebbe desiderabile di fare non solo un paragone tra medicamento e placebo ma anche con "far nulla". Certo che in medicina questo non è sempre fattibile per motivi etici, ma ci sono anche delle malattie con le quali si potrebbe: mia nonna curatrice disse, che un'influenza trattato dal medico dura quindici giorni, curato in proprio due settimane.

4.  Allegati

4.1  Sitografia

MedPop

description: Biometria, Statistica, epidemiologica, descrittiva, inferenziale, Indici di peso corporeo, Rischio peso, Colesterolemia, Lipidemie, MedPop, Medicina popolare
description: Insidie, statistiche, Visualizzazione grafica, Standardizzazione, Statistiche strane, Statistica descrittiva, Statistica inferenziale, MedPop, Medicina popolare
description: Dati, statistici, fondamentali, Media, moda, mediana, Deviazione standard, Indicatori, distribuzioni, Campo di variazione, Coefficiente di variazione, interpretazione, Lavoisier, somma, totale, Medie, mobili, Ovvietà, paradosso di Simpson, fattore d'inganno, Contesto, MedPop, Medicina popolare
description: campionamento, sondaggi, probabilistico, randomizzazione, Errori, caso, Variabilità, stima, Errore standard, limiti fiduciali, significatività, chi-quadro, Yates, Fisher, Meta-analisi, Eterogeneità, MedPop, Medicina popolare
description: Formula di Broca, Body mass index, BMI, IMC, giovani, Indice di massa corporea, mortalità
description: biometria, antropometria, medicina popolare, profana, laica, complementare, rischio peso, aspettativa vita, corporeo, Indici, IMC, indice di massa corporea, BMI, body mass index, Valutazione, biologiche, biologica, Implicazioni, mediche, sanitarie, Determinanti, peso, Valutazione peso, Misure, pazienti, sottopeso, sovrapeso, magrezza, obesità, Peter Forster, Daniela Rüegg
description: medicina popolare, colesterolo, colesterolemia, mortalità, stress, prevenzione, sanitocrazia, lipoproteine, Lipidemie, Valutazione, rischi, HDL, LDL, valori di referenza, variazioni, statine, resa, emboli, trombi, Correzioni, infarto, occlusioni vasali

Wikipedia

Vari

4.2  Commenti

alla pagina Biometria / ♕ Correlazioni statistiche e causalità: ev. cliccare sul titolo per accedere.

Peter29 December 2011, 11:21

Test

Proveniente da Redazione: http://pforster.no-ip.org/~admin/pmwiki/pmwiki.php/Biometria/CorrelazioneCausalita
ultima modifica December 29, 2011, at 06:13 PM
Cc by P. Forster nc-2.5-it