Paradosso sulla coerenza della “media delle medie”

Qualche giorno fa, ho dovuto spiegare questo concetto: non è detto che la “media delle medie” sia coerente [cioè vada nella stessa direzione, in aumento o in riduzione] con l’aumento o riduzione delle medie parziali, che aggregate danno poi la stessa media globale.

E’ un errore di percezione, del nostro “buon senso” pensare che ci sia tale coerenza. Tale apparente paradosso è noto come il nome di “Paradosso di Simpson” [non mi riferisco ad Homer… 🙂 ].

Per chi volesse approfondire, sotto il punto di vista tecnico, consiglio questa lettura:
E. H. Simpson “The interpretation of interaction in contingency tables” – Journal of the Royal Statistical Society (1951).

Facciamo un esempio:
date queste 2 tabelle di dati statistici, relative allo stesso campione di popolazione:

Lavoratori senza titolo studio con titolo studio Totale
fascia età 1 20 80 100
fascia eta 2 120 25 145
fascia eta 3 10 40 50
Totale 150 145 295
Tasso disoccupazione senza titolo studio con titolo studio
fascia età 1 30% 15%
fascia eta 2 5% 4%
fascia eta 3 10% 5%

Si nota, ad occhio che nei casi delle 3 fasce d’eta, la disoccupazione è più alta tra le persone senza tiolo di studio rispetto a chi ha un titolo [in 2 casi su 3 addirittura con un valore doppio].

Di solito il lettore trae questa prima considerazione:
tra persone senza titolo di studio ci sono più disoccupati che tra persone con il titolo

e poi arriva a questa, aggiungendo una correlazione “mentale” causa-effetto [che è il tipico motivo per il quale si leggono tabelle come questa]:
il titolo di studio aiuta a trovare lavoro.

Se si calcola il numero esatto di lavoratori disoccupati, a partire dalle percentuali si ricava qual è la percentuale complessiva di disoccupati, senza considerare le età [che sono dei ragguppamenti arbitrari del tutto].

Come si può vedere, in realtà i disoccupati con titolo di studio sono percentualmente di più di quelli senza tale titolo.

Numero disoccupati senza titolo
studio
con titolo
studio
fascia 1                                6,00                                            12,00
fascia 2                                6,00                                              1,00
fascia 3                                1,00                                              2,00
Totale                                13,00                                            15,00

Da questi valori in termini assoluti si può calcolare il tasso di disoccupazione, diviso tra senza/con titolo di studio, senza tenere conto dell’età.

Si ottiene:

% disoccupati
senza titolo studio 8,67%
con titolo studio 10,34%

Da questi 2 numeri si può constatre che, in realtà i disoccupati con titolo sono percentualmente di più di quelli senza titolo!

Prima di trarre conclusioni dai valori delle medie parziali, occorre considerare attentamente i valori provenienti dal campione originario. Questo paradosso è dovuto al fatto che il tasso di disoccupazione è nettamente maggiore nel gruppo che ha una maggiore percentuale di persone con titolo di studio.

Trascurare l’esistenza di due relazioni fondamentali:
– disoccupazione ed età
– età e titolo di studio conseguito
fa giungere a conclusioni errate.

In questo caso preparato a tavolino la contraddizione è evidente.

Nelle analisi statistiche su dati reali può capitare di non accorgersi delle relazioni implicite esistenti tra le variabili e limitarsi ad analizzare dati aggregati senza incrociarli con le variabili essenziali. In tale caso la contraddizione non verrebbe percepita, con conseguenze potenzialmente molto gravi.

Annunci
Questa voce è stata pubblicata in lavoro e contrassegnata con , , , , . Contrassegna il permalink.

5 risposte a Paradosso sulla coerenza della “media delle medie”

  1. righe orizzontali ha detto:

    Ho fatto il Classico Dan, mi perdoni se non ci ho capito granché?

    Mi piace

  2. emajoy ha detto:

    Sai che ti dico!? Homer for President!!

    Mi piace

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...