BENVENUTO   |   Login   |   Registrati   |
Imposta Come Homepage   |   Ricerca Avanzata  CERCA  

SCIENZAinATTO/ La legge di Benford

Pubblicazione: - Ultimo aggiornamento:

Tavole dei Logaritmi  Tavole dei Logaritmi

Guardando le pagine contenenti le tavole dei logaritmi (la carta delle pagine, non solo quello che vi era stampato!) un astronomo inglese di fine Ottocento si accorse di una apparente stranezza nella distribuzione delle prime cifre dei numeri che appaiono in moltissimi fenomeni. Oggi questa stranezza è diventata una teoria non ancora ben compresa, ma ampiamente utilizzata in statistica, informatica e nell'investigazione delle frodi, per esempio quelle fiscali. L’articolo ricostruisce la storia dell’analisi di questo comportamento un po’ «strano» di insiemi di dati reali presi dalle più diverse situazioni.
Una lettura abbastanza impegnativa che richiede al lettore curioso di munirsi di carta e matita per non fermarsi agli aspetti solo descrittivi.

 

 

 

 

 

 

In un breve articolo pubblicato nel 1881 sull'American Journal of Mathematics [7] l'astronomo Simon Newcomb scriveva queste righe, nate dall'avere osservato da un diverso punto di vista un oggetto allora di uso comune per scienziati e tecnici: le tavole dei logaritmi.
«Che le dieci cifre non appaiono con uguale frequenza deve essere evidente a chiunque faccia molto uso delle tavole dei logaritmi, e noti che le prime pagine sono più consumate delle ultime. La prima cifra significativa è 1 più spesso che un'altra cifra, e la frequenza diminuisce fino al 9 [...]. La legge della probabilità dell'apparire dei numeri è tale che tutte le mantisse dei loro logaritmi sono equiprobabili.»  [Immagine a sinistra: Simon Newcomb (1835-1909)]

 

 

Perché una volta si usavano le tavole dei logaritmi?

Fino all'avvento delle macchine calcolatrici i logaritmi (o meglio le tavole logaritmiche e il regolo calcolatore) sono stati uno strumento utile ed estremamente diffuso per lo svolgimento di calcoli complicati. Per moltiplicare due numeri positivi era sufficiente passare ai loro logaritmi, sommarli e poi tornare indietro; con il vantaggio che la somma è un'operazione molto più agevole del prodotto. Oppure, per esempio, il calcolo di una radice n-esima di un numero positivo era ridotto alla divisione per n del suo logaritmo, e anche qui la divisione è più semplice della radice n-esima.

 

 

La prima cifra significativa di cui parlava Newcomb è la prima cifra diversa da 0 presente nello sviluppo decimale del numero. Per esempio, la prima cifra significativa di 3,14159265... è 3, la prima cifra significativa di 2012 è 2, la prima cifra significativa di 1/2012 = 0,000497017893… è 4.
Cerchiamo ora di interpretare l'ultima affermazione: «le mantisse dei loro logaritmi sono equiprobabili.»
Indichiamo con [x] la parte intera di un numero reale x (cioè il più grande intero che non supera x) e con la sua parte frazionaria (o mantissa). Quindi, per esempio,

Qualsiasi numero reale positivo v può essere scritto nella forma

v = 10M w

con M intero (positivo, negativo o nullo) e 1 = w < 10.
La prima cifra significativa di v è uguale alla prima cifra significativa di w (poiché la moltiplicazione per una potenza intera di 10 si limita, eventualmente, a traslare le cifre dello sviluppo decimale di v). Se per esempio v = p7 = 3020,29323... , allora v = 103 w e w = 3,02029323... sta tra 3 e 4.
Dunque, dire che la prima cifra significativa di v è uguale a k  {1, 2, ....,9} equivale ad affermare che

 

Newcomb ha scritto che sono equiprobabili non le nove possibili «prime cifre significative» di un generico numero positivo v, ma le mantisse . Quindi, per qualsiasi intervallo [a,b) contenuto in [0,1) la probabilità che   appartenga ad [a,b) deve essere uguale alla lunghezza b - a di questo intervallo. In particolare, per la disuguaglianza precedente, la probabilità che la prima cifra significativa di v sia uguale a k deve essere uguale alla lunghezza

log10(k+1) - log10(k) = log10(1+1/k)

dell'intervallo [log10(k),log10(k+1)].

Scriviamo i valori numerici delle lunghezze di questi intervalli.

 

Da questo Newcomb sembra avere concluso che la probabilità che la prima cifra sia 1 è circa il 30,1%, la probabilità che la prima cifra sia 2 è circa il 17,6%, eccetera.
Ovviamente non abbiamo scoperto nulla e tantomeno dimostrato la validità di una «legge delle prime cifre». Abbiamo solo verificato che se consideriamo una successione di numeri e supponiamo che le mantisse dei loro logaritmi (in base 10) siano equiprobabili (nel senso visto sopra), allora la percentuale di prime cifre significative uguali a k è circa uguale a log10(1+1/k).
Questo fenomeno fu studiato nuovamente nel 1938 dal fisico e ingegnere elettrico Frank Benford (1883-1948), [Immagine a destra] apparentemente ignaro della nota di Newcomb, che in un articolo sui Proceedings of the American Philosophical Society [1], presentò numerose successioni numeriche (aree di fiumi, popolazioni, indirizzi, ma anche potenze dei numeri interi, fattoriale, eccetera) che, soprattutto quando considerate insieme, fornivano una buona evidenza alla «legge logaritmica» descritta sopra, della quale neppure Benford forniva una giustificazione, e che da quel momento fu associata al suo nome.



  PAG. SUCC. >