I numeri primi sono infiniti? Si, lo ha dimostrato Euclide. Ma molte altre questioni si possono affrontare sul loro comportamento, e di questo tratta l’articolo, esaminandone alcune.
Si può costruire un diagramma che rappresenta il loro numero in funzione del valore dei numeri interi e ci si può domandare quale sia il suo comportamento asintotico, cercando di approssimarlo con una funzione; si può tentare di introdurre nel campo complesso un analogo del numero primo; ci si può infine chiedere se sono infinite le coppie di numeri primi «gemelli» (numeri primi che differiscono di due unità, come 17 e 19).
Lo studio dei numeri primi ha da sempre affascinato i matematici fin da quando Euclide nel 300 a.C. dimostrò che ve ne sono infiniti. Uno dei problemi più semplici riguarda l’esistenza di infinite coppie di numeri primi «gemelli», ovvero di numeri primi distanziati di 2, come ad esempio 3 e 5, 11 e 13, 17 e 19.
Questa congettura è a tutt’oggi irrisolta, nonostante numerosi matematici vi ci siano cimentati. Tuttavia, nell’aprile del 2013 Yitang Zhang (1955-…), un matematico americano di origine cinese, perlopiù sconosciuto alla comunità scientifica internazionale, ha annunciato di avere dimostrato che esistono infinite coppie di numeri primi che differiscono meno di 70 milioni.
Grazie all’intuizione di Zhang, che per la sua scoperta ha seguito una strada che molti ritenevano sterile, si è aperto tra gli esperti di teoria analitica dei numeri un rinnovato interesse attorno all’argomento; sono state trovate dimostrazioni alternative e più semplici di quella di Zhang e il limite di 70 milioni è stato abbassato a circa 300.
In questo articolo intendiamo fare un approfondimento sui numeri primi e dare al lettore alcune idee di quali siano gli strumenti utilizzati per studiarne la distribuzione.
La funzione enumeratrice dei primi
Che cos’è un numero primo?
Tutti sanno che cos’è un numero primo: «facile: è un intero divisibile solo per 1 e se stesso». Un po’ facile infatti.
La prima domanda che uno si può chiedere a questo punto è: ma 1 lui, è primo o no? Se si prende la definizione data sopra, la risposta sembra essere «sì».
Ricordiamoci però di un risultato molto importante: ogni intero positivo può essere scritto come prodotto di primi e, se si ordinano i numeri primi in ordine crescente, la scrittura è unica. A questo punto diventa chiaro che 1 non può essere un numero primo. Infatti se lo fosse avremmo:
6 = 2 • 3 = 1 • 2 • 3 = 1 • 1 • 2 • 3 = . . .
E quindi non ci sarebbe più unicità. Una definizione corretta potrebbe essere quindi la seguente: un numero primo è un intero diverso da 1 divisibile solo per 1 e se stesso.
La situazione si complica un po’ se vogliamo includere gli interi negativi. La scrittura di un intero è sempre unica purché si decomponga il valore assoluto in prodotto di primi e si aggiunga il segno:
6 = +1 • 2 • 3
6 = -1 • 2 • 3
Una domanda un po’ più insidiosa sorge allora: infatti 2 diventa divisibile per -1 e -2 oltre che 1 e 2. Rimane primo? Certo.
Quindi 2 è primo ed è divisibile per 4 interi: ±1 e ±2. Ma anche -2 è divisibile per questi 4 interi, quindi anche lui è primo? Stranamente la risposta a questa domanda non è univoca.
Se decidiamo che -2 (e quindi anche -3, -5, e tutti gli altri) sono primi anche loro, non serve più il segno:
6 = 2 • 3
-6 = -2 • 3
Ma perdiamo apparentemente l’unicità:
6 = 2 • 3 = -2 • (-3)
-6 = 2 • (-3) = -2 • 3
Tuttavia la possiamo riottenere dicendo che la scrittura è unica a meno del prodotto di (alcuni) termini per -1. Nel caso degli interi, se soltanto uno deve essere primo tra -2 e 2 c’è una scelta naturale: è chiaramente 2 che dobbiamo scegliere.
Ci sono casi in cui la scelta però non è così ovvia, anzi, è arbitraria. Se ci limitiamo agli interi la definizione corretta (e naturale) è «un numero primo è un numero p maggiore di 1 e divisibile soltanto per ±1 e ±p». Se invece siamo in un ambito un po’ più esteso, per esempio il caso dei campi di numeri che introdurremo nell’ultima sezione, la definizione può essere «un numero primo è un numero p diverso da ±1 divisibile solo per ±1 e ±p».
Per il momento ci teniamo la definizione classica: un intero p è primo se e solo se p = 2 ed è divisibile soltanto per ±1 e ±p.
Una delle funzioni preferite della teoria analitica dei numeri è la cosiddetta funzione enumeratrice dei primi . Se è il numero di primi p tali che . È immediato che se x = 0, se allora = 1 e così via.
La funzione è discontinua (ma continua a destra), con discontinuità a salto, con un salto di 1 negli interi primi. Il grafico della funzione, da vicino e da un po’ più lontano, è mostrato nella figura che segue:
Le discontinuità sono evidenti da vicino, molto meno da lontano ma si vede comunque che la funzione ha un andamento non molto regolare.
Andamento generale
È ben chiaro che, a parte 2, i numeri primi saranno tutti dispari per cui la distanza minima tra due primi è 2 (tranne all’inizio). È anche abbastanza intuitivo che man mano che si va avanti nei numeri, i primi si diradano: infatti quando verifichiamo se un intero è primo o no, dobbiamo verificare se è divisibile per ciascuno dei primi precedenti e quindi più è grande, più ci sono primi minori di lui e quindi maggiori sono le probabilità che non sia primo.
La distanza tra due primi successivi tende quindi ad aumentare, ma soltanto in media. Il fatto che la distanza non sia in aumento costante si osserva sul grafico della funzione π(x).
Infatti, poiché quest’ultima rimane costante tra due primi successivi, le irregolarità della crescita di π(x) corrispondono alle irregolarità delle distanze tra due primi successivi. Il diradamento dei primi ha come conseguenza che la funzione è sostanzialmente concava, cioè con una curvatura aperta verso il basso.
Andamento asintotico
La funzione π(x) ha un comportamento noto per x che tende all’infinito. Nel seguito useremo la «solita» notazione per l’asintotico, cioè f ∼ g se e solo se .
Vari matematici dalla fine del 1700 alla metà del 1800 hanno cercato una funzione semplice (o, piuttosto, nota) f che approssimi bene π per x tendente a +∞. Presentiamo nella tabella seguente alcuni di questi (famosi) matematici e la funzione da loro proposta:
Dove è una variante del logaritmo integrale.
Tutte le funzioni da loro proposte sono asintotiche una all’altra, almeno se si sceglie A = 1 nella prima funzione proposta da Legendre. L’ultima proposta, Li(x), è quella che approssima meglio π(x).
Nel 1848 e 1850, Pafnutij L. Chebyshev (1821-1894) tentò di dimostrare una tale formula. Non vi riuscì, ma introdusse l’uso della funzione ζ di Riemann (1826-1866), di cui parleremo sotto, e di due funzioni che portano il suo nome: le funzioni ϑ e ψ di Chebyshev.
Anche se non riuscì a dimostrare che , dimostrò che se il limite esiste, è per forza 1.
Inoltre provò che, se x è sufficientemente grande, si ha (quindi non troppo lontano da 1). Riemann stesso, nel 1859, fece un tentativo per dimostrare lo stesso risultato, estendendo l’uso della sua funzione ζ, ma senza riuscire a dimostrare l’esistenza del limite di cui sopra.
Finalmente nel 1896 due articoli pubblicati indipendentemente da Jacques Hadamard (1865-1963) e Charles J. de la Vallée–Poussin (1866-1962) riuscirono a dimostrare che π ∼ Li , usando ed estendendo le idee di Riemann.
Questo risultato viene chiamato Teorema dei numeri primi.
La distribuzione asintotica dei primi
Il significato del teorema dei numeri primi sulla distribuzione dei primi è il seguente. Denotiamo pn l’n-esimo numero primo cosicché p1 = 2, p2 = 3, … Il teorema dei numeri primi ha come conseguenza che pn ∼ nln(n) o che vicino ad un intero relativamente grande N gli interi primi sono circa del totale (è sostanzialmente quello che aveva osservato Gauss).
Per dare un’idea della regolarità e dell’irregolarità del comportamento riportiamo sotto il numero dk di primi tra N – 10ln(N) e N+10ln(N) per N = 10k e k = 1, …, 100.
L’asintotico prevede che i numeri primi nell’intervallo [N – 10ln(N);N+10ln(N)] siano circa .
Dalla tabella si osserva che dk (che è tale numero di primi per N = 10k) rimane intorno a 20, come previsto dall’asintotico, ma che comunque varia abbastanza, tra il 9 per k = 54 e il 30 per k = 40 . Il primo termine vale però 6, ma non lo abbiamo considerato non solo perché k = 1 è piccolo e quindi il limite per x tendente all’infinito è poco rilevante, ma anche perché è negativo.
Il termine di errore
Una volta noto un asintotico per π(x), la fase successiva è capire come si comporta π(x) – f(x) dove f è l’asintotico che abbiamo scelto.
Qui, la funzione conveniente è Li(x). Infatti, nel 1914 John E. Littlewood (1885-1977) dimostrò che la funzione π(x) – Li(x) cambia segno infinite volte (non si sa ancora dov’è il suo primo cambiamento di segno, ma sicuramente precede 10316).
Questo implica che la differenza non tende all’infinito. Purtroppo non si sa molto di più su questa differenza; la funzione ψ, una cugina di π, è invece meglio nota.
La funzione ζ di Riemann
Prima di parlare di ψ conviene introdurre la funzione ζ di Riemann, che in teoria dei numeri è una regina.
L’espressione come serie
Questa famosa funzione si definisce per i reali s > 1 nel modo seguente:
La convergenza della serie è molto semplice da studiare, tutti gli studenti che hanno affrontato le serie hanno visto che questa serie converge se (e solo se) s > 1.
Si può dare un senso naturale a questa serie se (e solo se) s è un numero complesso di parte reale maggiore di 1.
Il prodotto di Eulero
Osserviamo che, se s è un qualsiasi numero reale (o complesso), il prodotto delle potenze da 0 a 3 di 1/ps per i primi p da 2 a 5 ha la seguente espressione:
Otteniamo una parte della somma che definisce la funzione ζ. Si può capire che man mano che aumentano il numero dei primi e le potenze di questi, la somma a destra si completa. Ogni termine della somma 1/ns si ottiene purché i primi che compongono n appaiano nel prodotto, fino (almeno) alla potenza con la quale compaiono in n.
Dobbiamo far tendere all’infinito sia il numero di primi che le loro potenze, per cui il procedimento analitico è un po’ delicato. Per fortuna la convergenza di tutto è sufficientemente veloce per ovviare a tutti i problemi e si ottiene:
Quest’ultima presentazione si chiama il prodotto di Eulero della funzione ζ e rimane valido per ogni complesso s con parte reale maggiore di 1.
Il prolungamento analitico
Chiunque ha studiato le serie sa che:
Ora, la serie a sinistra è definita se e solo se |x| < 1 mentre la funzione a destra è definita per ogni x (diverso da 1). Si dice che la funzione di destra è un prolungamento analitico di quella di sinistra.
Per passare «attraverso» 1, si deve utilizzare il caso in cui x è complesso per «girare attorno» a 1 (invece di passare attraverso). Succede un fenomeno analogo per la funzione ζ di Riemann. La funzione, definita inizialmente per i complessi s di parte reale maggiore di 1 può essere estesa a tutti gli diversi da 1. Inoltre questo prolungamento ha una proprietà molto strana, detta equazione funzionale, che dice che:
Nell’equazione precedente, Γ è una funzione nota che, tra varie proprietà, è una funzione definita ovunque che «interpola» il fattoriale nel senso che se n è intero, allora Γ(n + 1) = n!; la definizione precisa della funzione gamma è:
con un prolungamento analitico a tutto usando il fatto che Γ(s + 1) = sΓ(s).
Gli zeri
Osservando l’equazione funzionale della funzione ζ, vediamo che per n < 0 intero:
ζ(2n)=0.
Infatti, le definizioni di ζ e Γ fanno sì che ζ(1 – 2n) e Γ(1 – 2n) sono definiti e quindi prendendo s = 2n nell’equazione funzionale si vede subito che ζ(2n) = 0 perché sin(πn) = 0.
Si dice che gli interi negativi pari sono gli zeri banali della funzione ζ. Ci sono altri numeri complessi ϱ, tali che e tali che ζ(ϱ)=0. Questi numeri sono detti zeri non banali della funzione ζ. Usando l’espressione come prodotto di Eulero della funzione ζ, si può intuire – e, come vedremo più avanti, dimostrare – che gli zeri della funzione ζ sono legati alla distribuzione dei numeri primi.
Le funzioni di Chebyshev
Definizione delle funzioni ϑ e ψ
Chebyshev ha introdotto due funzioni importanti, la funzione ϑ e la funzione ψ. La prima è una versione «pesata» di π. Precisamente,
dove la somma è sui numeri p primi. Si dice che è una versione pesata di π perché la funzione π può essere riscritta come:
Visto che la funzione ln cresce lentamente, si capisce facilmente (e si dimostra senza difficoltà) che:
La funzione più semplice da studiare è l’ulteriore variante:
dove Λ(n) = ln(p) se e solo se n è una potenza (non nulla) del primo p, e 0 altrimenti. In modo analogo a quanto detto sopra, abbiamo:
Il teorema dei numeri primi è quindi equivalente a ψ(x) ∼ x.
Il legame con la funzione ζ
Informazioni sul comportamento di |π(x) – Li(x)| possono essere ottenute a partire da analoghe informazioni su |ψ(x ) – x|, la quale risulta più facile da studiare poiché direttamente collegata alla funzione ζ di Riemann.
Più precisamente, se x > 1,
per qualsiasi σ > 1, dando il significato seguente all’integrale: s = σ + it con quindi ds = idt e l’integrale deve essere inteso come l’integrale della parte reale più i volte l’integrale della parte immaginaria.
La stima dell’integrale
Per riuscire a dimostrare una maggiorazione per |ψ(x) – x|, usiamo un ulteriore parametro T > 0 per approssimare il termine con l’integrale con:
I
Una scelta classica è σ = 1 + 1/(ln(x)) e T = √x.
Rimangono poi da stimare ψ(x) – I, e ciò non è molto difficile, e I che risulta più sottile da affrontare.
Senza entrare troppo nei dettagli, per calcolare l’integrale invece di andare direttamente da σ – iT a σ + iT, si fa un giro lungo verso la sinistra.
A questo punto entrano in gioco gli zeri della funzione ζ. La parte più sottile del lavoro di Hadamard e de la Vallée–Poussin consiste nel dimostrare che gli zeri non banali stanno in una zona del piano complesso della forma:
per una certa costante c, non esplicita. Con questo risultato di localizzazione si riesce a dimostrare che di ψ(x) ∼ x.
La zona senza zeri dimostrata da Hadamard e de la Vallée–Poussin, scegliendo c = 1, è la parte strisciata nel seguente grafico.
Poiché il logaritmo cresce piano la zona rimane relativamente larga quando Im s è piccolo, ma invece per Im s che tende all’infinito, la zona diventa infinitesimale.
L’ipotesi di Riemann dice che gli zeri non banali sono tutti contenuti nella retta verticale Re s = ½ e sotto questa ipotesi si riesce a dimostrare che:
con una funzione r(x) esplicita e tale che .
Questa stima è la «migliore» che si può ottenere nel senso che Chebyshev ha dimostrato che l’ipotesi di Riemann è vera se e solo se esiste una costante positiva c tale che:
Sviluppi ulteriori
Primi gemelli, cugini e sexy
Abbiamo visto l’andamento generale, all’infinito, della distribuzione dei primi. Cosa si può dire invece della ripartizione specifica dei primi?
Come abbiamo visto, a parte all’inizio, la distanza tra due primi successivi è come minimo 2. Due primi a distanza 2 si dicono gemelli. Quante coppie di numeri primi gemelli esistono? Sono note tali coppie circa fino a 10200000.
Si suppone, ma non si sa dimostrare, che esistano infinite coppie di primi gemelli. Le coppie di primi a distanza diversa da 2 sono meno studiate. Ad esempio si dice che i primi a distanza 4 uno dall’altro sono primi «cugini» mentre quelli a distanza 6 sono primi sexy (gioco di parole con l’inglese “six”). Questo argomento si chiama: primi in intervalli corti.
L’argomento è in grande fermento in questo periodo (Dicembre 2014). Per darne una spiegazione, ricordiamo che pn è l’n-esimo numero primo. Nel 2005, Dan Goldston(1954-…), János Pintz (1950-…) e Cem Yıldırım (1961-…) dimostrarono che, facendo una congettura ancora più complicata dell’ipotesi di Riemann, detta EH, si poteva dimostrare che esistono infiniti primi pn tali che pn+1 – pn 16. Il 14 Maggio 2013, Yitang Zhang ha trovato un modo per dimostrare, senza ipotesi, che esistono infiniti primi pn tali che pn+1 – pn 70000000.
Sotto l’impulso di Terence Tao (1975-…) e grazie a un risultato dovuto a James Maynard, che ha trovato una dimostrazione decisamente migliore di quella di Zhang, questo limite scende quasi quotidianamente. Dopo un anno il limite è sceso da 70000000 a 246, mentre si sono dimostrati (e abbassati) i limiti per pn+m – pn per alcuni m 1.
Durante questo periodo, è stato dimostrato che supponendo EH allora esistono infiniti primi pn tali che pn+1 – pn 12 e, supponendo una sua versione più generale, si scende a pn+1 – pn 6 (quindi ci sono infiniti primi gemelli, cugini e/o sexy).
Nel retroscena, Yoichi Motohashi ha riconosciuto di aver provato una strada simile a quella di Zhang ma di averla abbandonata prima di aver capito che poteva portare al risultato desiderato. Ulteriori sviluppi si possono trovare cercando primes in small gaps su Internet.
Campi di numeri
Chiameremo numero algebrico un numero complesso z per il quale esistono un intero n ≥ 1 e degli interi a0, …, an (con an ≠ 0) tali che:
anzn + ⋯ + a1z + a0 = 0.
Se possiamo inoltre prendere an = 1, si dice che z è un intero algebrico.
Sia z un numero algebrico (non necessariamente intero) e consideriamo:
con k 0, tutti i bi razionali. Un tale K si dice campo di numeri.
Si può verificare senza difficoltà che tutti gli elementi di un campo di numeri sono numeri algebrici. L’insieme degli interi algebrici in K si chiama anello degli interi di K e si denota OK. L’insieme OK gioca per K il ruolo di
In alcuni di questi insiemi OK, ma non in tutti, esiste una nozione di numero primo analoga a quella degli interi primi p di cui abbiamo parlato fin qui. In questi casi c’è sempre un’ambiguità analoga a quella tra 2 e -2 di cui abbiamo parlato all’inizio e non c’è quasi mai una scelta naturale. In questi casi si sceglie come definizione di numero primo la seconda versione, cioè il caso in cui -2 è ancora un numero primo.
Per dare un po’ più di concretezza a questo discorso consideriamo il caso in cui z = i. In questo caso gli elementi di Z[i] si chiamano interi di Gauss. A ciascun numero primo p corrispondono una o due famiglie di interi di Gauss primi. Sono della forma a + ib con a2 + b2 ∈ {p, p2}.
Per p = 2 c’è una famiglia di interi primi di Gauss corrispondenti: {1+i, 1−i ,−1+i, −1−i}.
In questo caso a2 + b2 = 2.
Se p = 4k + 3 con c’è di nuovo una famiglia di interi primi di Gauss corrispondenti a:
p: {p, –p, ip, –ip}.
In questo caso a2 + b2 = p2.
Se p = 4k + 1 con . Si può dimostrare che esistono allora due interi tali che u2 + v2 = p e ci sono allora due famiglie corrispondenti a p: {u+iv, –u–iv, –v+iu, v–iu} e {u-iv, –u+iv, v+iu, –v–iu}.
In questo caso a2 + b2 = p.
L’equivalente del segno ±1 degli interi è per il segno complesso {1 ,-1, i, –i} e spiega perché le famiglie di cui sopra siano costituite da quattro elementi. Nel caso di se volessimo l’unicità della decomposizione in primi bisognerebbe scegliere un primo in ciascuna famiglia.
Una scelta vagamente naturale sarebbe prendere quello dei quattro che sta nel primo quadrante. In realtà questa scelta non è poi così naturale e comunque questo è l’unico altro campo, oltre a in cui una qualche scelta naturale sia possibile. È la ragione per la quale, quando si considerano i campi di numeri, si lascia perdere l’unicità.
Nei casi più generali la nozione di numero primo non esiste più e bisogna sostituirla con la nozione di ideale primo. Per capire da dove viene la nozione, possiamo considerare il caso di Abbiamo allora:
6=2 • 3=(1 + i√5)(1 – i√5)
Per avere una decomposizione unica servirebbero quattro elementi x, y, z e t in Z[i√5] tali che:
Ma si può verificare che tali elementi sono impossibili da ottenere.
Ernst E.Kummer (1810-1893) li ha quindi chiamati elementi ideali e Richard Dedekind (1831-1916) è riuscito a dare la definizione formale di ideale, che è quella che si usa in teoria degli anelli, che ha permesso di dare un senso compiuto all’intuizione di Kummer.
L’ideale non è come l’unità immaginaria i, non è un numero da aggiungere, è un concetto diverso ma che si inserisce bene nella teoria. Ciascun gruppo di quattro elementi che abbiamo elencato nel caso di corrisponde a un ideale e sono i suoi generatori.
Ogni ideale primo ha una norma che è la potenza di un numero primo p; nel caso di sono i p e p2 che abbiamo indicato. Per il campo K si definisce una funzione πK, analoga alla funzione π, che conta gli ideali primi la cui norma sta tra 2 e x. Ci sono funzioni ϑK e ψK, analoghe di ϑ e ψ, e la cosa molto strana è che qualunque sia il campo di numeri K,
e che inoltre, facendo per il campo di numeri K un’ipotesi analoga all’ipotesi di Riemann, si ha:
dove nK è la dimensione di K come spazio vettoriale su
La funzione r(x) è tale che . Il comportamento asintotico della distribuzione dei primi è quindi quasi lo stesso in tutti i campi di numeri. Per essere completi, segnaliamo che il limite non è purtroppo uniforme in K.
L’ipotesi di Riemann
Abbiamo visto che l’ipotesi di Riemann è che gli zeri non banali della funzione ζ siano sulla retta Re s = 1/2. Riemann aveva già dimostrato che i primi zeri non banali stanno effettivamente su questa retta. Il fatto che gli zeri siano su questa retta ha l’effetto che la distribuzione dei primi è la migliore possibile, nel senso che soltanto se tutti i zeri stanno su questa retta abbiamo che il termine di resto |ψ(x) – x| è al massimo c√xln2(x), altrimenti è di ordine maggiore.
Da quando Riemann ha fatto questa ipotesi, migliaia di matematici e non matematici hanno tentato di dimostrarla. Si è verificata, prima a mano poi con i computer, la posizione di qualche milione dei primi zeri non banali e tutti stanno su questa retta. La fondazione Clay ne ha fatto uno dei suoi problemi del millennio, con un milione di dollari allegato nel caso di una dimostrazione (corretta).
Anche se nessuno è riuscito a dimostrare l’ipotesi di Riemann, ne sono state proposte diverse generalizzazioni. La più comune è la cosiddetta ipotesi di Riemann generalizzata che riguarda l’analoga ζK della funzione ζ per un campo di numeri K.
Un’altra versione, per i cosiddetti campi di funzioni è invece stata dimostrata da Weil nel 1942, il suo metodo però non si può estendere ai campi di numeri.
Enrico Bombieri (1940-…) ne ha dato una dimostrazione diversa nel 1973 ma nessuno è riuscito ad adattare neanche questa dimostrazione.
Viene fornita una breve bibliografia, in inglese, per chi desiderasse approfondire l’argomento.
Vai all’articolo in formato PDF
Loïc Grenié
(Ricercatore di Matematica presso l’Università di Bergamo)
Riferimenti bibliografici
B. Fine and G. Rosenberger. Number theory. Birkhäuser Boston Inc., Boston, MA, 2007. An introduction via the distribution of primes.
G. Tenenbaum and M. Mendès France. The prime numbers and their distribution, volume 6 of Student Mathematical Library. American Mathematical Society, Providence, RI, 2000.
© Pubblicato sul n° 55 di Emmeciquadro