I 1949 fremlagde George Kingsley Zipf en undersøgelse af ord i aviser, hvor det blev vist, at det mest benyttede ord fremstod dobbelt så mange gange som det næst-mest benyttede ord, og det næst-mest benyttede ord dobbelt så ofte som det igen næst-mest benyttede ord, osv.
Denne ligning fremstår, når indlagt i et logaritmisk koordinatsystem, som en relativt lige linje, grafen kan ses ved at følge kilden.
Det har i midlertid vist sig, at ikke kun ord i aviser giver dette resultat, det samme gælder for internettrafik, fordelingen af indbyggere i byer, fordeling af rigdom og mange andre ting. Dette har dog indtil nu været umuligt at bevise.
Et hold forskere fra ETH i Zürich, Schweiz, har nu på bagrund af data indsamlet ved hjælp af Debian bevist, at der i sandhed er en sådan sammenhæng.
Dette blev gjort ved at se på sammenhængen mellem de forskellige programmer udbudt til Debian – som er veldokumenteret siden 1996, hvor Debian først udkom med 474 tilgængelige pakker (packages), mod de over 18.000, der eksisterer i dag. Disse tal har forskerne kunnet benytte til at bevise Zipfs ligning.