La vera storia di BlockRank: da Kaltix (2003) all’IA del 2025

Nel 2003, un gruppo di studenti di Stanford fondò Kaltix, una startup nata per risolvere un problema enorme: rendere il PageRank di Google più veloce e personalizzabile.
Tra le loro innovazioni c’erano tre idee fondamentali:

Quadratic Extrapolation
👉 PDF
Un metodo per accelerare la convergenza del Power Method, la base matematica del PageRank originale. In pratica, correggeva periodicamente le iterazioni sottraendo componenti indesiderate, ottenendo fino al 300% di velocità in più su grafi con decine di milioni di nodi.
Adaptive PageRank
👉 PDF
L’intuizione qui era semplice ma geniale: non tutte le pagine web si stabilizzano alla stessa velocità. Quindi, smetti di aggiornare quelle già convergenti e concentra le risorse solo su quelle che cambiano ancora. Risultato? Circa 30% di calcolo in meno.
BlockRank
👉 PDF
Il capolavoro finale: suddividere il web in blocchi locali (cluster di siti interconnessi), calcolare il PageRank internamente a ciascun blocco, e poi combinare i risultati in un PageRank globale.
Questa idea sfruttava la struttura a blocchi del Web per ridurre drasticamente i costi di calcolo, teoricamente fino a 1000× più veloce in scenari personalizzati.

Nel settembre 2003, Google acquisì Kaltix, e poche settimane dopo a novembre arrivò il famigerato “Florida Update”, che rivoluzionò il ranking dei risultati. È molto probabile che alcune delle idee di Kaltix siano confluite in quell’aggiornamento.

Curiosità: su Wikipedia, per anni, un semplice errore di battitura ha oscurato tutto questo. Nella voce dedicata a Kaltix compariva infatti “BlackRock” invece di “BlockRank”. Solo di recente qualcuno ha notato l’errore.
👉 Wikipedia: Kaltix

Table of Contents

Come funzionava BlockRank (2003)

Il PageRank tradizionale tratta l’intero web come un’unica grande matrice di link — immensa e costosa da calcolare.
BlockRank invece divide il grafo in sottoinsiemi (blocchi), calcola un PageRank locale per ogni blocco e poi “integra” i risultati in un ranking globale.

In altre parole, si passa da un problema monolitico O(n²) a una serie di problemi locali più piccoli, che possono essere calcolati in parallelo o aggiornati in modo indipendente.
È la stessa filosofia che oggi guida architetture distribuite e modelli AI modulari.

Riassumendo

Tecnica	Cosa fa	Velocità guadagnata
Quadratic Extrapolation	Accelera la convergenza del metodo delle potenze	+50–300%
Adaptive PageRank	Sospende i calcoli sulle pagine già stabili	+30%
BlockRank	Divide il web in blocchi e calcola PR locali	fino a 1000× (teorico)

2025: ritorna “BlockRank”, ma con un significato tutto nuovo

Saltiamo a oggi. Nel 2025 è uscito un paper su arXiv intitolato “BlockRank: Scalable In-Context Ranking with Generative Models”, che puoi leggere qui:👉 PDF

E no, non è lo stesso BlockRank di Kaltix ma l’idea di fondo è sorprendentemente affine.

Nel nuovo contesto, “BlockRank” indica una tecnica per re-ranking in-context con LLM (modelli generativi come Mistral o GPT).
Invece di partizionare il web, qui si partiziona l’attenzione del modello: i documenti vengono organizzati in “blocchi”, ognuno con la propria attenzione locale, e solo il blocco della query può accedere al contesto globale.

Il risultato?
Una riduzione della complessità da quadratica a quasi lineare, con un’inferenza fino a 4,7× più veloce su dataset come MS MARCO e BEIR, mantenendo prestazioni di livello SOTA.

Vecchio vs. Nuovo BlockRank

Aspetto	BlockRank 2003 (Kaltix)	BlockRank 2025 (LLM)
Dominio	Web graph / PageRank	LLM / In-Context Ranking
Obiettivo	Calcolare autorità più velocemente	Ridurre costo dell’attenzione in ranking generativo
Struttura a blocchi	Cluster di pagine web	Gruppi di documenti nel contesto
Tipo di calcolo	Metodo delle potenze (autovettori)	Attenzione strutturata nei Transformer
Accelerazione	2×–1000× (secondo scala)	4.7× in inferenza
Output	Vettore PageRank globale	Lista di documenti ordinati per rilevanza

Perché è interessante

È quasi poetico:
due epoche, due tecnologie completamente diverse Web Search nel 2003 e Generative AI nel 2025 ma la stessa intuizione di fondo:

ridurre la complessità dividendo il problema in blocchi locali intelligenti.

Nel 2003, serviva a rendere il web “crawlabile” e personalizzato.
Nel 2025, serve a rendere i modelli linguistici “scalabili” e più efficienti.

BlockRank è passato dall’essere un algoritmo di grafi a un concetto architetturale.E forse è proprio questo il suo lascito più grande.

Su www.deepseo.it approfondiamo tutti questi aspetti!