Partiamo da una definizione: l’indicizzazione è un processo con il quale i motori di ricerca memorizzano le informazioni relative ad un certo sito internet o una certa pagina web e le archiviano nel proprio database.
Innanzitutto, è necessario comprendere che si tratta di un insieme di azioni che hanno come unico obiettivo quello di raccogliere le informazioni relative ad una certa pagina web e renderle disponibili nel grande database del motore di ricerca.
A questo punto la domanda è scontata: perché mai un motore di ricerca dovrebbe immagazzinare tutte le informazioni di ciascun sito e ciascuna pagina web? Cerchiamo di rispondere al volo: quando un utente effettua una ricerca su Google, quest'ultimo deve interpretare il bisogno celato dietro la ricerca, capire quale tra i tanti siti internet che compongono la rete risponda meglio a questo bisogno e restituire i 10 siti che a suo avviso soddisfano meglio la richiesta.
Per compiere tutte queste azioni Google ha a disposizione solo pochi istanti e non può permettersi di far attendere l’utente diversi secondi prima di restituire i risultati correlati. Conseguentemente, ogni motore di ricerca deve già avere memorizzato nel proprio database o nel proprio indice dei risultati il numero più elevato possibile di pagine web ancora prima che l’utente effettui una ricerca. Infatti tutti i risultati non presenti in questo macro-indice non verranno mai mostrati, perché Google ancora non li conosce e non ha informazioni a riguardo. Il processo con cui un sito viene memorizzato nel database di Google è detto appunto indicizzazione.