come-funziona-google-e-come-scanziona-il-sito-web

Il motore di ricerca di Google funziona attorno a queste due funzioni principali: scansione e indicizzazione.

I motori di ricerca utilizzano i propri algoritmi, quindi se appari nelle prime posizioni nella pagina dei risultati di un motore di ricerca, ciò non significa necessariamente che lo farai per tutti i motori di ricerca.

Alcuni pongono un forte focus sulla qualità dei contenuti, altri sull’esperienza degli utenti e altri sulla creazione di link. Comprendere ciò che il motore di ricerca vuole è fondamentale per il tuo successo nelle SERP (Search Engine Results Page).

Teniamo sempre presente però che Google gestisce attualmente circa il 72% del mercato globale delle ricerche effettuate online. Google domina il mondo dei motori di ricerca.

Come funziona quindi il motore di ricerca che tutti conosciamo e amiamo?

In realtà è piuttosto semplice e succede in un processo in 2 fasi:

  • Scansione: prima Google “esegue la scansione del web” trovando le pagine da aggiungere al suo database
  • Indicizzazione: i risultati vengono quindi organizzati o “indicizzati” e aggiunti al database

A livello base, pensalo come se qualcuno stesse creando un’enorme biblioteca di libri. La scansione sta trovando nuovi libri da aggiungere a quella biblioteca. L’indicizzazione sta mettendo i libri che hai in un ordine specifico (come genere o autore). L’unica differenza tra una biblioteca e Google è che Google ha miliardi di libri.

Come funziona la scansione di Google?

Quando inserisci una query nel motore di ricerca, potresti supporre che Google setacci tutto il World Wide Web in quel momento.

Quello che sta realmente accadendo è che il crawler web del motore di ricerca ha compilato un enorme database di pagine e tu stai cercando in quel database, NON nell’intero world wide web.

Il database è costituito da siti web pre-approvati che Google ha verificato e considerati sicuri per i suoi utenti. Quindi non troverai nulla di complicato dal “dark web” per la tua query di ricerca quando utilizzi Google.

Perché Google fa questo?

  • Può accedere a questo database in modo affidabile
  • Fornisce un’esperienza più rapida e intuitiva
  • Consente a Google di aggiungere i propri “tag” a queste pagine e fornire risultati pertinenti

La prima fase dell’aggiunta di pagine a questo database si chiama ricerca per indicizzazione. Google ha “crawler” (o “spider”) che utilizza per setacciare Internet.

Questi crawler web svolgono sostanzialmente 2 lavori:

  • Trovare nuove pagine web da indicizzare
  • Raccogliere informazioni su ciascuna pagina web

Si può pensare a questi crawler come a spie; di nascosto vanno dietro le linee nemiche per raccogliere informazioni e riferire al quartier generale.

Ma come trovano i siti web, ottengono l’accesso e recuperano tali informazioni? Beh, in realtà non è così complesso come potresti pensare.

Come funziona un web crawler?

Tutti i siti web fanno parte di una rete chiamata World Wide Web, che è sostanzialmente come un’enorme ragnatela diffusa in tutto il mondo. L’unica differenza è che il World Wide Web è tenuto insieme da collegamenti (noti anche come collegamenti ipertestuali).

I crawler (o gli spider) dei motori di ricerca utilizzano questi collegamenti per viaggiare sul web e scoprire nuovi contenuti. Quando i web crawler trovano una nuova pagina, iniziano a leggere tutto il contenuto e il codice di sviluppo.

Nel mondo ideale, vogliamo che il codice sia il più semplice possibile per Google da interpretare e comprendere. È qui che il proprietario di un sito web eseguirà la SEO (ottimizzazione per i motori di ricerca).

Il processo di scansione non è umano e ogni crawler web funziona in modo autonomo (utilizzando l’apprendimento automatico dall’algoritmo del motore di ricerca) per decidere se le pagine che trovano devono essere aggiunte all’indice di Google o meno.

Per esempio: i crawler sanno che i siti in cui è possibile acquistare droghe non dovrebbero essere aggiunti al suo database; o perlomeno vengono aggiunti ma segnalati come “vietati”.

Una volta che un crawler web ha deciso di aggiungere una pagina al database, è tempo che un sito entri nella seconda fase del processo: l’indicizzazione.

Ne parliamo nel prossimo articolo: Come funziona l’indicizzazione di Google?

Come funziona Google e come scansiona il tuo sito web
Tag:     
×
%d