Come funziona Google e come scansiona il tuo sito web

come-funziona-google-e-come-scanziona-il-sito-web

Il motore di ricerca di Google funziona attorno a queste due funzioni principali: scansione e indicizzazione.

I motori di ricerca utilizzano i propri algoritmi, quindi se appari nelle prime posizioni nella pagina dei risultati di un motore di ricerca, ciò non significa necessariamente che lo farai per tutti i motori di ricerca.

Alcuni pongono un forte focus sulla qualità dei contenuti, altri sull’esperienza degli utenti e altri sulla creazione di link. Comprendere ciò che il motore di ricerca vuole è fondamentale per il tuo successo nelle SERP (Search Engine Results Page).

Teniamo sempre presente però che Google gestisce attualmente circa il 72% del mercato globale delle ricerche effettuate online. Google domina il mondo dei motori di ricerca.

Come funziona quindi il motore di ricerca che tutti conosciamo e amiamo?

In realtà è piuttosto semplice e succede in un processo in 2 fasi:

Scansione: prima Google “esegue la scansione del web” trovando le pagine da aggiungere al suo database
Indicizzazione: i risultati vengono quindi organizzati o “indicizzati” e aggiunti al database

A livello base, pensalo come se qualcuno stesse creando un’enorme biblioteca di libri. La scansione sta trovando nuovi libri da aggiungere a quella biblioteca. L’indicizzazione sta mettendo i libri che hai in un ordine specifico (come genere o autore). L’unica differenza tra una biblioteca e Google è che Google ha miliardi di libri.

Come funziona la scansione di Google?

Quando inserisci una query nel motore di ricerca, potresti supporre che Google setacci tutto il World Wide Web in quel momento.

Quello che sta realmente accadendo è che il crawler web del motore di ricerca ha compilato un enorme database di pagine e tu stai cercando in quel database, NON nell’intero world wide web.

Il database è costituito da siti web pre-approvati che Google ha verificato e considerati sicuri per i suoi utenti. Quindi non troverai nulla di complicato dal “dark web” per la tua query di ricerca quando utilizzi Google.

Perché Google fa questo?

Può accedere a questo database in modo affidabile
Fornisce un’esperienza più rapida e intuitiva
Consente a Google di aggiungere i propri “tag” a queste pagine e fornire risultati pertinenti

La prima fase dell’aggiunta di pagine a questo database si chiama ricerca per indicizzazione. Google ha “crawler” (o “spider”) che utilizza per setacciare Internet.

Questi crawler web svolgono sostanzialmente 2 lavori:

Trovare nuove pagine web da indicizzare
Raccogliere informazioni su ciascuna pagina web

Si può pensare a questi crawler come a spie; di nascosto vanno dietro le linee nemiche per raccogliere informazioni e riferire al quartier generale.

Ma come trovano i siti web, ottengono l’accesso e recuperano tali informazioni? Beh, in realtà non è così complesso come potresti pensare.

Come funziona un web crawler?

Tutti i siti web fanno parte di una rete chiamata World Wide Web, che è sostanzialmente come un’enorme ragnatela diffusa in tutto il mondo. L’unica differenza è che il World Wide Web è tenuto insieme da collegamenti (noti anche come collegamenti ipertestuali).

I crawler (o gli spider) dei motori di ricerca utilizzano questi collegamenti per viaggiare sul web e scoprire nuovi contenuti. Quando i web crawler trovano una nuova pagina, iniziano a leggere tutto il contenuto e il codice di sviluppo.

Nel mondo ideale, vogliamo che il codice sia il più semplice possibile per Google da interpretare e comprendere. È qui che il proprietario di un sito web eseguirà la SEO (ottimizzazione per i motori di ricerca).

Il processo di scansione non è umano e ogni crawler web funziona in modo autonomo (utilizzando l’apprendimento automatico dall’algoritmo del motore di ricerca) per decidere se le pagine che trovano devono essere aggiunte all’indice di Google o meno.

Per esempio: i crawler sanno che i siti in cui è possibile acquistare droghe non dovrebbero essere aggiunti al suo database; o perlomeno vengono aggiunti ma segnalati come “vietati”.

Una volta che un crawler web ha deciso di aggiungere una pagina al database, è tempo che un sito entri nella seconda fase del processo: l’indicizzazione.

Ne parliamo nel prossimo articolo: Come funziona l’indicizzazione di Google?

Come funziona Google e come scansiona il tuo sito web

Tags: GoogleSEO

28 Aprile 2020

Come determinare il valore di una parola chiave per la SEO
Per determinare il valore di una parola chiave devi comprendere i tuoi obiettivi di business. Che cosa stai cercando di ottenere con questa parola chiave o questo contenuto? Potresti volere che le persone: acquistino il… Read More
Come utilizzare le keywords LSI nel tuo sito web
Nel precedente articolo abbiamo parlato di cosa sono le LSI keywords e come trovarle (Latent Semantic Indexing o Indicizzazione Semantica Latente). Sapendo quindi quali sono le keywords LSI per la tua parola chiave target, esaminiamo… Read More
LSI keywords: cosa sono e come trovarle
L'Indicizzazione Semantica Latente (LSI o Latent Semantic Indexing) è un metodo di indicizzazione e recupero utilizzato dai motori di ricerca per aiutare a dare contesto alle parole in una pagina. Supponiamo che tu abbia creato… Read More

Articoli Recenti

Internet e Tecnologia

I tre tipi di machine learning: apprendimento con supervisione, apprendimento senza supervisione e reinforcement learning

Introduzione ai Tre Approcci del Machine Learning Il machine learning, una branca cruciale dell'intelligenza artificiale, si suddivide in tre metodologie principali: apprendimento con supervisione, apprendimento senza supervisione, e il reinforcement learning. Ognuna di queste tecniche…

Internet e Tecnologia

Differenze tra Intelligenza Artificiale, Machine Learning e Deep Learning

Cosa si intende per Intelligenza Artificiale L'Intelligenza Artificiale (AI o IA) rappresenta un capitolo fondamentale nella storia della tecnologia. Concepita negli anni '50, l'IA include tutte quelle operazioni tipiche dell'intelletto umano ma eseguite da macchine,…

Web Marketing

Rivoluziona il Tuo Marketing Online con le Strategie del Web 3.0

Introduzione al Marketing nell'Era del Web 3.0 Il passaggio dal Web 2.0 al Web 3.0 ha segnato un'evoluzione significativa nell'ambito di Internet. Inizialmente caratterizzato da pagine statiche, il Web 2.0 ha introdotto un'era incentrata sull'utente,…

Come funziona Google e come scansiona il tuo sito web

Come funziona quindi il motore di ricerca che tutti conosciamo e amiamo?

Come funziona la scansione di Google?

Perché Google fa questo?

Come funziona un web crawler?

Articoli Correlati

Articoli Recenti

I tre tipi di machine learning: apprendimento con supervisione, apprendimento senza supervisione e reinforcement learning

Differenze tra Intelligenza Artificiale, Machine Learning e Deep Learning

Rivoluziona il Tuo Marketing Online con le Strategie del Web 3.0

Ultimi articoli

I tre tipi di machine learning: apprendimento con supervisione, apprendimento senza supervisione e reinforcement learning

Differenze tra Intelligenza Artificiale, Machine Learning e Deep Learning

Rivoluziona il Tuo Marketing Online con le Strategie del Web 3.0