Il motore di ricerca di Google funziona attorno a queste due funzioni principali: scansione e indicizzazione.
I motori di ricerca utilizzano i propri algoritmi, quindi se appari nelle prime posizioni nella pagina dei risultati di un motore di ricerca, ciò non significa necessariamente che lo farai per tutti i motori di ricerca.
Alcuni pongono un forte focus sulla qualità dei contenuti, altri sull’esperienza degli utenti e altri sulla creazione di link. Comprendere ciò che il motore di ricerca vuole è fondamentale per il tuo successo nelle SERP (Search Engine Results Page).
Teniamo sempre presente però che Google gestisce attualmente circa il 72% del mercato globale delle ricerche effettuate online. Google domina il mondo dei motori di ricerca.
In realtà è piuttosto semplice e succede in un processo in 2 fasi:
A livello base, pensalo come se qualcuno stesse creando un’enorme biblioteca di libri. La scansione sta trovando nuovi libri da aggiungere a quella biblioteca. L’indicizzazione sta mettendo i libri che hai in un ordine specifico (come genere o autore). L’unica differenza tra una biblioteca e Google è che Google ha miliardi di libri.
Quando inserisci una query nel motore di ricerca, potresti supporre che Google setacci tutto il World Wide Web in quel momento.
Quello che sta realmente accadendo è che il crawler web del motore di ricerca ha compilato un enorme database di pagine e tu stai cercando in quel database, NON nell’intero world wide web.
Il database è costituito da siti web pre-approvati che Google ha verificato e considerati sicuri per i suoi utenti. Quindi non troverai nulla di complicato dal “dark web” per la tua query di ricerca quando utilizzi Google.
La prima fase dell’aggiunta di pagine a questo database si chiama ricerca per indicizzazione. Google ha “crawler” (o “spider”) che utilizza per setacciare Internet.
Questi crawler web svolgono sostanzialmente 2 lavori:
Si può pensare a questi crawler come a spie; di nascosto vanno dietro le linee nemiche per raccogliere informazioni e riferire al quartier generale.
Ma come trovano i siti web, ottengono l’accesso e recuperano tali informazioni? Beh, in realtà non è così complesso come potresti pensare.
Tutti i siti web fanno parte di una rete chiamata World Wide Web, che è sostanzialmente come un’enorme ragnatela diffusa in tutto il mondo. L’unica differenza è che il World Wide Web è tenuto insieme da collegamenti (noti anche come collegamenti ipertestuali).
I crawler (o gli spider) dei motori di ricerca utilizzano questi collegamenti per viaggiare sul web e scoprire nuovi contenuti. Quando i web crawler trovano una nuova pagina, iniziano a leggere tutto il contenuto e il codice di sviluppo.
Nel mondo ideale, vogliamo che il codice sia il più semplice possibile per Google da interpretare e comprendere. È qui che il proprietario di un sito web eseguirà la SEO (ottimizzazione per i motori di ricerca).
Il processo di scansione non è umano e ogni crawler web funziona in modo autonomo (utilizzando l’apprendimento automatico dall’algoritmo del motore di ricerca) per decidere se le pagine che trovano devono essere aggiunte all’indice di Google o meno.
Per esempio: i crawler sanno che i siti in cui è possibile acquistare droghe non dovrebbero essere aggiunti al suo database; o perlomeno vengono aggiunti ma segnalati come “vietati”.
Una volta che un crawler web ha deciso di aggiungere una pagina al database, è tempo che un sito entri nella seconda fase del processo: l’indicizzazione.
Ne parliamo nel prossimo articolo: Come funziona l’indicizzazione di Google?
Introduzione ai Tre Approcci del Machine Learning Il machine learning, una branca cruciale dell'intelligenza artificiale, si suddivide in tre metodologie principali: apprendimento con supervisione, apprendimento senza supervisione, e il reinforcement learning. Ognuna di queste tecniche…
Cosa si intende per Intelligenza Artificiale L'Intelligenza Artificiale (AI o IA) rappresenta un capitolo fondamentale nella storia della tecnologia. Concepita negli anni '50, l'IA include tutte quelle operazioni tipiche dell'intelletto umano ma eseguite da macchine,…
Introduzione al Marketing nell'Era del Web 3.0 Il passaggio dal Web 2.0 al Web 3.0 ha segnato un'evoluzione significativa nell'ambito di Internet. Inizialmente caratterizzato da pagine statiche, il Web 2.0 ha introdotto un'era incentrata sull'utente,…