Indice Google: Come controllare le pagine totali indicizzate e farsi indicizzare istantaneamente dai crawler di Google

Se vuoi che il tuo sito sia visibile nelle ricerche di Google, deve far parte dell’indice di ricerca di Google.

Puoi pensare a questo indice come a una gigantesca biblioteca di siti web e pagine individuali che Google mantiene per rendere le ricerche più veloci.

Se tutto va bene, il tuo sito sarà indicizzato automaticamente-ma se non lo fosse? O se solo alcune delle tue pagine web sono indicizzate?

Questa guida ti insegnerà tutto sull’indice di Google e come assicurarti che tutti i tuoi contenuti siano indicizzati in modo appropriato, cosa fondamentale per il SEO.

Tabella dei contenuti

Cosa sono le pagine web indicizzate?

Google mantiene un “indice” regolarmente auto-aggiornato delle pagine sul web in modo da poter generare più velocemente le pagine dei risultati dei motori di ricerca (SERP). Ancora una volta, è meglio pensare a questo indice come a una sorta di biblioteca che Google può facilmente ordinare quando necessario; se le tue pagine non sono nell’indice, non saranno nelle SERP.

Google utilizza bot automatizzati (noti come spider, o Googlebot, il nome specifico del web spider di Google) per setacciare costantemente Internet alla ricerca di nuovi contenuti e nuovi siti web da aggiungere all’indice.

Ogni nuova pagina o quantità significativa di informazioni aggiunta a una pagina web viene notata da Google. Ogni pagina di un sito web viene indicizzata da un web crawler per il valore del contenuto e per le future richieste di ricerca da parte dei consumatori.

Un futuro cliente di Internet può effettuare una ricerca utilizzando determinate parole chiave e le parole chiave possono trovare una pagina web con determinati contenuti o immagini.

I motori di ricerca di Google e i web crawler conoscono ogni nuovo bit di informazione stampato o pubblicato su una pagina web mentre viene pubblicato.

Perché le pagine del sito web vengono indicizzate?

Ogni nuova pagina di un sito web su Internet viene indicizzata da alcune categorie e altri strumenti di marcatura.

Le pagine vengono indicizzate perché il contenuto e i siti web stessi hanno bisogno di essere elencati tra i molti altri siti web che possono essere simili.

Una pagina deve prima essere indicizzata.

I bot di Google strisciano su un sito web e creano una copia nella cache di ogni pagina. Gli indici già completati vengono aggiunti e può essere creata una nuova gerarchia di pagine web valutate, per esempio.

In definitiva, il processo di indicizzazione permette a Google di eseguire ricerche web in modo più completo, più accurato e più veloce.

Come farsi indicizzare da Google

Come fare per assicurarsi che il proprio sito sia indicizzato da Google?

Ecco la buona notizia. Google fa la maggior parte del lavoro per te.

Se non hai fretta di far indicizzare le tue pagine, e non c’è niente di anormale nel tuo sito, tutto quello che dovrai fare è aspettare che i web crawler di Google scoprano il tuo sito e aggiornino l’indice di conseguenza. A seconda di diverse variabili, questo processo può durare da poche ore a qualche settimana. E, anche quando la tua pagina viene indicizzata, è probabile che sperimenti una volatilità delle classifiche attraverso un fenomeno affettuosamente chiamato la Google Dance.

Se sei interessato ad accelerare il processo, o se vuoi solo assicurarti che Google abbia informazioni accurate, puoi inviare una sitemap e/o richiedere l’indicizzazione attraverso Google Search Console, uno strumento gratuito fornito ai webmaster da Google. Se non l’hai ancora fatto, dovrai registrarti per un account e verificare la proprietà del tuo dominio web.

Una volta fatto questo, vai allo “strumento di ispezione dell’URL” e puoi incollare l’URL che vuoi che Google indicizzi.

Se sei interessato a scansionare il tuo intero sito, incolla semplicemente il tuo dominio di alto livello e clicca “Richiedi indicizzazione”. Siate consapevoli del fatto che questo processo potrebbe richiedere diversi giorni o più.

Se siete disposti a lavorare per creare un file sitemap XML, potete anche caricarlo direttamente a Google attraverso Google Search Console. Sotto la sezione Indice, clicca su Sitemaps, e avrai la possibilità di caricare direttamente la tua sitemap.

Come trovare quante pagine del tuo sito sono indicizzate da Google

Come puoi sapere con certezza se il tuo sito e tutte le sue pagine sono indicizzate?

Per il metodo rapido e sporco, basta eseguire una semplice ricerca del sito nella barra di ricerca di Google con “site:yourdomain.com”

Il seguente è il risultato di una ricerca del sito SEO.co:

Se il tuo sito non appare, significa che potrebbe non essere indicizzato, e potrebbe esserci qualcosa di sbagliato.

Come posso usare un Google Indexed Pages Checker?

Puoi anche usare un Google indexed pages checker per determinare se le tue pagine sono indicizzate o meno. Un verificatore di pagine indicizzate di Google può essere utilizzato nel modo seguente:

  • Inserisci il tuo URL nel verificatore di pagine indicizzate di Google.
  • L’URL è il sito web che si desidera controllare il suo ranking o il valore del contenuto della pagina web.
  • Clicca continua per ricevere i risultati della tua scansione.

Per ottenere dettagli sulle pagine indicizzate da Google in Google Search Console

Come faccio a sapere quante pagine Google ha attualmente indicizzato per la mia azienda?

Se sei interessato a scavare più a fondo e sapere esattamente quali delle tue pagine sono state indicizzate, la cosa migliore è usare Google Search Console.

Accedi, vai nell’area Indice e clicca sulla scheda Copertura. Qui, sarai in grado di generare una lista di “Tutte le pagine conosciute”.

Qui, otterrai una ripartizione di quante delle tue pagine sono attualmente valide, quante sono “Valide con avvertenze”, e quanti “Errori” hai.

Se vedi degli zeri qui, significa che c’è un problema serio; Google non sta indicizzando il tuo sito.

Se vedi un numero di pagine nella colonna “Valido” uguale al numero di pagine sul tuo sito, sei a posto. Se hai qualche pagina nelle sezioni “Valido con avvertenze” o “Errore”, puoi esplorarle; Google ti dirà esattamente cosa c’è che non va e cosa sistemare per risolvere il problema.

Già che ci sei, puoi controllare se una pagina specifica è indicizzata usando lo strumento di ispezione dell’URL (già discusso sopra). Basta copiare/incollare l’URL nello strumento e Google ti dirà se la pagina è presente o meno nell’indice di Google.

Questo è fantastico per verificare che i tuoi sforzi abbiano successo se devi risolvere un problema di una specifica pagina non indicizzata. Questo è anche il modo in cui è possibile ottenere immediatamente l’indicizzazione.

Perché Google non indicizza il tuo sito

Non succede spesso, ma quando succede, è devastante.

Se hai intenzione di ottenere qualsiasi traffico organico dalle ricerche online, è necessario assicurarsi che il tuo sito sia visibile – in altre parole, se vuoi apparire nelle pagine dei risultati di ricerca di Google, Google deve sapere che il tuo sito esiste.

E se il tuo sito non viene indicizzato da Google, potrebbe anche non esistere.

Se il tuo sito non appare affatto nella ricerca organica, combatti la tentazione di andare nel panico. La maggior parte delle volte, questo è semplicemente un’indicazione di qualche errore o blocco che sta impedendo a Google di indicizzare il tuo sito – e questi problemi sono facilmente risolvibili.

Guarda questi 10 motivi per cui Google potrebbe non indicizzare il tuo sito – se non puoi essere trovato in Google, è probabile che uno di questi sia il colpevole.

1. Non hai sia un dominio www che non-www.

Per il visitatore web medio, non c’è una vera differenza tra un URL che inizia con https:// o https://www. Entrambi portano allo stesso posto, quindi la maggior parte degli utenti e dei webmaster non ci pensano due volte. Ma la variante www è in realtà un sottodominio della più ampia versione non-www. Al fine di ottenere il vostro sito web indicizzato correttamente, è necessario verificare la proprietà di entrambi in Google Webmaster Tools. Puoi anche impostare il tuo dominio preferito, per informare Google su quale versione vorresti usare principalmente.

2. Google sta ancora cercando il tuo sito.

Se hai appena lanciato un sito e sei eccitato di vedere il tuo sito elencato su Google, rilassati. Di solito Google impiega almeno qualche giorno per indicizzare un nuovo sito. Se sono già passati diversi giorni e non hai ancora visto alcun risultato, potrebbe significare che Google sta avendo problemi ad indicizzare il tuo sito – e questo di solito significa che hai un problema con una mappa del sito. Se non hai ancora creato o caricato una sitemap correttamente formattata, questo potrebbe essere il tuo problema. Una volta corretto, è possibile “forzare” Google a scansionare il tuo sito web attraverso Google Search Console.

Questo è di gran lunga il colpevole più comune, quindi se le tue pagine non sono indicizzate, questo è probabilmente ciò che è responsabile.

3. Hai un file robots.txt persistente.

I file robots.txt sono file di istruzioni che possono dire ai crawler di ricerca come operare.

Occasione, gli sviluppatori o i gestori di contenuti useranno un file robots.txt per evitare che un motore di ricerca indicizzi intenzionalmente una data pagina (come se la pagina non fosse pronta per la visualizzazione pubblica).

In sostanza, il file comunica con i crawler di Google e dice loro di non indicizzare un sito o una pagina specifica su quel sito – quindi se si aggiorna o si rimuove il file, si cesserà di avere un problema di indicizzazione.

Fate una scansione approfondita del codice del vostro sito web, e aggiornate tutte le istanze dei file robots.txt che non sono a posto per una ragione specifica.

Avrete ancora bisogno di dare a Google alcuni giorni per indicizzare il vostro sito dopo aver corretto il file errato.

4. Google sta riscontrando degli errori di crawling.

Non succede spesso, ma c’è la possibilità che Google abbia problemi a scansionare alcune delle tue pagine web.

Se la tua home page viene indicizzata, ma non tutte le tue pagine interne, potrebbe essere un sintomo di un semplice errore di scansione. Accedi a Google Search Console e clicca su “Crawl”, poi su “Crawl Errors.”

Questo ti condurrà a una lista di tutte le pagine del tuo sito che hanno attualmente degli errori di crawling. Questi errori sono a volte attribuibili ai file robots.txt, dettagliati sopra, ma possono anche essere il risultato di errori DNS o errori del server, entrambi facilmente correggibili nella maggior parte delle circostanze.

5. Il contenuto duplicato sta interferendo con i crawler.

Se stai seguendo le migliori pratiche per il marketing dei contenuti, questo non dovrebbe essere un problema, ma ci sono circostanze in cui i contenuti duplicati possono esistere sul tuo sito, come le variazioni di una “pagina principale” progettata per un pubblico leggermente diverso.

Se Google rileva più istanze di contenuti duplicati, i crawler dei motori di ricerca possono diventare confusi e abbandonare del tutto l’indicizzazione del tuo sito.

Il modo più semplice per correggere questo problema è quello di sbarazzarsi del contenuto duplicato.

Se eliminare del tutto il contenuto duplicato non è un’opzione, è possibile utilizzare reindirizzamenti 301 o file robots.txt selettivi per garantire che Google scansioni solo un’istanza di ogni pagina.

6. Il tuo sito ha problemi di caricamento.

Se Google indicizza il tuo sito, il tuo sito deve essere attivo.

Questo significa che se hai un problema di caricamento quando Google tenta di indicizzare il tuo sito, potresti perdere l’opportunità di essere indicizzato.

I tempi di caricamento incredibilmente lunghi sono a volte il problema; se questo è il caso, è possibile ridurre i tempi di caricamento impostando un sistema di caching decente, riducendo la dimensione delle immagini e installando alcune applicazioni per rendere il sito più veloce. È anche possibile che il tuo hosting sia inaffidabile, con conseguenti interruzioni intermittenti che interrompono i tentativi di indicizzazione di Google.

7. Stai usando linguaggi di codifica poco ottimizzati.

Google ha alcune forti preferenze quando si tratta del tipo di codice sul tuo sito. L’HTML è uno dei linguaggi più facilmente indicizzabili, ma non tutte le opzioni sono così fortunate.

JavaScript e AJAX, per esempio, sono supportati da Google, ma non sono così facilmente indicizzabili come l’HTML.

Se il tuo sito è costruito in AJAX o JavaScript e la tua struttura non è proprio giusta, Google potrebbe avere problemi a indicizzare le tue pagine.

8. Sei bloccato da .htaccess o dalle impostazioni della privacy.

Se gestisci un sito WordPress, è possibile che tu abbia accidentalmente attivato le impostazioni di privacy – puoi disattivarle controllando “Privacy” nella scheda Impostazioni.

È anche possibile che tu stia usando un file .htaccess per il tuo sito sul server.

Mentre i file .htaccess sono utili nella maggior parte dei casi, a volte possono interferire con l’indicizzazione del sito.

9. Hai un’indicazione Noindex o Nofollow da qualche parte nel meta tag.

Proprio come il file robots.txt, questa è un’aggiunta che può mascherare le pagine del tuo sito dall’essere trovate dai crawler dei motori di ricerca. Controllate il codice del vostro sito e cercate il tag “noindex” da qualche parte in un meta titolo. Se lo trovate da qualche parte, avete immediatamente diagnosticato il vostro problema di indicizzazione. Rimuovete semplicemente il tag e sostituitelo se necessario, e dovreste essere di nuovo sulla corsia preferenziale per l’indicizzazione dei motori di ricerca.

10. Sei stato colpito da un’enorme penalità.

Quando Google penalizza i siti, di solito lo fa diminuendo i ranghi e quindi la visibilità e il traffico. Tuttavia, ci sono casi rari ed estremi in cui Google penalizza un sito rimuovendolo completamente dagli indici.

Questo è un tipo di penalizzazione manuale riservata alle infrazioni più gravi, quindi non dovete preoccuparvi di questo a meno che non abbiate fatto qualcosa di molto sbagliato agli occhi di Google.

Se sei stato deindicizzato in questo modo, probabilmente sei già stato notificato da Google, quindi, a meno che non sia questo il caso, non devi preoccuparti che non sei stato indicizzato come punizione.

Una volta che il tuo sito è indicizzabile, dai a Google qualche giorno per recuperare. Dovresti iniziare a vedere il tuo sito nei risultati dei motori di ricerca a breve.

Se hai ancora problemi, è possibile che il tuo problema di indicizzazione sia più complesso del solito.

Se appari, ma hai un ranking molto basso, potrebbe essere un’indicazione che il tuo sito è ancora nuovo e non ha molta autorità, o potrebbe essere un’indicazione di una penalizzazione.

In entrambi i casi, rimanere impegnati nelle migliori pratiche per un lungo periodo di tempo è il modo migliore per aumentare la vostra visibilità.

Come posso correggere un problema se le pagine del mio sito non vengono elencate?

Se il tuo sito non è completamente indicizzato in Google, potresti perdere del traffico serio (e delle entrate). Se le pagine non sono nelle SERP di Google, non sono particolarmente scopribili.

Se trovate che alcune (o tutte) le vostre pagine non sono indicizzate, fate i seguenti passi:

1. Usa Google Search Console per verificare quali pagine non vengono indicizzate. È tutto il tuo sito a non essere indicizzato, o è solo una manciata di pagine? Come si potrebbe sospettare, più pagine mancano, più grande è il problema.

2. Identificare la causa principale del problema. Anche se non sei un esperto tecnico, dovresti essere in grado di capire la causa principale del tuo problema. Rivedere la sezione precedente per le possibili ragioni per cui Google potrebbe non riuscire a indicizzare il tuo sito. Se il tuo sito è nuovo e nessuna delle tue pagine è indicizzata, potrebbe essere un ritardo naturale. Se questo non è il caso, probabilmente hai un file robots.txt, un blocco della privacy o un altro pezzo di codice che sta impedendo alle tue pagine di essere indicizzate.

3. Correggi il problema e invia una sitemap aggiornata. Qualunque sia il problema, lavora per correggerlo. Quando hai finito, puoi inviare una sitemap aggiornata a Google. In Google Search Console, seleziona “Aggiungi una proprietà” e carica la tua sitemap aggiornata. Quando hai finito, puoi usare lo strumento Fetch as Google per richiedere specificamente un bot per scansionare la pagina designata. Basta inserire l’URL, scegliere Desktop o Mobile e fare clic su Fetch. Questo processo richiederà un po’ di tempo, ma una volta completato, Google valuterà le tue pagine per l’indicizzazione.

Se sei bloccato con pagine non indicizzate e non sei sicuro di cosa sia sbagliato, segui questi passaggi di base per la risoluzione dei problemi:

  • Rimuovi qualsiasi blocco della scansione nel tuo file robots.txt. Controlla il tuo file robots.txt andando su yourdomainhere.com/robots.txt. Lì, puoi usare CTRL + F per cercare “Googlebot” e “*”. Se hai qualche riga che specifica User-agent: Googlebot o User-agent: * (che si rivolge a tutti i bot), le pagine che disconoscono non saranno indicizzate in Google. In alcuni casi, questo può essere vantaggioso, ma più spesso, è una semplice barriera all’indicizzazione. Aggiorna il tuo file robots.txt sul backend per risolvere questo problema.
  • Rimuovi i tag noindex vaganti. Allo stesso modo, se hai qualche tag content=”noindex” nei tuoi meta tag, i bot di ricerca di Google non indicizzeranno il tuo contenuto. Questo è un problema semplice da trovare e risolvere, anche se non hai alcuna abilità di codifica.
  • Rimuovere i tag canonici che non sono accurati. I tag canonici sono tag di pagina opzionali che dicono a Google quale versione della tua pagina è la pagina preferita, “canonica”. Alcune pagine hanno un tag canonico autoreferenziale che dice a Google che questa è l’unica versione. Tuttavia, se implementato in modo errato, un tag canonico potrebbe dire a Google di cercare una pagina canonica diversa, che non esiste. Se ciò accade, potrebbe interferire con il processo di indicizzazione di Google. Se questo è il tuo problema, dovrebbe apparire come un errore di scansione in Google Search Console.
  • Aggiorna la tua sitemap. Googlebot dovrebbe essere in grado di scoprire tutti i tuoi contenuti organicamente, ma puoi creare e aggiornare la tua sitemap XML solo per essere sicuro. Caricala tramite Google Search Console per aiutare Google a “vedere” l’intero spettro del tuo sito.

E ricorda, la maggior parte delle persone preoccupate che i loro siti non siano indicizzati semplicemente non hanno aspettato abbastanza.

Se sono passate solo poche ore o un paio di giorni da quando il tuo sito è stato attivato, cerca di essere paziente.

Glo spider di Google è bravo in quello che fa, ma ha bisogno di tempo per funzionare.

Come vengono valutate e classificate le pagine del sito?

Solo perché le pagine del tuo sito sono indicizzate non significa che saranno molto visibili nelle ricerche di Google. Questo perché Google vuole assicurarsi che gli utenti di Google trovino il miglior contenuto possibile quando effettuano una ricerca.

Google categorizza le pagine in base alla loro rilevanza, e le classifica in base alla loro affidabilità (o “autorità”), quindi anche se le tue pagine sono indicizzate, potrebbero non comparire nelle ricerche del tuo pubblico target.

L’ottimizzazione per i motori di ricerca (SEO) è il processo di apportare modifiche onsite e offsite per aumentare le probabilità di posizionamento delle vostre pagine.

È un argomento straordinariamente profondo che non può essere trattato a sufficienza in un singolo articolo, ma se siete nuovi nel mondo del SEO, questi sono alcuni dei fattori di posizionamento più importanti da considerare:

    • Pertinenza dei contenuti. Google ha bisogno di assicurarsi che il vostro contenuto si allinei con l’intento degli utenti di ricerca. Ai vecchi tempi del SEO, questo significava infilare parole chiave e frasi specifiche in tutto il tuo sito. Al giorno d’oggi, Google è troppo sofisticato per cadere in questo trucco; invece, è meglio rispondere a domande specifiche che un utente potrebbe avere o coprire un argomento specifico in modo naturale e approfondito.
    • Qualità del contenuto. Google vuole che solo i migliori contenuti siano classificati abbastanza in alto da indurre un utente a cliccare. Il tuo contenuto dovrebbe essere profondo, conciso e ben scritto. Dovrebbe citare più fonti, coprire l’argomento in modo completo ed essere privo di errori.
    • Intestazioni e tag. Anche il codice di backend delle tue pagine è importante. Includere tag concisi e strategicamente carichi di parole chiave, meta descrizioni e intestazioni può aumentare il tuo potenziale di ranking.
    • Link esterni. Uno dei migliori indicatori di affidabilità, per quanto riguarda Google, è un link che punta alla tua pagina da un sito esterno. Più link in entrata hai, e più autorevoli sono questi link (cioè, provengono da una fonte affidabile), meglio è.
    • Link interni. È anche utile avere le tue pagine strettamente collegate tra loro, in modo che gli utenti possano facilmente navigare da una pagina all’altra del tuo sito. Questo rende anche più facile per Googlebot scansionare il tuo sito.
  • Velocità di caricamento e fattori tecnici. Google guarda anche una serie di fattori tecnici relativi alle prestazioni della tua pagina. Per esempio, le pagine che sono ottimizzate per i dispositivi mobili e quelle che si caricano rapidamente tendono a posizionarsi più in alto rispetto a quelle che non lo sono e non possono.

Come posso portare più traffico e vendite convertite al mio business su Internet?

Anche se hai un prodotto irresistibile e un modello di business fantastico, non avrà importanza se le persone non saranno in grado di scoprire la tua attività in primo luogo.

E il modo migliore per rendere la tua attività scopribile nell’era moderna è attraverso il motore di ricerca di Google.

L’indicizzazione è il primo passo. Dopo aver letto questa guida, dovresti essere in grado di ottenere il tuo sito web correttamente indicizzato in Google, anche se dovrai affrontare alcuni passaggi di risoluzione dei problemi per farlo.

Da lì, dovrai dedicare la tua attenzione ad aumentare la tua posizione nelle SERP di Google con l’aiuto del link building, la creazione di contenuti e altre tattiche SEO. Se sei interessato a saperne di più, o se sei pronto a iniziare una strategia SEO da zero, contattaci oggi stesso per una consulenza gratuita!

Riassunto

L’indice di Google è un archivio di contenuti web che utilizza per gestire le ricerche degli utenti più velocemente, e ottenere il tuo sito indicizzato è di vitale importanza.

Per fortuna, di solito è una questione semplice da ottenere, anche se si incontrano alcuni ostacoli lungo la strada.

Una volta indicizzato, l’unico modo per assicurarsi che il tuo sito sia visibile ai nuovi utenti è quello di aumentare il tuo posizionamento nelle SERP e l’unico modo per farlo è attraverso il SEO.

  • Autore
  • Postate recenti
Chief Marketing Officer at SEO.co
Nei suoi oltre 9 anni come marketer digitale, Sam ha lavorato con innumerevoli piccole imprese e aziende Fortune 500 e organizzazioni tra cui NASDAQ OMX, eBay, Duncan Hines, Drew Barrymore, lo studio legale Price Benowitz LLP di Washington, DC e l’organizzazione per i diritti umani Amnesty International.
È un relatore ricorrente alla serie di conferenze Search Marketing Expo e un TEDx Talker. Oggi lavora direttamente con clienti di alto livello in tutti i settori verticali per massimizzare il ROI SEO on e off-site attraverso il content marketing e il link building. Collegati con Sam su Linkedin.

Latest posts by Sam Edwards (see all)
  • Baidu SEO: The Ultimate Guide to Search Optimization for Baidu.com – March 25, 2021
  • Indicizzazione dei motori di ricerca vs. Ranking dei motori di ricerca: Qual è la differenza? – 23 marzo 2021
  • Clicks di ricerca vs. Volume di ricerca: Qual è la differenza, dove dovrei concentrarmi? – 18 marzo 2021

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.