Dato che sei qui, immagino che quello che dico non sia una novità per te. Quindi, direi di darci subito da fare.
Questo articolo ti insegna come risolvere questi tre problemi:
- Il tuo sito intero non viene indicizzato
- Alcune delle tue pagine sono indicizzati, ma altre non lo sono.
- Le tue pagine pubblicate di recente non vengono indicizzate abbastanza velocemente.
Ma prima, assicuriamoci di essere sulla stessa onda e di capire pienamente il gergo dellâindicizzazione.
Google scopre nuove pagine web tramite crawling (scansione) del web, per poi aggiungere queste pagine al proprio indice. Fa questo utilizzando un web spider che si chiama Googlebot.
Sei confuso? Lasciami definire alcuni termini chiave.
- Crawling (scansione): Il processo di seguire hyperlinks sul web per scoprire nuovi contenuti.
- Indexing (indicizzazione): Il processo di salvare ogni pagina web in un ampio database.
- Web spider: Un software disegnato per svolgere il processo di crawling su ampia scala.
- Googlebot: Il web spider di Google.
Questo è un video di Google che spiega il processo in maggiore dettaglio:
Quando cerchi qualcosa su Google, stai chiedendo a Google di restituire tutte le pagine rilevanti del suo indice. Siccome ci sono spesso milioni di pagine rilevanti, lâalgoritmo di ranking (posizionamento) di Google fa del suo meglio per ordinare la posizione delle pagine in modo che tu veda per primi i risultati piĂš rilevanti.
Il punto che sto sottolineando è che indicizzazione e posizionamento sono due cose separate.
Lâindicizzazione è presentarsi alla gara; il posizionamento è vincerla.
Non puoi vincere se non ti presenti alla linea di partenza.
Vai su Google e cerca per site:iltuosito.com

Questo numero mostra allâincirca quante pagine Google ha indicizzato.
Se vuoi verificare lo stato dellâindicizzazione per uno URL specifico, fai la stessa cosa con lâ operatore site:iltuosito.com/slug-della-tua-pagina-web.

Se la tua pagina non è indicizzata non vedrai alcun risultato.
A questo punto è utile sottolineare come se sei un utente di Google Search Console, puoi utilizzare il rapporto sulla Copertura per ottenere informazioni piÚ accurate sullo stato di indicizzazione del tuo sito. Vai su:
Google Search Console > Indice > Copertura

Guarda il numero di pagine valide (con e senza avvisi).
Se questi due numeri sono qualsiasi cosa che non sia zero, allora Google ha almeno qualche pagina del tuo sito indicizzate. In caso contrario, hai un serio problema perchÊ nessuna pagina del tuo sito è indicizzata.
Puoi anche utilizzare Search Console per verificare se una pagina specifica sia indicizzata. Per farlo, incolla lâURLÂ nello Strumento Controllo URL.
Se la pagina è indicizzata, lo strumento dirĂ âLâURL si trova su Google.â

Se la pagina non è indicizzata, vedrai invece âLâURL non si trova su Google.â

Hai scoperto che il tuo sito o pagina web non è indicizzato da Google? Prova questo:
- Accedi alla Google Search Console
- Naviga fino allo strumento controllo URL
- Incolla lâURL che vorresti che Google indicizzasse nella barra di ricerca.
- Attendi che Google abbia verificato lâURL
- Clicca sul pulsante âRichiedi indicizzazioneâ
Questo processo è una buona pratica quando pubblichi un nuovo post o pagina. Stai effettivamente dicendo a Google che hai aggiunto qualcosa di nuovo al tuo sito e che vorresti che le desse unâocchiata.
Tuttavia, richiedere lâindicizzazione non risolverĂ problemi che non permettono a Google di indicizzare pagine vecchie. Se questo è il caso, segui la lista di controllo qui sotto per diagnosticare e fissare il problema.
Qui trovi alcuni link rapidi per ciascuna tatticaâqualora ne avessi giĂ provati alcuni:
- Rimuovi blocchi al crawling nel tuo file robots.txt
- Rimuovi tag noindex dannose
- Includi la pagina nella tua sitemap
- Rimuovi tag canonici dannosi
- Controlla che la pagina non sia orfana
- Risolvi link interni nofollow
- Aggiungi link interni âpotentiâ
- Assicurati che la pagina abbia valore e sia unica
- Rimuovi pagine a bassa qualitĂ (per ottimizzare il âcrawl budgetâ)
- Costruisci backlink ad alta qualitĂ
Â
1) Rimuovi blocchi al crawling nel tuo file robots.txt
Google non sta indicizzando lâintero sito? Potrebbe essere dovuto ad un blocco di crawling in quello che viene chiamato file robots.txt.
Per verificare questo problema naviga su iltuodominio.com/robots.txt.
Cerca se hai uno di questi due snippet di codice:
User-agent: Googlebot Disallow: /
User-agent: * Disallow: /
Entrambi questi esempi dicono al Googlebot che non è autorizzato a fare crawling su alcuna pagina del tuo sito. Per risolvere, devi rimuovere questi snippet. à davvero cosÏ facile.
Un blocco al crawling nel robots.txt potrebbe anche essere la causa qualora Google non stesse indicizzando una singola pagina web. Per verificare se è questo il caso, incolla lâURL nello strumento di controllo URL nella Google Search Console.
Clicca sul blocco di Copertura per visualizzare ulteriori dettaglio, quindi cerca se è presente lâerrore âScansione consentita? No: bloccato da robots.txtâ
Questo indica che la pagina è bloccata nel robots.txt.
Se questo è il caso, controlla nuovamente il tuo file robots.txt per qualsiasi regola di âdisallowâ relativa alla pagina o relativa sottosezione.

Rimuovi le righe non necessarie.
Â
2) Rimuovi tag noindex dannose
Google non indicizza le pagine se gli dici di non farlo.  Questo è utile per mantenere alcune pagine private. Ci sono due modi per farlo:
Metodo 1: meta tag
Pagine con uno di questi meta tag nella sezione  <head> non verranno indicizzate da Google:
<meta name=ârobotsâ content=ânoindexâ>
<meta name=âgooglebotâ content=ânoindexâ>
Questo è un tag meta robots e dice ai motori di ricerca se possano o meno indicizzare la pagina.
Per trovare tutte le pagine con un meta tag noindex, fai una scansione con Ahrefsâ Site Audit. Vai al rapporto Indexability (
IndicizzabilitĂ ). Cerca avvisi di âNoindex pageâ (pagine noindex).

Clicca per vedere tutte le pagine affette dal problema. Rimuovi i meta tag noindex da pagine che non dovrebbero essere nella lista.
Metodo 2: XâRobots-Tag
I crawlers rispettano anche lâheader di risposta del XâRobots-Tag HTTP. Puoi implementarli utilizzando un linguaggio di scripting lato server quale PHP, oppure nel file .htaccess file, oppure cambiando la configurazione del tuo server.
Lo strumento di controllo URL nella Search Console ti dice qualora Google sia bloccato dallo scansionare una pagina a causa del suo header. Inserisci il tuo URL, quindi cerca lâerrore âScansione consentita? No: ânoindexâ rilevato nel âXâRobots-Tagâ header httpâ.

Se vuoi controllare questo problema sul tuo intero sito, fai una scansione nello strumento Ahrefsâ Site Audit, quindi utilizza il filtro âRobots information in HTTP headerâ nel Page Explorer:

DĂŹ ai tuoi sviluppatori di evitare che le pagine che vuoi vengano indicizzate restituiscano questo header.
Lettura consigliata: Using the XâRobots-Tag HTTP Header Specifications in SEO: Tips and Tricks
Â
3) Includi la pagina nella tua sitemap
Una sitemap dice a Google quali pagine del tuo sito sono importanti, e quali non lo sono. Può anche dare unâindicazione su quanto spesso vadano ri-scansionate.
Google dovrebbe essere in grado di trovare le pagine del tuo sito web a prescindere che siano nella sitemap, ma è una buona prassi inserirle. Dâaltra parte, non ha senso rendere la vita difficile a Google.
Per verificare se la tua pagina è nella sitemap, utilizza lo strumento di controllo URL nella Search Console. Se vedi lâerrore âlâURL non si trova su Googleâ e âSitemap: N/A,â allora non è nella tua sitemap o non è indicizzato.

Non stai utilizzando Search Console? Apri lo URL della tua sitemapâsolitamente è iltuodominio.com/sitemap.xmlâe cerca la pagina.

Altrimenti, se vuoi trovare tutte le pagine scansionabili ed indicizzabili che non sono nella tua sitemap, fai partire una scansione nel Ahrefsâ Site Audit. Vai su Page Explorer e applica questi filtri:

Queste pagine dovrebbero essere nella tua sitemap, quindi aggiungile. Una volta fatto, fai sapere a Google che hai aggiornato la tua sitemap mandando un ping a questo URL:
http://www.google.com/ping?sitemap=<full_URL_of_sitemap>
Sostituisci lâultima parte con lâURL della tua sitemap. Dovresti quindi vedere qualcosa simile a questo:

Questo dovrebbe velocizzare lâindicizzazione della pagina da parte di Google.
Â
4) Rimuovi tag canonici dannosi
Un tag canonico dice a Google quale sia la versione preferita di una pagina. Somiglia a qualcosa del genere:
<link rel=âcanonicalâ href=â/page.htmlâ/>
La maggior parte delle pagine o non hanno alcun tag canonico, oppure hanno quello che viene chiamato un tag canonico auto-referenziale. Questo dice a Google che la pagina stessa è la versione preferita e probabilmente lâunica versione. In altre parole, vuoi che questa pagina venga indicizzata.
Ma se la tua pagina ha un tag canonico sbagliato, allora potrebbe dire a Google che la versione preferita è una pagina che non esiste. In questo caso, la tua pagina non verrebbe indicizzata.
Per verificare un tag canonico, utilizza lo strumento di controllo URL di Google. Vedrai un avviso âPagina alternativa con tag canonicoâ se il tag canonico punta ad unâaltra pagina.

Se questo non dovesse essere corretto, e vuoi che venga indicizzata la pagina, rimuovi il tag canonico.
Nota che i tag canonici non sono sempre dannosi. La maggior parte delle pagine con questi tag li ha per una qualche ragione. Se vedi che la tua pagina ha un set di tag canonici, allora controlla la pagina canonica. Qualora fosse effettivamente la versione preferita della pagina e non ci fosse necessitĂ di indicizzare anche la pagina in questione, allora il tag canonico dovrebbe rimanere.
Se vuoi un metodo veloce per trovare tag canonici dannosi sul tuo intero sito, fai una scansione con lo strumento Ahrefsâ Site Audit. Accedi al Page Explorer. Utilizza queste impostazioni:

Questo cerca pagine nella tua sitemap con tag canonici non autoreferenziali. Siccome quasi sicuramente vuoi indicizzare le pagine nella tua sitemap, dovresti investigare ulteriormente se questo filtro restituisce risultati.
Ă molto probabile che queste pagine abbiano un canonico dannoso oppure che non debbano essere nella tua sitemap.
Â
5) Controlla che la pagina non sia orfana
Le pagine orfane sono quelle che non hanno link interni verso di loro.
Siccome Google scopre nuovi contenuti scansionando il web, non è in grado di scoprire da solo pagine orfane. Nemmeno i visitatori del sito sarebbero in grado di trovarle.
Per verificare le pagine orfane, scansiona il tuo sito con Ahrefsâ Site Audit. Poi, cerca nel rapporto Incoming links (link in ingresso)Â errori di tipo âOrphan page (has no incoming internal links)â:

Questo mostra tutte le pagine che sono indicizzabili e presenti nella tua sitemap, ma che non hanno link interni che puntano verso esse.
Questo processo funziona solamente quando sono vere queste due cose:
- Tutte le pagine che vuoi vengano indicizzate sono nelle tue sitemap
- Hai marcato la casella di utilizzare tutte le pagine nella tua sitemap come punto di partenza per la scansione quando hai impostato il progetto in Ahrefsâ Site Audit.
Non sei sicuro che tutte le pagine che vuoi siano indicizzate siano nella tua sitemap? Prova questo:
- Scarica una lista di tutte le pagine del tuo sito (tramite il tuo CMS)
- Scansiona il tuo sito web (utilizzando uno strumento quale Ahrefsâ Site Audit)
- Fai un riferimento incrociato tra le due liste di URL
Tutti gli URLs non trovati durante la scansione sono pagine orfane.
Puoi risolvere le pagine orfane utilizzando uno di questi due metodi:
- Se la pagina non è importante, rimuovila e rimuovila dalla sitemap.
- Se la pagina è importante, incorpora il link nella struttura di link interni del tuo sito web.
Â
6) Risolvi link interni nofollow
I link nofollow sono link con un tag rel=ânofollowâ. Evitano il trasferimento di PageRank allâURL di destinazione. Google non permette di scansionare link nofollow.
Questo è quello che Google dice a proposito:
Essenzialmente, utilizzare nofollow ci fa tralasciare i link target dal grafico generale del web. Tuttavia, le pagine target potrebbero comunque apparire nel nostro indice se altri siti linkano ad esse senza utilizzare nofollow, oppure se gli URL sono mandati a Google in una Sitemap.
In breve, dovresti assicurarti che tutti i link interni a pagine indicizzabili siano di tipo âfollowâ.
Per fare questo, utilizza lo strumento Ahrefsâ Site Audit tool per scansionare il tuo sito. Controlla il rapporto link in ingresso alla ricerca di errori âPage has nofollow incoming internal links onlyâ (la pagina ha solo link in ingresso interni nofollow):

Rimuovi il tag nofollow da questi link interni, dando per scontato che tu voglia che siano indicizzati su Google. Se non è questo il caso, cancella la pagina o falla diventare noindex.
Lettura consigliata: What Is a Nofollow Link? Everything You Need to Know (No Jargon!)
Â
7) Aggiungi link interni âpotentiâ
Google scopre nuovi contenuti scansionando il tuo sito web. Se trascuri di fare link interni alla pagina in questione potrebbe non essere in grado di trovarla.
Una soluzione semplice a questo problema è di aggiungere alcuni link interni alla pagina. Puoi farlo da qualsiasi altra pagina che Google può scansionare ed indicizzare. Tuttavia, se vuoi che Google indicizzi la pagina il prima possibile, conviene farlo da una delle tue pagine piĂš âimportantiâ.
PerchĂŠ? PerchĂŠ Google scansiona nuovamente queste pagine piĂš spesso rispetto a pagine meno importanti.
Per fare questo, vai sul Ahrefsâ Site Explorer, inserisci il tuo dominio, quindi vista il rapporto Best by links (migliori pagine per link in ingresso).

Questo mostra tutte le pagine sul tuo sito web ordinate per punteggio URL Rating (UR). In altre parole, mostra per prime le pagine  con piÚ autorevolezza.
Scorri questa lista e trova le pagine rilevanti dalle quali aggiungere link interni verso le pagine in questione.
Ad esempio, se volessi aggiungere un link interno alla nostra guida su guest posting, la nostra guida su link building ti offrirebbe probabilmente un luogo rilevante dal quale farlo. E quella pagina è la 11esima piÚ autorevole sul nostro blog:

Google quindi vedrĂ e poi seguirĂ quel link la prossima volta che scansiona quella pagina.
Incolla la pagina dalla quale hai aggiunto il link interno nello strumento controllo URL di Google. Clicca il pulsante âRichiedi indicizzazioneâ per far sapere a Google che qualcosa su quella pagina è cambiato e che dovrebbe scansionarla nuovamente il prima possibile. Questo può velocizzare il processo di scoperta del link interno e quindi della pagina che vuoi indicizzare su Google.
Â
8) Assicurati che la pagina abbia valore e sia unica
Ă importabile che Google indicizzi pagine di bassa qualitĂ perchĂŠ non hanno alcun valore per i suoi utenti. Questo è quello che John Mueller di Google ha detto a proposito dellâindicizzazione nel 2018:
We never index all known URLs, thatâs pretty normal. Iâd focus on making the site awesome and inspiring, then things usually work out better.
â đ John đ (@JohnMu) January 3, 2018
Quello che dice implica che se vuoi che Google indicizzi il tuo sito o la tua pagina web, deve essere âeccezionale e fonte di ispirazioneâ.
Se hai escluso problemi tecnici per la mancanza di indicizzazione, allora un basso valore della pagina potrebbe esserne la causa. Per questa ragione, vale la pena visionare la pagina con occhi nuovi e chiedersi: questa pagina è genuinamente di qualità ? Un utente troverebbe valore in questa pagina se ci cliccasse sopra trovandola nei risultati di ricerca?
Se la risposta è no ad una di queste due domande, allora devi migliorarne i contenuti.
Puoi trovare pagine potenzialmente a bassa qualitĂ che non sono indicizzate utilizzando gli strumenti Ahrefsâ Site Audit e URL Profiler. Per farlo, vai su Page Explorer nel Ahrefsâ Site Audit e utilizza queste impostazioni:

Questo restituirĂ le pagine âsottiliâ che sono indicizzabili ma che non ottengono alcun traffico organico. In altre parole, câè una buona possibilitĂ che non siano indicizzate.
Esporta il rapporto e incolla tutti gli URL nello URL Profiler e fai una verifica dellâindicizzazione da parte di Google.

Consigliamo di utilizzare un proxy se hai intenzione di farlo per molte pagine (piĂš di 100). Altrimenti, rischi che il tuo IP venga bannato da Google. Se non puoi farlo, allora unâalternativa è di cercare su Google un âfree bulk Google indexation checker.â Ci sono diversi strumenti di questo tipo, ma molti di essi sono limitati a meno di 25 pagine alla volta.
Verifica problemi di qualitĂ su ogni pagina non-indicizzata. Migliorale dove necessario, quindi richiedi una nuova indicizzazione nella Google Search Console.
Dovresti cercare di fissare i problemi di contenuti duplicati. à improbabile che Google indicizzi pagine con contenuti duplicati o quasi duplicati. Utilizza il rapporto Content quality (qualità dei contenuti) nel Site Audit per verificare questo tipo di problemi.

Â
9) Rimuovi pagine a bassa qualitĂ (per ottimizzare il âcrawl budgetâ)
Avere troppe pagine a bassa qualitĂ sul tuo sito web spreca il crawl budget.
Questo è quello che Google dice a proposito:
Sprecare risorse di server su [low-value-add pages] toglie attività di crawl da pagine che hanno effettivamente valore, il che può causare un ritardo significativo nello scoprire contenuti notevoli su di un sito.
Pensalo come un insegnante che dà i voti a dei compiti, uno dei quali è il tuo. Se deve dare i voti a dieci compiti, arriva al tuo abbastanza velocemente. Se ne ha cento, ci vorrà di piÚ. Se ne ha migliaia, la mole di lavoro potrebbe essere tale che non arriverà mai a dare un voto al tuo compito.
Google dice che il âcrawl budget [âŚ] non è una cosa della quale devono preoccuparsi la maggior parte degli editori,â e che âse un sito ha meno di qualche migliaia di URL, nella maggior parte dei casi verrĂ indicizzato efficientemente.â
In ogni caso, rimuovere pagine a bassa qualità dal tuo sito non è mai una cosa cattiva. Può solo avere un effetto positivo sul crawl budget.
Puoi utilizzare il nostro modello di content audit per trovare pagine potenzialmente a bassa qualità o irrilevanti che possono essere cancellate.
Â
10)Â Costruisci backlink ad alta qualitĂ
I backlinks dicono a Google che una pagina web è importante. Dâaltra parte, se qualcuno sta linkando ad essa, deve avere un qualche valore. Queste sono le pagine che Google vuole indicizzare.
Per massima trasparenza, Google non indicizza solo pagine con backlinks. Ci sono moltissime (miliardi) di pagine indicizzate senza backlinks. Tuttavia, dato che Google vede le pagine con  link dâalta qualitĂ come piĂš importanti, è piĂš probabile che queste pagine vengano scansionateâe ri-scansionateâpiĂš velocemente che quelle senza. Questo porta ad una indicizzazione piĂš rapida.
Abbiamo molte risorse sul costruire backlink di alta qualitĂ sul nostro blog.
Dai unâocchiata ad alcune delle guide qui sotto.
Indicizzazione â posizionamento
Avere il tuo sito web o pagina web indicizzato su Google non vuol dire necessariamente posizionamento o traffico.
Sono due cose differenti.
Indicizzazione significa che Google sa dellâesistenza del tuo sito. Non vuol dire che lo posizionerĂ per qualsiasi termine di ricerca.
Qui è dove entra in gioco SEOâlâarte di ottimizzare le tue pagine web per il posizionamento su termini di ricerca specifici.
In breve, SEO include:
- Cercare cosa i tuoi clienti stanno cercando;
- Creare contenuti su questi argomenti;
- Ottimizzare quelle pagine per le tue parole chiave target;
- Costruire backlinks;
- Pubblicare nuovamente ed aggiornare periodicamente i contenuti per mantenerli âsempreverdi.â
Questo è un video per aiutarti ad iniziare con SEO:
⌠e alcuni articoli:
In conclusione
Ci sono due ragioni possibili per le quali Google non sta indicizzando il tuo sito o pagina web:
- Problemi tecnici che non permettono a Google di farlo
- Google vede il tuo sito o pagina come contenuti a bassa qualitĂ e senza valore per i suoi utenti.
Ă interamente possibile che entrambe i problemi siano presenti allo stesso tempo. Tuttavia, direi che i problemi tecnici sono molto piĂš comuni. I problemi tecnici possono portare allâauto-generazione di contenuti a bassa qualitĂ indicizzabili (ad esempio problemi con navigazione sfaccettata). Non è buono.
Comunque, seguire la lista di sopra risolve problemi di indicizzazione nove volte su dieci.
Ricordati sempre che indicizzazione â posizionamento. SEO è comunque vitale se vuoi essere posizionato per termini di ricerca rilevanti ed attrarre un flusso costante di traffico organico.
TradotÂto da MarÂco ViapÂpiÂani, conÂsulente di marÂketÂing digitale.

