Come creare una Sitemap XML dinamica per Google Search Console e SEO

Pubblicato: 2017-03-24
(Ultimo aggiornamento il: 26 marzo 2021)

A questo punto una "mappa del sito XML" è qualcosa di cui almeno molti esperti di marketing e persino proprietari di piccole imprese con una conoscenza generale della SEO sono a conoscenza. Ma quando accedo a un account Google Search Console del cliente, è ancora abbastanza comune non vedere nessuna Sitemap XML inviata o un numero di errori e/o pagine che non vengono inviate. In questo post illustreremo alcuni suggerimenti per ottenere una mappa del sito generata e inviata a Google Search Console che si ridimensionerà con il tuo sito.

Cos'è una Sitemap XML?

Per cominciare per coloro che non hanno familiarità: una mappa del sito è fondamentalmente un elenco di tutti gli URL del tuo sito web. L'invio di una mappa del sito XML a Google tramite Google Search Console (ex Google Webmaster Tools) aiuta il motore di ricerca a scoprire e indicizzare tutti i contenuti del tuo sito web. Di conseguenza, questo passaggio fornisce un effetto positivo sui tuoi sforzi SEO perché maggiore è il contenuto nell'indice di Google, maggiori sono le opportunità che hai per penetrare più verticali di ricerca e quindi presentarti per più query di ricerca.

Una sitemap XML ti aiuta anche a comprendere potenziali problemi SEO sul tuo sito che stai cercando di diagnosticare.

Per aiutarti a creare una mappa del sito Google, abbiamo creato una serie dettagliata di istruzioni su come creare una mappa del sito XML dinamica per aumentare l'indicizzazione dei contenuti del tuo sito web. Alla fine delle istruzioni sulla mappa del sito, abbiamo incluso alcune risorse utili se hai bisogno di un generatore di mappe del sito XML o di un generatore di mappe del sito e hai domande su come inviare la tua mappa del sito a Google.

Istruzioni su come creare una mappa del sito XML dinamica

  1. Utilizza l'URL completo del tuo sito per l'opzione "URL iniziale". Il crawler esplora solo gli URL all'interno della directory iniziale , ovvero quando l'URL iniziale è "http://www.example.com/path/ index.html", "http://www.example.com/path/sub/ page.html" verrà indicizzato, ma "http://www.example.com/other/index.html" NON lo sarà .
  2. “Salva mappa del sito in” – è il nome del file nella cartella “public_html/” del tuo sito web. Questo file dovrebbe essere scrivibile dallo script. Per assicurarti che lo sia, crea questo file e imposta i suoi permessi su 0666.
  3. Si consiglia di utilizzare "Risposta del server" per il campo "Ultima modifica". In questo caso le voci per le pagine statiche verranno riempite con l'ora reale dell'ultima modifica, mentre per le pagine dinamiche viene utilizzata l'ora corrente.
  4. Il campo di input "Non analizzare" contiene i tipi di file, separati da spazio. Questi file verranno aggiunti alla mappa del sito, ma non recuperati per risparmiare larghezza di banda, perché non sono file html e non hanno collegamenti incorporati. Assicurati che questi file siano indicizzati da Google poiché altrimenti non ha senso aggiungerli alla mappa del sito!
  5. "Non analizzare gli URL" funziona insieme all'opzione sopra per aumentare la velocità di generazione della mappa del sito. Se sei sicuro che alcune pagine del tuo sito non contengano i collegamenti univoci ad altre pagine, puoi dire al generatore di non recuperarli.
    Ad esempio, se il tuo sito ha pagine "visualizza articolo" con url come "viewarticle.php?..", potresti volerle aggiungere qui, perché molto probabilmente tutti i link all'interno di queste pagine sono già elencati a "livello superiore" (come l'elenco degli articoli) documenti nonché:

    • viewarticle.php?id=

    Se non sei sicuro di cosa scrivere qui, lascia vuoto questo campo. Tieni presente che queste pagine sono ancora incluse nella mappa del sito.

  6. "Escludi estensioni": questi file non vengono sottoposti a scansione e non sono inclusi nella mappa del sito.
  7. Per impedire l'inclusione della parte del tuo sito Web nella mappa del sito, utilizza l'impostazione "Escludi URL": tutti gli URL che contengono le stringhe specificate verranno ignorati.
    Ad esempio, per escludere tutte le pagine all'interno di "www.domain.com/folder/" aggiungi questa riga:
    - cartella/

    Se il tuo sito ha pagine con elenchi che possono essere riordinati per colonne e URL simili a "list.php?sort=column2", aggiungi questa riga per escludere contenuti duplicati:
    – ordina=

    Ad ogni modo, puoi lasciare vuota questa casella per elencare TUTTE le pagine.

  8. L'impostazione "Includi SOLO URL" è l'opposto di "Escludi URL". Quando non è vuoto, SOLO gli URL che corrispondono alla sottostringa inserita sono inclusi nella mappa del sito.
  9. L'impostazione "Attributi individuali" consente di impostare valori specifici per l'ora dell'ultima modifica, la frequenza e la priorità per pagina. Per utilizzarlo, definire specifici attributi di frequenza e priorità nel seguente formato: "url substring,lastupdate YYYY-mm-dd,frequency,priority" .

    Esempio: page.php?product=,2005-11-14, month,0.9

  10. Potresti voler limitare il numero di pagine da indicizzare per assicurarti che non sia infinito se il tuo sito web presenta un errore come collegamenti in loop illimitati.
  11. Per limitare il tempo massimo di esecuzione dello script, definire il campo "Tempo massimo di esecuzione" (in secondi).
  12. Per avere la possibilità di utilizzare la funzione "Riprendi sessione", definire il campo "Salva lo stato dello script". Questo valore indica gli intervalli per salvare lo stato del processo del crawler, quindi nel caso in cui lo script sia stato interrotto, puoi continuare il processo dall'ultimo punto salvato. Impostare questo valore su "0" per disabilitare il risparmio.
  13. Per ridurre il carico sul tuo server creato dal generatore di mappe del sito, puoi aggiungere il ritardo di "sleep" dopo ogni N richieste (configurate) al tuo sito per X secondi (configurate). Lascia i valori vuoti ("0") per eseguire la scansione del sito senza ritardi.
  14. Google non supporta i file Sitemap con più di 50.000 pagine. Ecco perché lo script supporta la creazione di "Sitemap Index" per i grandi siti. Quindi, creerà un file indice della mappa del sito e più file della mappa del sito con 50 mila pagine ciascuno.

    Ad esempio, il tuo sito web ha circa 140.000 pagine. Il generatore di mappe del sito XML creerà questi file:

    • “sitemap.xml” – file di indice della mappa del sito che include collegamenti ad altri file (il nome del file dipende da ciò che hai inserito nel campo “Salva mappa del sito in”)
    • “sitemap1.xml” – file sitemap (URL da 1 a 50.000)
    • “sitemap2.xml” – file sitemap (URL da 50.001 a 100.000)
    • “sitemap3.xml” – file sitemap (URL da 100.001 a 140.000)

    Assicurati che tutti questi file siano scrivibili se il tuo sito Web è di grandi dimensioni.

  15. Abilita l'opzione " Crea Sitemap HTML " per consentire al generatore di creare una mappa del sito per i tuoi visitatori. È inoltre necessario definire il "nome file della mappa del sito HTML" in cui verrà archiviata la mappa del sito. È possibile suddividere la mappa del sito html in più file definendo l'opzione "Numero di collegamenti per pagina nella mappa del sito HTML".

    I nomi dei file sono come i seguenti:

    • "sitemap.html" - nel caso in cui tutti i collegamenti si inseriscano in un file
      O
    • “sitemap1.html” – file della mappa del sito, pagina 1
    • “sitemap2.html” – file della mappa del sito, pagina 2
    • eccetera

    Come al punto precedente: assicurati che tutti questi file siano scrivibili. Il layout delle pagine della mappa del sito può essere modificato per adattarsi al tuo sito web nel file pages/mods/sitemap_tpl.html .

    Oltre a modificare il foglio di stile per la mappa del sito html, puoi cambiare il modo in cui è formattato. I comandi di base del modello sono:

    • <TLOOP XX>…</TLOOP> – definisce una sequenza ripetuta di codice (come i numeri di pagina o i collegamenti alla mappa del sito)
    • <TIF XX>…</TIF> – definisce un'istruzione condizionale che viene inserita solo quando viene soddisfatto un termine specifico
    • <TVAR XX> – inserisce un valore di una variabile specificata

    Fare riferimento al file sitemap_tpl.html per un esempio di utilizzo.

  16. Abilita la compressione GZip dei file della mappa del sito per risparmiare spazio su disco e larghezza di banda. In questo caso ".gz" verrà aggiunto ai nomi dei file della mappa del sito (come "sitemap.xml.gz").
  17. "Sitemap URL" è lo stesso file inserito nel campo "Salva sitemap in", ma nel modulo URL. È necessario informare Google sull'indirizzo della mappa del sito.
  18. Imposta la casella di controllo "Ping Google" abilitata per consentire allo script di informare Google su ogni modifica della mappa del sito. In questo modo comunicherai sempre a Google le nuove informazioni sul tuo sito.
  19. Se desideri limitare l'accesso alle pagine del tuo generatore, imposta qui login e password.

Risorse del generatore di mappe del sito XML

Di seguito sono riportate alcune ottime risorse per creare mappe dei siti XML per Google e includono una libreria di articoli utili per aiutarti a comprendere meglio cos'è una mappa del sito XML, fornisci esempi di mappe del sito e come risolvere potenziali problemi che potrebbero sorgere quando invii una mappa del sito a Google per scopi SEO. Inoltre, c'è un elenco di strumenti e creatori di mappe del sito gratuiti.

Biblioteca didattica della mappa del sito

  • Tutto sulle mappe dei siti
  • Creazione di mappe del sito
  • Gestione delle mappe dei siti
  • Creazione di mappe del sito per più siti web
  • Sitemap immagini
  • Sitemap video

Strumenti gratuiti per la creazione di mappe del sito

  • Strumenti gratuiti per creare mappe dei siti di Google