Cum să construiți un Sitemap XML dinamic pentru Google Search Console și SEO
Publicat: 2017-03-24În acest moment, o „hartă XML a site-ului” este ceva despre care sunt cel puțin conștienți de mulți agenți de marketing și chiar proprietari de mici afaceri cu o înțelegere generală a SEO. Dar când mă conectez la un cont Google Search Console client, este încă destul de obișnuit să văd fie niciun sitemap XML trimis, fie o serie de erori și/sau pagini care nu sunt trimise. În această postare, vom prezenta câteva sfaturi pentru a obține un sitemap generat și trimis la Google Search Console, care să se adapteze site-ului dvs.
Ce este un Sitemap XML?
Pentru început, pentru cei care nu sunt familiarizați: o hartă de site este, practic, o listă cu toate adresele URL ale site-ului dvs. web. Trimiterea unui sitemap XML la Google prin Google Search Console (fostul Google Webmaster Tools) ajută motorul de căutare să descopere și să indexeze tot conținutul site-ului dvs. Drept urmare, acest pas oferă un efect pozitiv asupra eforturilor dvs. de SEO, deoarece cu cât mai mult conținut în indexul Google, cu atât aveți mai multe oportunități de a pătrunde în mai multe verticale de căutare și, astfel, de a apărea pentru mai multe interogări de căutare.
Un sitemap XML vă ajută, de asemenea, să înțelegeți potențialele probleme SEO de pe site-ul dvs. pe care încercați să le diagnosticați.
Pentru a vă ajuta să realizați o hartă a site-ului Google, am creat un set detaliat de instrucțiuni despre cum să creați o hartă a site-ului XML dinamică pentru a crește indexarea conținutului pentru site-ul dvs. La sfârșitul instrucțiunilor privind hărțile site-ului, am inclus câteva resurse utile dacă aveți nevoie de un generator de hărți de site XML sau de un generator de hărți de site și aveți întrebări despre cum să trimiteți harta site-ului dvs. la Google.
Instrucțiuni despre cum să construiți o hartă dinamică a site-ului XML
- Utilizați adresa URL completă a site-ului dvs. pentru opțiunea „Adresa URL de pornire”. Crawler-ul explorează numai adresele URL din directorul de pornire , adică atunci când adresa URL de pornire este „http://www.example.com/path/index.html”, „http://www.example.com/path/sub/ page.html” va fi indexat, dar „http://www.example.com/other/index.html” NU va fi .
- „Salvați harta site-ului în” – este numele fișierului din folderul „public_html/” al site-ului dvs. web. Acest fișier ar trebui să poată fi scris de către script. Pentru a vă asigura că este, creați acest fișier și setați-i permisiunile la 0666.
- Este recomandat să folosiți „Răspunsul serverului” pentru câmpul „Ultima modificare”. În acest caz, intrările pentru paginile statice vor fi completate cu ora reală a ultimei modificări, în timp ce pentru paginile dinamice se utilizează ora curentă.
- Câmpul de intrare „Nu analizați” conține tipuri de fișiere, separate prin spațiu. Aceste fișiere vor fi adăugate pe harta site-ului, dar nu vor fi preluate pentru a economisi lățimea de bandă, deoarece nu sunt fișiere html și nu au legături încorporate. Vă rugăm să vă asigurați că aceste fișiere sunt indexate de Google, deoarece altfel nu are sens să le adăugați pe harta site-ului!
- „Nu analizați adresele URL” funcționează împreună cu opțiunea de mai sus pentru a crește viteza de generare a sitemap-urilor. Dacă sunteți sigur că unele pagini de pe site-ul dvs. nu conțin linkuri unice către alte pagini, puteți spune generatorului să nu le preia.
De exemplu, dacă site-ul dvs. are pagini de „vizualizare articol” cu adrese URL precum „viewarticle.php?..”, poate doriți să le adăugați aici, deoarece cel mai probabil toate linkurile din aceste pagini sunt deja listate la „nivel superior” (cum ar fi lista articolelor) documentelor de asemenea:- viewarticle.php?id=
Dacă nu sunteți sigur ce să scrieți aici, lăsați acest câmp gol. Vă rugăm să rețineți că aceste pagini sunt încă incluse în harta site-ului.
- „Excludeți extensiile” – aceste fișiere nu sunt accesate cu crawlere și nu sunt incluse în harta site-ului.
- Pentru a interzice includerea unei părți a site-ului dvs. în harta site-ului, utilizați setarea „Excludeți adresele URL”: toate adresele URL care conțin șirurile specificate vor fi omise.
De exemplu, pentru a exclude toate paginile din „www.domain.com/folder/” adăugați această linie:
– folder/Dacă site-ul dvs. are pagini cu liste care pot fi reordonate după coloane, iar adresele URL arată ca „list.php?sort=column2”, adăugați această linie pentru a exclude conținutul duplicat:
– sortare=Oricum, puteți lăsa această casetă goală pentru a afișa TOATE paginile.
- Setarea „Include NUMAI adrese URL” este opusă „Exclude adrese URL”. Când nu este gol, NUMAI adresele URL care se potrivesc cu subșirul introdus sunt incluse în sitemap.
- Setarea „Atribute individuale” vă permite să setați valori specifice pentru timpul ultimei modificări, frecvența și prioritatea pe pagină. Pentru a-l utiliza, definiți frecvența și atributele de prioritate specifice în următorul format: „url substring,lastupdate AAAA-mm-zz,frecvență,prioritate” .
Exemplu: page.php?product=,2005-11-14, lunar,0,9
- Poate doriți să limitați numărul de pagini de indexat pentru a vă asigura că nu va fi nesfârșit dacă site-ul dvs. are o eroare, cum ar fi link-uri nelimitate în buclă.
- Pentru a limita timpul maxim de rulare al scriptului, definiți câmpul „Timp maxim de execuție” (în secunde).
- Pentru a avea posibilitatea de a utiliza funcția „Reluați sesiunea”, definiți câmpul „Salvați starea scriptului”. Această valoare înseamnă intervalele de salvare a stării procesului crawler-ului, așa că în cazul în care scriptul a fost întrerupt, puteți continua procesul de la ultimul punct salvat. Setați această valoare la „0” pentru a dezactiva economiile.
- Pentru a reduce sarcina pe serverul dvs. realizată de generatorul de hartă site, puteți adăuga întârzierea „sleep” după fiecare N (configurate) solicitări către site-ul dvs. timp de X secunde (configurate). Lăsați valori necompletate („0”) pentru a accesa cu crawlere site-ul fără întârzieri.
- Google nu acceptă fișiere sitemap cu mai mult de 50.000 de pagini. De aceea, script-ul acceptă crearea „Sitemap Index” pentru site-urile mari. Deci, va crea un fișier index al sitemapului și mai multe fișiere sitemap cu 50 de mii de pagini fiecare.
De exemplu, site-ul dvs. are aproximativ 140.000 de pagini. Generatorul de hărți de site XML va crea aceste fișiere:
- „sitemap.xml” – fișierul index al sitemap-ului care include link-uri către alte fișiere (numele fișierului depinde de ceea ce ați introdus în câmpul „Salvare sitemap în”)
- „sitemap1.xml” – fișier sitemap (URL-uri de la 1 la 50.000)
- „sitemap2.xml” – fișier sitemap (URL-uri de la 50.001 la 100.000)
- „sitemap3.xml” – fișier sitemap (URL-uri de la 100.001 la 140.000)
Vă rugăm să vă asigurați că toate aceste fișiere pot fi scrise dacă site-ul dvs. este mare.
- Activați opțiunea „ Creare HTML Sitemap ” pentru a permite generatorului să creeze un sitemap pentru vizitatorii dvs. De asemenea, ar trebui să definiți „Numele fișierului HTML Sitemap” unde va fi stocat harta site-ului. Este posibil să divizați sitemap-ul html în mai multe fișiere prin definirea opțiunii „Număr de linkuri pe pagină în harta site-ului HTML”.
Numele fișierelor sunt ca următoarele:
- „sitemap.html” – în cazul în care toate linkurile încap într-un singur fișier
SAU - „sitemap1.html” – fișier hartă site, pagina 1
- „sitemap2.html” – fișier hartă site, pagina 2
- etc
La fel ca și punctul de mai sus: asigurați-vă că toate aceste fișiere pot fi scrise. Aspectul paginilor cu harta site-ului poate fi modificat pentru a se potrivi site-ului dvs. în fișierul pages/mods/sitemap_tpl.html .
Pe lângă modificarea foii de stil pentru harta site-ului html, puteți modifica modul în care este formatată. Comenzile de bază ale șablonului sunt:
- <TLOOP XX>…</TLOOP> – definește o secvență de cod care se repetă (cum ar fi numerele de pagină sau link-uri la hărți de site)
- <TIF XX>…</TIF> – definește o declarație condiționată care este inserată numai atunci când un anumit termen este îndeplinit
- <TVAR XX> – inserează o valoare a unei variabile specificate
Vă rugăm să consultați fișierul sitemap_tpl.html pentru un exemplu de utilizare.
- „sitemap.html” – în cazul în care toate linkurile încap într-un singur fișier
- Activați compresia GZip a fișierelor sitemap pentru a economisi spațiu pe disc și lățime de bandă. În acest caz, „.gz” va fi adăugat la numele fișierelor sitemap (cum ar fi „sitemap.xml.gz”).
- „Adresa URL a sitemapului” este același fișier introdus în câmpul „Salvați harta site-ului în”, dar în formularul URL. Este necesar să informați Google despre adresa sitemapului.
- Setați caseta de selectare „Ping Google” activată pentru a permite scriptului să informeze Google cu privire la fiecare modificare a sitemapului. În acest fel, veți informa întotdeauna Google despre informațiile proaspete de pe site-ul dvs.
- Dacă doriți să restricționați accesul la paginile generatorului dvs., setați login și parola aici.
Resurse XML Sitemap Generator
Următoarele sunt câteva resurse excelente pentru realizarea de hărți XML ale site-ului pentru Google și includ o bibliotecă de articole utile pentru a vă ajuta să înțelegeți mai bine ce este o hartă XML a site-ului, să oferiți exemple de hărți ale site-ului și cum să rezolvați potențialele probleme care pot apărea atunci când trimiteți o hartă a site-ului. către Google în scopuri SEO. De asemenea, există o listă de instrumente și creatori gratuiti pentru hărți site-uri.
Biblioteca de învățare a hărților site-ului
- Totul despre hărțile site-ului
- Crearea hărților site-ului
- Gestionarea hărților site-ului
- Crearea de hărți de site pentru mai multe site-uri web
- Sitemap-uri imagine
- Sitemap-uri video
Instrumente gratuite de generare a hărților site-ului
- Instrumente gratuite pentru a face hărți de site Google