Care pagină care se încarcă într-un browser web are un cod de răspuns inclus în anteturile HTTP, care poate fi sau nu vizibil pe pagina web în sine.
Există multe coduri de răspuns diferite pe care un server le oferă pentru a comunica starea de încărcare a paginii; unul dintre cele mai cunoscute coduri este codul de răspuns 404.
În general, orice cod între 400 și 499 indică faptul că pagina nu s-a încărcat. Codul 404-respuns este singurul care are o semnificație specifică – că pagina a dispărut efectiv și probabil că nu se va mai întoarce prea curând.
- Ce este o eroare soft 404?
- Potențial greșit identificată ca fiind Soft 404
- Eroare de legătură
- O pagină care nu mai există
- Google Search Console
- Google Analytics
- Site: Comandă de căutare operator
- Alte instrumente de cercetare a backlink-urilor
- Cum să remediați erorile soft 404
- Google tratează erorile 404 & Soft 404 Errors the Same Way
Ce este o eroare soft 404?
O eroare soft 404 nu este un cod de răspuns oficial trimis către un browser web. Este doar o etichetă pe care Google o adaugă unei pagini din cadrul indexului lor.
În timp ce Google răscolește paginile, alocă resursele cu atenție, asigurându-se că nu pierde timp prin răscolirea paginilor lipsă care nu trebuie să fie indexate.
Cu toate acestea, există unele servere care sunt prost configurate și pagina lor lipsă încarcă un cod 200 când ar trebui să afișeze un cod de răspuns 404. Dacă antetul HTTP invizibil afișează un cod 200 chiar dacă pagina web precizează în mod clar că pagina nu este găsită, pagina ar putea fi indexată, ceea ce reprezintă o risipă de resurse pentru Google.
Pentru a combate această problemă, Google notează caracteristicile paginilor 404 și încearcă să discearnă dacă pagina 404 este într-adevăr o pagină 404. Cu alte cuvinte, Google a învățat că, dacă arată ca un 404, miroase ca un 404 și se comportă ca un 404, atunci probabil că este o pagină 404 autentică.
Potențial greșit identificată ca fiind Soft 404
Există, de asemenea, cazuri în care pagina nu lipsește de fapt, dar anumite caracteristici au determinat Google să o catalogheze ca fiind o pagină lipsă.
Câteva dintre aceste caracteristici includ o cantitate mică sau lipsa de conținut pe pagină și faptul că are prea multe pagini similare pe site.
Aceste caracteristici sunt, de asemenea, similare cu factorii pe care algoritmul Panda îi abordează. Actualizarea Panda consideră conținutul subțire și conținutul duplicat ca fiind factori negativi de clasificare.
În consecință, rezolvarea acestor probleme va ajuta la evitarea atât a soft 404s, cât și a problemelor Panda.
Erorile 404 au două cauze principale:
- O eroare în link, direcționând utilizatorii către o pagină care nu există.
- Un link care se îndreaptă către o pagină care exista și care a dispărut brusc.
Eroare de legătură
Dacă cauza 404 este o eroare de legătură, trebuie doar să reparați legăturile.
Partea dificilă a acestei sarcini este găsirea tuturor legăturilor rupte de pe un site.
Poate fi mai dificil pentru site-urile mari, complexe, care au mii sau milioane de pagini. În astfel de cazuri, instrumentele de crawling vin la îndemână. Puteți încerca să folosiți software precum Xenu, DeepCrawl, Screaming Frog sau Botify.
O pagină care nu mai există
Când o pagină nu mai există, aveți două opțiuni:
- Refaceți pagina dacă a fost eliminată din greșeală.
- 301 redirecționați-o către cea mai apropiată pagină conexă dacă a fost eliminată intenționat.
În primul rând, trebuie să localizați toate erorile de legătură de pe site. Similar cu găsirea tuturor erorilor de linking pentru un site web la scară mare, puteți utiliza instrumente de crawling. Cu toate acestea, este posibil ca instrumentele de crawling să nu găsească paginile orfane, care sunt pagini care nu sunt legate de nicăieri în cadrul legăturilor de navigare sau din oricare dintre pagini.
Paginile orfane pot exista dacă făceau parte din site-ul web, apoi, după o reproiectare a site-ului web, legătura care mergea către această pagină veche a dispărut, dar este posibil ca legăturile externe de pe alte site-uri web să fie încă legate către ele. Pentru a verifica de două ori dacă aceste tipuri de pagini există pe site-ul dvs. puteți utiliza o varietate de instrumente.
Google Search Console
Search console va raporta paginile 404 pe măsură ce crawler-ul Google trece prin toate paginile pe care le poate găsi. Acest lucru poate include linkuri de pe alte site-uri care merg către o pagină care exista pe site-ul dvs. web.
Google Analytics
Nu veți găsi un raport de pagini lipsă în Google Analytics în mod implicit. Cu toate acestea, le puteți urmări în mai multe moduri.
Pentru început, puteți crea un raport personalizat și să segmentați paginile care au un titlu de pagină care menționează Error 404 – Page Not Found.
O altă modalitate de a găsi paginile orfane în cadrul Google Analytics este să creați grupări de conținut personalizate și să atribuiți toate paginile 404 unui grup de conținut.
Site: Comandă de căutare operator
Cercetarea în Google pentru „site:example.com” va lista toate paginile din example.com care sunt indexate de Google. Apoi puteți verifica individual dacă paginile se încarcă sau dacă dau 404.
Pentru a face acest lucru la scară largă, îmi place să folosesc WebCEO, care are o funcție pentru a rula site-ul: operator nu numai pe Google, ci și pe Bing, Yahoo, Yandex, Naver, Baidu și Seznam.
Din moment ce toate motoarele de căutare vă vor oferi doar un subset, rularea pe mai multe motoare de căutare poate ajuta la obținerea unei liste mai mari de pagini ale site-ului dumneavoastră. Această listă poate fi exportată și rulată pe instrumente pentru o verificare 404 în masă. Eu fac acest lucru pur și simplu adăugând toate URL-urile ca linkuri în cadrul unui fișier HTML și încărcându-l pe Xenu pentru a verifica masiv dacă există erori 404.
Alte instrumente de cercetare a backlink-urilor
Instrumentele de cercetare a backlink-urilor precum Majestic, Ahrefs, Moz Open Site Explorer, Sistrix, LinkResearchTools și CognitiveSEO pot fi, de asemenea, de ajutor.
Majoritatea acestor instrumente vor exporta o listă de backlink-uri care se leagă de domeniul dumneavoastră. De acolo, puteți verifica toate paginile care sunt legate și căutați erori 404.
Cum să remediați erorile soft 404
Uneltele de crawling nu vor detecta o eroare soft 404 deoarece nu este cu adevărat o eroare 404. Dar puteți folosi instrumentele de crawling pentru a detecta altceva. Iată câteva lucruri pe care să le găsiți:
- Thin Content: Unele instrumente de crawling nu numai că raportează paginile care au conținut subțire, dar arată și un număr total de cuvinte. De acolo, puteți sorta URL-urile în funcție de numărul de cuvinte din conținut. Începeți cu paginile care au cel mai mic număr de cuvinte și evaluați dacă pagina are conținut subțire.
- Conținut duplicat: Unele instrumente de crawling sunt suficient de sofisticate pentru a discerne ce procent din pagină este conținut șablon. În cazul în care conținutul principal este aproape același cu multe alte pagini, ar trebui să analizați aceste pagini și să determinați de ce există conținut duplicat pe site-ul dumneavoastră.
În afară de instrumentele de crawling, puteți utiliza și Google Search Console și verificați la erori de crawling pentru a găsi paginile care sunt listate la soft 404s.
Crawling-ul unui întreg site pentru a găsi problemele care cauzează soft 404s vă permite să localizați și să corectați problemele chiar înainte ca Google să le detecteze.
După ce ați detectat aceste probleme soft 404, va trebui să le corectați.
De cele mai multe ori, soluțiile par a fi de bun simț. Acestea pot include lucruri simple, cum ar fi extinderea paginilor cu conținut subțire sau înlocuirea conținutului duplicat cu unul nou și unic.
În tot acest proces, iată câteva lucruri de luat în considerare:
- Consolidați paginile: Uneori, conținutul subțire este cauzat de faptul că sunteți prea specific cu subiectul paginii, ceea ce vă poate lăsa cu puține lucruri de spus. Unirea mai multor pagini subțiri într-o singură pagină poate fi mai potrivită dacă subiectele sunt legate între ele. Acest lucru nu numai că rezolvă problemele de conținut subțire, dar poate rezolva și problemele de conținut duplicat. De exemplu, un site de comerț electronic care vinde pantofi care vin în diferite culori și mărimi poate avea un URL diferit pentru fiecare combinație de mărimi și culori. Acest lucru lasă un număr mare de pagini cu conținut subțire și relativ identic. Abordarea mai eficientă este de a pune toate acestea pe o singură pagină în schimb și de a enumera opțiunile disponibile.
- Găsiți problemele tehnice care cauzează conținut duplicat: Folosind chiar și cel mai simplu instrument de căutare pe web, cum ar fi Xenu (care nu se uită la conținut, ci doar la URL-uri, coduri de răspuns și etichete de titlu), puteți găsi în continuare probleme de conținut duplicat prin examinarea URL-urilor. Aceasta include lucruri precum URL-uri www vs. non-www, http și https, cu index.html și fără, cu parametri de urmărire și fără, etc. Un bun rezumat al acestor probleme comune de conținut duplicat găsite în modelele de URL-uri poate fi găsit pe diapozitivul 6 al acestei prezentări.
Google tratează erorile 404 & Soft 404 Errors the Same Way
Un soft 404 nu este o eroare 404 reală, dar Google va dezindexa acele pagini dacă nu sunt reparate rapid. Cel mai bine este să vă cercetați site-ul în mod regulat pentru a vedea dacă apar erori 404 sau soft 404. Instrumentele de crawling ar trebui să fie o componentă majoră a arsenalului dvs. de SEO.
Credite de imagine
Imaginea principală: Paulo Bobita