Minden oldal, amely betöltődik a webböngészőben, tartalmaz egy válaszkódot a HTTP fejlécekben, amely látható vagy nem látható magán a weboldalon.
A szerver számos különböző válaszkódot ad az oldal betöltési állapotának közlésére; az egyik legismertebb kód a 404-es válaszkód.
A 400 és 499 közötti kódok általában azt jelzik, hogy az oldal nem töltődött be. A 404-response kód az egyetlen, amely konkrét jelentést hordoz – azt, hogy az oldal valóban eltűnt, és valószínűleg nem is fog egyhamar visszatérni.
Mi az a soft 404 hiba?
A soft 404 hiba nem egy hivatalos válaszkód, amelyet a webböngészőnek küldenek. Ez csupán egy címke, amelyet a Google az indexében lévő oldalhoz ad.
A Google az oldalak feltérképezése során gondosan osztja be az erőforrásokat, biztosítva, hogy ne pazarolja az időt a hiányzó, indexelésre nem szoruló oldalak feltérképezésére.
Vannak azonban olyan szerverek, amelyek rosszul vannak konfigurálva, és a hiányzó oldaluk 200-as kódot tölt be, amikor 404-es válaszkódot kellene megjelenítenie. Ha a láthatatlan HTTP-fejléc még akkor is 200-as kódot jelenít meg, ha a weboldal egyértelműen jelzi, hogy az oldal nem található, az oldal indexelésre kerülhet, ami a Google számára erőforráspazarlás.
A probléma leküzdésére a Google megjegyzi a 404-es oldalak jellemzőit, és megpróbálja megkülönböztetni, hogy a 404-es oldal valóban 404-es oldal-e. Más szóval, a Google megtanulta, hogy ha úgy néz ki, mint egy 404-es, olyan a szaga, mint egy 404-esnek, és úgy viselkedik, mint egy 404-es, akkor valószínűleg valódi 404-es oldalról van szó.
Potenciálisan tévesen lágy 404-esnek azonosították
Vannak olyan esetek is, amikor az oldal valójában nem hiányzik, de bizonyos jellemzők miatt a Google azt hiányzó oldalnak minősítette.
Ezek közé a jellemzők közé tartozik, hogy az oldalon kevés vagy hiányzik a tartalom, és túl sok hasonló oldal van a webhelyen.
Ezek a jellemzők is hasonlóak azokhoz a tényezőkhöz, amelyekkel a Panda algoritmus foglalkozik. A Panda frissítés a vékony és duplikált tartalmat negatív rangsorolási tényezőknek tekinti.
Ezért ezeknek a problémáknak a kijavítása segít elkerülni mind a soft 404-es, mind a Panda problémákat.
A 404-es hibáknak két fő oka van:
- Hiba a hivatkozásban, amely a felhasználókat egy nem létező oldalra irányítja.
- Egy korábban létező, majd hirtelen eltűnt oldalra mutató link.
Linkelési hiba
Ha a 404-es hiba oka linkelési hiba, akkor csak a linkeket kell kijavítani.
A feladat nehéz része az összes hibás link megtalálása egy webhelyen.
Ez nagyobb kihívást jelenthet nagy, összetett webhelyek esetében, amelyek több ezer vagy millió oldalból állnak. Ilyen esetekben jól jönnek a lánctalpas eszközök. Olyan szoftverekkel próbálkozhat, mint a Xenu, a DeepCrawl, a Screaming Frog vagy a Botify.
Egy oldal, amely már nem létezik
Ha egy oldal már nem létezik, két lehetősége van:
- Helyreállíthatja az oldalt, ha véletlenül eltávolították.
- 301 átirányítani a legközelebbi kapcsolódó oldalra, ha szándékosan távolították el.
Először is meg kell keresni az összes linkelési hibát az oldalon. Hasonlóan egy nagyszabású webhely összes linkelési hibájának megtalálásához, használhat lánctalpas eszközöket. A lánctalpas eszközök azonban nem biztos, hogy megtalálják az elárvult oldalakat, vagyis azokat az oldalakat, amelyek nem kapcsolódnak sehol a navigációs linkeken belül vagy bármelyik oldalról.
Az elárvult oldalak akkor létezhetnek, ha korábban a weboldal részét képezték, majd a weboldal átalakítása után az erre a régi oldalra mutató link eltűnt, de más webhelyekről származó külső linkek még mindig hivatkozhatnak rájuk. Annak kétszeres ellenőrzéséhez, hogy léteznek-e ilyen típusú oldalak a webhelyén, különböző eszközöket használhat.
Google Search Console
A keresőkonzol 404-es oldalakat jelent, mivel a Google lánctalpas programja végigmegy az összes oldalon, amit talál. Ez magában foglalhatja a más webhelyekről származó linkeket, amelyek egy olyan oldalra vezetnek, amely korábban létezett az Ön webhelyén.
Google Analytics
A Google Analyticsben alapértelmezés szerint nem talál jelentést a hiányzó oldalakról. Azonban többféle módon is nyomon követheti őket.
Egyrészt létrehozhat egy egyéni jelentést, és szegmentálhatja azokat az oldalakat, amelyeknek az oldalcímén szerepel a Hiba 404 – Oldal nem található.
Egy másik módja az elárvult oldalak megtalálásának a Google Analyticsben az egyéni tartalomcsoportok létrehozása és az összes 404-es oldal hozzárendelése egy tartalomcsoporthoz.
Site: Operátor keresési parancs
A Google “site:example.com” keresése a example.com összes, a Google által indexelt oldalát felsorolja. Ezután egyenként ellenőrizheti, hogy az oldalak betöltődnek-e, vagy 404-es üzenetet adnak.
Azért, hogy ezt nagyobb léptékben elvégezze, szeretem a WebCEO-t használni, amelynek van egy olyan funkciója, amellyel a site: operátor nem csak a Google-on, hanem a Bing, Yahoo, Yandex, Naver, Baidu és Seznam keresőmotorokon is futtatható.
Mivel minden keresőmotor csak egy részhalmazt ad, a több keresőmotoron való futtatás segíthet nagyobb listát adni a webhely oldalairól. Ez a lista exportálható és futtatható eszközökkel egy tömeges 404-es ellenőrzéshez. Én ezt egyszerűen úgy teszem, hogy az összes URL-t linkként adom hozzá egy HTML-fájlban, és betöltöm a Xenuba, hogy tömegesen ellenőrizzem a 404-es hibákat.
Más backlinkkutató eszközök
A backlinkkutató eszközök, mint a Majestic, Ahrefs, Moz Open Site Explorer, Sistrix, LinkResearchTools és CognitiveSEO szintén segíthetnek.
A legtöbb ilyen eszköz exportálja a domainjére mutató backlinkek listáját. Innen ellenőrizheti az összes oldalt, amelyre hivatkoznak, és kereshet 404-es hibákat.
How to Fix Soft 404 Errors
A lágy 404-es hibák javítása
A lágy 404-es hibát nem észlelik a lágy 404-es eszközök, mivel az valójában nem is 404-es hiba. De a crawling eszközökkel valami mást is észlelhet. Íme néhány dolog, amit meg kell találni:
- Vékony tartalom: Egyes lánctalálási eszközök nem csak a vékony tartalmú oldalakat jelzik, hanem a teljes szavak számát is megmutatják. Ebből kiválogathatja az URL-címeket a tartalom szószáma alapján. Kezdje a legkevesebb szóval rendelkező oldalakkal, és értékelje, hogy az oldalnak van-e vékony tartalma.
- Duplikált tartalom: Egyes lánctalálási eszközök elég kifinomultak ahhoz, hogy felismerjék, az oldal hány százaléka sablonos tartalom. Ha a fő tartalom majdnem ugyanaz, mint sok más oldalé, akkor érdemes megvizsgálni ezeket az oldalakat, és meghatározni, hogy miért van duplikált tartalom a webhelyén.
A lánctalálási eszközökön kívül használhatja a Google Search Console-t is, és a lánctalálási hibák között ellenőrizheti, hogy megtalálja azokat az oldalakat, amelyek a soft 404-es hibák között szerepelnek.
A teljes webhely feltérképezése a lágy 404-eseket okozó problémák megtalálása érdekében lehetővé teszi a problémák felkutatását és kijavítását, mielőtt a Google egyáltalán észlelné azokat.
A lágy 404-es problémák észlelése után ki kell javítania azokat.
A legtöbbször a megoldások józan észnek tűnnek. Ezek közé tartozhatnak olyan egyszerű dolgok, mint a vékony tartalmú oldalak bővítése vagy a duplikált tartalmak új és egyedi tartalmakkal való helyettesítése.
Ezzel a folyamattal kapcsolatban néhány dolgot érdemes figyelembe venni:
- Összevonja az oldalakat: Néha a vékony tartalmat az okozza, hogy túlságosan specifikus az oldal témája, ami kevés mondanivalót hagyhat maga után. Több vékony oldal összevonása egy oldalba megfelelőbb lehet, ha a témák kapcsolódnak egymáshoz. Ez nemcsak a vékony tartalom problémáit oldja meg, hanem a duplikált tartalom problémáit is orvosolhatja. Például egy olyan e-kereskedelmi webhely, amely különböző színű és méretű cipőket árul, minden egyes méret- és színkombinációhoz más URL-címet kaphat. Így rengeteg olyan oldal marad, amelyek tartalma vékony és viszonylag azonos. Hatékonyabb megközelítés, ha mindezt inkább egy oldalra helyezi, és felsorolja az elérhető lehetőségeket.
- Find Technical Issues That Cause Duplicate Content: Még a legegyszerűbb webes lánctalpas eszköz, például a Xenu segítségével (amely nem a tartalmat, hanem csak az URL-címeket, a válaszkódokat és a címcímeket vizsgálja) is megtalálhatja a duplikált tartalommal kapcsolatos problémákat az URL-címek vizsgálatával. Ide tartoznak például a www vs. nem-www URL-ek, http és https, index.html és anélkül, nyomkövető paraméterekkel és anélkül stb. Egy jó összefoglaló ezekről az URL-mintákban található gyakori duplikált tartalmi problémákról az előadás 6. diáján található.
A Google ugyanúgy kezeli a 404 hibákat & Soft 404 hibák
A soft 404 nem valódi 404 hiba, de a Google ezeket az oldalakat deindexeli, ha nem javítják ki gyorsan. A legjobb, ha rendszeresen feltérképezi webhelyét, hogy lássa, előfordulnak-e 404-es vagy lágy 404-es hibák. A lánctalpas eszközöknek a SEO-arzenáljának fontos részét kell képezniük.
Image Credits
Featured Image: Paulo Bobita