Sitemap.xml Dosyası ve Labrika Tarafından Bulunan Hatalar
Bir Sitemap.xml dosyası, temelde, sitenizin arama motorları tarafından kolay gezinme ve indekslenmesi için özel olarak tasarlanmış bir haritasıdır. public_html klasörünüzde (veya site kökünde) bulunur ve arama motoru tarayıcıları için hangi sayfaların ziyaret edilmesi gerektiği, hangi sırayla ve ne sıklıkla ziyaret edilmesi gerektiği konusunda önemli talimatlar içerir.
Bu, önemli sayfaların indekslenme sürecini büyük ölçüde hızlandırır ve arama tarayıcılarının hem sizin hem de kullanıcılarınızın için yüksek öneme sahip sayfalara tarama zamanlarını ayırmalarını sağlar.
Bir sitemap.xml oluşturmak her zaman gerekli değildir ancak her zaman tavsiye edilir, özellikle binlerce sayfası olan büyük siteler için. Daha büyük sitelerle birlikte, arama motoru tarayıcılarının zamanlarını derin içerik ve ticari niyet sunan yüksek değerli sayfalarda harcama konusunda gerçekten emin olmanız gerekir, ince değer sunan yan sayfalar değil.
Bir kural olarak, yazılımlar ve CMS'ler otomatik olarak bir sitemap.xml dosyası oluşturduğunda, indeksleme için mevcut tüm sayfaları dahil eder. Tipik bir site sahibi bunun farkında olmayabilir ve belirli sayfalar için noindex ayarlamış olsa bile, otomatik olarak oluşturulan sitemap'leri muhtemelen bu sayfaları dahil ediyor ve değerli tarama bütçelerini boşa harcıyor!
Belirli URL'lerin sitemap'te gösterilmesi, belirli URL'lerin kaçınılması, URL'lerin hangi sırayla taranması ve ne sıklıkla taranması için eklentiler, özel yazılımlar veya sitemap üreticileri kullanmanız şiddetle tavsiye edilir.
Labrika tarafından bulunan sitemap hataları
Dikkat! Sitemap hata raporu, tüm web sitesini taramak için yeterli izinlerin doğru şekilde yapılandırılması durumunda yalnızca erişilebilir olacaktır. Aksi takdirde, Labrika, sitemap.xml'de listelenen belirli sayfalara bakabilecek, ancak web sitesindeki tüm sayfalara bakamayacak ve ardından bunları sitemap'te listelenen sayfalarla çapraz karşılaştırabilecektir.
Labrika sitemap analizi aşağıdaki hata türlerini bulmaya yardımcı olur:
-
Sitemap'te mevcut olan ancak indeksleme için erişilebilir olmayan sayfalar.
-
Sitemap'te mevcut olan ancak noindex etiketi bulunan sayfalar.
-
Sitemap'te mevcut olmayan ancak indekslenebilir sayfalar.
Lütfen dikkat: Farklı arama motorları sitemap kurallarını farklı şekillerde işler. Google, en sık olarak, sitemap olmadan otomatik tarama yoluyla ulaşılabilen sayfalardan fazlasını indekslemeyecektir. Yani, o gün siteniz için ayrılan tarama süresi ve tarama derinliği içinde dahili bağlantılar yoluyla ulaşılabilen sayfalar. Sitemap.xml dosyanıza bakarak hangi bağlantıları tarayacağını belirlemeyecek, bunun yerine sitemap'i sitemap'te listelenen sayfaları ne sıklıkla tarayacağına dair bir rehber olarak kullanacaktır.
Sayfa sitemap'te mevcut, ancak indeksleme için erişilebilir değil
Bu rapor, esasen sitenizde mevcut olan ancak onlara işaret eden hiçbir gelen bağlantısı olmayan ve 'sahipsiz' olan yetim sayfaları vurgular.
Böyle sayfalar arama motorları tarafından bir şekilde indekslenirse, muhtemelen sıfır PageRank'a sahip olacak ve iyi sıralamayacaktır. İnternette iyi belgelenmiştir ki, Google ve diğer büyük arama motorları, sayfaların SEO gücü ve değerini belirlemek için PageRank puanlarını (ve çeşitli formlarını) kullanır. Sadece birkaç yıl önce, sayfalarınızın PageRank'ını gösteren bir araç çubuğu kullanmanıza izin veriliyordu, ancak ne yazık ki kamuoyundan kaldırıldı. Doğal olarak, farklı sayfalarınız için iyi PageRank istiyorsunuz, bu yüzden iniş sayfalarınızdan biri bu hata kategorisinde görünüyorsa (yani sayfanız sadece bir yetim sayfa değilse), sorunu kaynağında hemen çözmek isteyeceksiniz.
Sayfanızın sitemap'te mevcut olması ancak indeksleme için erişilebilir olmaması için yaygın nedenler:
-
Noindex etiketli sayfa(lar)dan gelen bir bağlantı bu sayfaya yönlendiriyor veya bu sayfaya yönlendiren sayfalar duyarlı değil. Sonuç olarak, arama motoru tarayıcısı ileri veya geri gidemez ve oturumu sonlandırır.
-
Gerekli sayfalara bağlantılar engellenmiş. Örneğin, rel="nofollow" özelliği aracılığıyla. Yani, tarayıcı sayfaya bağlantıyı görüyor, ancak yasak olduğu için ona gidemiyor.
-
Bu sayfaya hiçbir bağlantı yok ve gerçekten 'yetim' durumda.
-
Sayfa web sitesi düzenleyicisinde/CMS'de silindi ancak HTML dosyası hala sitede canlı kalıyor.
-
Sayfa sitemap'te mevcut ancak taranabilir değil, bu yüzden indekslenemez.
Bu tür hata en iyi şekilde şu şekilde düzeltilir;
Hangi sayfaların noindex ve nofollow etiketlerine sahip olduğunu kontrol edin ve düzeltin ve/veya sayfanın doğru tarama için birincil menüye doğru şekilde eklendiğinden emin olun. Ayrıca, daha sık olarak, bu tür hatayı sayfalama engelleyen ticari ve bilgilendirici sitelerle görüyoruz.
Sorunu nasıl düzeltirsiniz?
Bir sayfa sitemap'te mevcut ancak sitedeki başka hiçbir sayfadan dahili bağlantısı olmadığında, yetim sayfa olarak bilinir.
Yetim sayfalar SEO için kötüdür çünkü bağlantı ağırlığı taşımazlar ve bu yüzden arama motorları tarafından önemsiz olarak kabul edilirler. Ayrıca daha önce siyah şapka SEO'da kullanılıyorlardı.
Panomuzda tanımlandıktan sonra şunları yapabilirsiniz:
- Sayfa yararlıysa, anahtar kelimeler için sıralıyorsa veya harici sitelerden geri bağlantıları varsa, sayfayı site bağlantı şemanıza yeniden entegre edin.
- Sitede zaten bağlantılı benzer bir neredeyse kopya sayfası varsa, sayfayı başka bir sayfayla birleştirin.
- Kullanım alanı yoksa sayfayı tamamen kaldırın. Veya 404 veya 410 (süresi dolmuş içerik) kodu döndürün.
- Ürün süresi dolmuş ürün sayfalarında, aynı kategorideki yeni ürünlere bağlantı verebilir, sayfayı yeni bir müşteri kaynağı haline getirebilirsiniz. (eBay'in süresi dolmuş açık artırma listeleriyle yaptığı şey budur). Daha fazla trafik üretmeye yardımcı olur.
Sayfa sitemap'te mevcut ancak noindex etiketi var
Bunlar, noindex etiketi kullanılarak indekslemeden yasaklanmış ancak yine de sitemap'in bir yerinde mevcut olan sayfalardır.
İnsanlar sayfaları çeşitli nedenlerle noindex yaparlar ancak sitemap'te noindex'li sayfalar olması gizli verilerin sızmasına yol açabilir ancak en muhtemel olarak, tarayıcıların zamanlarını ve tarama bütçelerini boşa harcamasına neden olur.
Bu sorunu düzeltmek için, arama motorlarının yanlışlıkla indekslememesi gereken bir sayfayı indekslememesi için (normalde noindex etiketini takip etmelerine rağmen) noindex'li sayfaları sitemap'ten kaldırmanız yeterlidir.
Sorunu nasıl düzeltirsiniz?
Bu genellikle bir sayfa rel="nofollow" özelliği aracılığıyla indekslemeden engellendiğinde oluşur.
Bu sayfaları sitemap'e dahil etmek yararlı değildir çünkü tarama bütçesi kullanır ve potansiyel olarak gizli bilgilerin sızmasına yol açabilir. Bunu düzeltmek için sayfayı sitemap'inizden basitçe kaldırabilirsiniz.
Labrika'nın hatasız sitemap.xml dosyasını indirin
Yukarıda listelenen farklı sitemap hata raporlarının her biri için, Labrika size sitemap.xml dosyanızın hatasız ve düzeltilmiş bir sürümünü indirme yeteneği sunar. Bu, kendi sitemap.xml dosyanızı manuel olarak düzeltmekten zaman kazanmanızı sağlayacak ve en önemlisi, arama motoru tarama bütçelerinizi daha iyi kullanmanızı sağlayacaktır.