Mlliyet Milliyet Blog Milliyet Blog
 
Facebook Connect
Blog Kategorileri
 

19 Kasım '07

 
Kategori
Bilişim
 

sitemap.xml dosyasının detayları

Baştan belirtmeliyim ki, sitemap.xml dosyasına sayfa URL’si, resim, hatta video adresini dahi yazabilirsiniz. Ama tabiki, bu sitenizde nekadar link varsa sitemap.xml dosyasına boca edeceğiniz anlamına gelmez. Anahtar soru şudur: Sitenizdeki içeriğin değer sıralaması nedir? Bu sıralamayı oluşturduğunuzda, o adresleri sitemape eklemeniz bu işin amacına daha çok hizmet eder çünkü ana amaç, aslında önemli olan ama bir şekilde linkine ulaşılamayan veya indekslerken zamanlama bakımından çok arka sıralarda kalan içeriği ön plana çıkartıp indekslenmesini hem garantiye almak ve hem de daha erken indekslenmelerini sağlamaktır.

Sitemape ekleyeceğiniz adreslerde seçici davranmalısınız. Mesela, robots.txt dosyasında geçen ve yasakladığınız bir adresi eklemenizin bir mantığı yoktur. Doorway pages denilen üçkağıt linkler içeren sayfaların linklerini eklemeniz, tekrarlanan içeriklerin linklerini eklemeniz kısaca trafik artırıcı birtakım üçkağıtları içeren adresleri sitemap.xml dosyasına eklemeniz ilerde Google tarafından yasaklanmanıza kadar uzanabilir. Benden söylemesi

Odaklanmanız gereken ana konu, Googlebot indeksleme robotu sitenizde geldiğinde, dinamik olarak oluşturulan içeriklerden robotun ulaşamayacaklarını sizin servis etmenizdir. Örneğin şu adresebir bakın

http://www.e-gunce.com/search.php?search=sitemaps

www.e-gunce.com üzerindeki arama kutusuna “sitemaps” yazılmış ve aranmış. Google, e-gunce.com’u indekslerken böyle bir sorguyu kendisi üretemeyeceğine göre ve eğer ilgili sayfalarında bir şekilde ulaşılabilir linki yoksa o sayfalar asla Googlebot tarafından görülemeyecek ve indekslenemeyecek. İşte Google’ın ulaşamayacağı o sayfalarımızı URL de geçen parametreleri doğru olarak ayarlayarak biz haber veririz. Bunuda sitemap ile yaparız. Mesela öyle bir sayfamız olsaydı ki adresi şöyle olsaydı

http://www.odbh.net/detay.php?id=6&cid=5&yid=0

Yukarıdaki adresin gösterdiği sayfaya id=6&cid=5&yid=0 parametrelerini vermeden erişemeyeceksek, Google da erişemeyecektir demektir. O halde sitemap.xml dosyasına yukarıdaki adresi parametreli olarak vermemiz gerekir. Sitemap.xml dosyasına 2048 karakter uzunluğuna kadar URL tanımlayabiliriz.

İşte sitemap.xml dosyasının genel yapısı ve kullanılabilecek etiket(tag)ler:



http://www.orhandogan.us/2007/11/18/sitemapxml-dosyasinin-detaylari/
2007-09-05T13:51:14+02:00
daily
0.7


http://www.orhandogan.us/2007/11/18/google-sitemap-protocolu-isin-a-b-c-si/
2007-09-05T13:51:14+02:00
daily
0.7

Bu dosya formatında , , ve elementlerinin kullanımı zorunlu değildir. Sadece URL lerin yeraldığı dosya daha geçerli olacaktır. Eğer sayfaların sadece URL sini biliyorsanız ve diğer etiketlerin işaret ettiği konularda bilginiz yokda hiç kullanmayın derim.

Bu etiketler içinde tabiki en önemlisidir onu söylemeye bile gerek yok aslında. ondan sonra ki en önemli etiket etikeditir. Bu etiketle Google’a bir sayfanın değişiklik mi geçirdiğini yoksa ilkkezmi oluşturulduğunu bildiririz. Sayfada bir değişiklik varsa ve bu ciddi bir değişiklikse bu bilgi ile Googlebot’a bildirilir. Ufak tefek değişiklikleri gözardı edebilirsiniz. Bu etiketi suistimal eder şekilde kullanılmamalıdır. Eğer bir sayafa ciddi kayda değer bir değişiklik yoksa o sayfanın değeri değiştirilmemelidir.

etiketi ile sitemap.xml de tanımladığımz adreslerin işlenme sıralamasını belirtiriz. Mesela, değişmiş ve indekslenmesi gereken 10, 000 sayfanız var. Googlebot tanımlanmış görev süresinde sizin sitenize geldiğinde eğer tek seferde 1000 adet sayfa işleyebiliyorsa sizin 10, 000 adresten 1000 tanesini seçmelidir. Peki hangi 1000 tanesi olacağına nasıl karar verecek? etiketi ile adreslere önem değeri verilir. bu değer 0.0 ile 1.0 aralığındaki ondalık sayılardır. Şu halde, yeni içerik içeren sayfaların önceliklerini yüksek vermelisiniz ki Googlebot o sayfaları daha çabuk indekslesin. İçeriği değişmeyen veya çok nadir değişen sayfaların önceliklerini bir hayli düşük tutmakta fayda var. Böyle yaptığımız taktirde yeni içerikli sayfaların indekslenmesi daha seri gerçekleşecektir.

Orhan DOĞAN
www.orhandogan.us

Related Posts

 
Toplam blog
: 4
: 865
Kayıt tarihi
: 19.11.07
 
 

Oniki yılı aşkın süredir yazılımcı olarak çalışıyorum. Birçok programlama dili ile çalıştım ancak PH..