13.08.08, 01:30
|
#1 (permalink)
|
Status: WEB YÖNETİCİSİ
Üyelik tarihi: Aug 2008
Bulunduğu yer: ANKARA
Mesajlar: 1,151
|
Teknik kurallar
Teknik kurallar
- Çoğu arama motoru örümceği, sitenizi Lynx'in göreceği şekilde göreceğinden sitenizi incelemek için Lynx gibi bir metin tarayıcısı kullanın. JavaScript, çerezler, oturum kimlikleri, çerçeveler, DHTML veya Flash gibi özellikler sitenizin tümünü bir metin tarayıcıda görmenizi engelliyorsa, arama motoru örümcekleri de sitenizi taramakta zorlanabilir.
- Arama botlarının sitelerinizi, site içerisindeki yollarını takip eden oturum kimlikleri veya kanıtlar olmaksızın taramasına izin verin. Bu teknikler bağımsız kullanıcı davranışını izlemek açısından faydalı olabilir, ancak robotların erişim modeli tamamıyla farklıdır. Bu tekniklerin kullanımı sitenizin dizine eklenmesinin yarım kalmasıyla sonuçlanabilir, çünkü botlar farklı gözüken ancak gerçekte aynı sayfaya işaret eden URL'leri elemekte başarısız olabilir.
- Web sunucunuzun If-Modified-Since HTTP başlığını desteklediğinden emin olun. Bu özellik, web sunucunuzun Google'a son taramadan sonra sitenizin içeriğinin değişip değişmediğini bildirmesini sağlar. Bu özelliğin desteklenmesi, size hem bant genişliğinden hem de bekleme zamanından tasarruf sağlar.
- Web sunucunuzda robots.txt dosyasını kullanın. Bu dosya tarayıcılara hangi dizinlerin taranıp hangilerinin taranmayacağını bildirir. Yanlışlıkla Googlebot tarayıcısını engellememek için bu dosyanın siteniz için güncel olduğundan emin olun. Sitenizi ziyaret ettiklerinde nasıl davranacaklarını robotlara söylemek için http://www.robotstxt.org/wc/faq.html adresini ziyaret edin. Google Web Yöneticisi Araçlarında bulunan robots.txt analiz aracı ile doğru şekilde kullandığınızdan emin olmak için robots.txt dosyanızı test edebilirsiniz.
- Şirketiniz bir içerik yönetim sistemi satın alırsa sistemin, arama motoru örümceklerinin sitenizi tarayabilmesi için içeriği dışa aktarabildiğinden emin olun.
- Arama sonucu sayfalarının veya arama motorlarından gelen kullanıcılar için pek bir değer taşımayan otomatik olarak oluşturulmuş diğer sayfaların taramaya dahil olmasını önlemek için robots.txt dosyasını kullanın.
|
|
|