Sayfa Ziyaretçilerinin Çıkış Noktaları ve Google Tekeli Endişesi
Geçen gün, hafta içinde sitelerimden
birinin ziyaretçi sayısı aniden
yarı yarıya düşünce ne olup
bittiğini araştırmaya başladım.
Sayfaların tutulduğu sunucuda
Apache log'larından 20 Mayıs
tarihli kayıtları
çekip incelemek için kullandığım
kısa linux shell komutu
ise şöyle, sizin de
işinize yarayabilir:
cat /var/log/apache/www.IlgiliWebSitesi.com-access_log|\
grep "20/May"|cut -f4 -d\"|\
grep -v -e "^http://www.IlgiliWebSitesi.com/" |\
cut -f1-3 -d/|siralagrup > /tmp/nereden_gelmisler.txt
Burada cut -f4 -d\" komutuyla Apache log'undaki referer kısmını
aldık. cut -f1-3 -d/ ile de sadece domain kısmını sıyırıp aldık. Bu
ikinci cut'ı koymazsanız tek tek hangi sayfadan ya da arama sonucundan
geldiklerini görebilirsiniz. Ama şimdilik aradığımız hangi ana kaynaktan
geldiklerini görmek.
Yukarıdaki komut satırında geçen siralagrup ise sonuçları sıklıklarına
göre sıralasın diye hazırladığım bir linux bash script. Şu aşağıdakini bir
dosyaya yazıp, /usr/local/bin veya ~/bin/ altına kaydedip
chmod 755 siralagrup diyerek çalıştırılabilir hale
getirebilirsiniz:
#!/bin/sh
#
# siralagrup - verilen satirlari frekansina gore siralar.
# ilker ficicilar
# 1999
#
i=0
we="qwerty";i=0;(cat $1|sort;echo EOF)|while read qw;do
if [ "$qw" != "$we" ];then
j=$i
if [ "$i" -lt "10" ];then
j="000$i"
elif [ "$i" -lt "100" ];then
j="00$i"
elif [ "$i" -lt "1000" ];then
j="0$i"
fi
echo $j" $we"
we="$qw"
i=0
fi
i=`expr $i + 1`
done|sort -r|grep -v qwerty
Bu bash script ve ilk satır kullanılarak elde edilen dosya ise şöyle:
3519 http://www.google.com.tr
0696 -
0213 http://www.google.com
0053 http://
0025 http://www.google.de
0023 http://64.233.183.104
0015 http://search.live.com
0013 http://search.msn.com.tr
0007 http://www.google.co.uk
0007 http://uk.f536.mail.yahoo.com
0005 http://www.google.nl
0005 http://66.102.9.104
0004 http://www.google.fr
0004 http://www.google.be
0004 http://search.babylon.com
0004 http://arama.mynet.com
0003 http://www.didikle.com
0003 http://
0003 http://www.dnsright.com
0003 http://
0003 http://search.sweetim.com
0002 http://www.whois.sc
0002 http://
0002 http://www.googlesyndicatedsearch.com
0002 http://www.google.no
0002 http://www.google.kz
0002 http://www.google.com.au
0002 http://www.google.ch
0002 http://ww.google.com.tr
0002 http://search.conduit.com
0002 http://bl130w.blu130.mail.live.com
0001 http://www.turkce-arama.com
0001 http://
0001 http://www.kurumsal.web.tr
0001 http://www.imlerim.com
0001 http://
0001 http://www.google.ru
0001 http://www.google.ro
0001 http://www.google.com.sa
0001 http://www.frmtr.com
0001 http://
0001 http://
0001 http://
0001 http://
0001 http://
Burada toplam 4646 ziyaret görülüyor (sitenin kendi içinden gelen
tıklamaları ilk komut sırasında saymamıştık). Gene bash script öğrenenler
için pratik olabilir düşüncesiyle 4646 sayısını nasıl bulduğumuzu
yazarsak:
cat /tmp/nereden_gelmisler.txt|cut -f1 -d\ |while read qw;\
do we=`expr $we + $qw`;echo $we;done|tail -1
Bu arada yukarıdaki listede arama motoru olmayan sonuçların domainlerini
silip sadece http:// kısmını bıraktım. 64.233.183.104 gibi sayı
biçimindekiler ise host 64.233.183.104
diyerek görülebileceği gibi gene
Google'a ait. Sadece - olan satır ise sitenin ismini doğrudan yazarak
gelenleri gösteriyor.
Evet şimdi bu 4646 ziyaretin kaçı google'dan bakalım:
cat /tmp/nereden_gelmisler.txt|grep -i google|cut -f1 -d\ |\
while read qw;do we=`expr $we + $qw`;echo $we;done|tail -1
3792!... 4646 ziyaretin 3792'si Google araması ile geliyor!
%81.6'sı!... Bu oldukça sıkıntı yaratacak bir durum. Sitenizin kaderi
kontrol edemeyeceğiniz şekilde bir başkasının elinde. Google
algoritmalarıyla oynadıkça sitenizi hallaç pamuğu gibi oradan oraya
atabilir. Özellikle siteniz ticari bir site ise bunu istemezsiniz. Peki ya
en kötü senaryo olarak, Google ticari sitenizi bir anda veritabanından
çıkarırsa? Müşterilerinizin %80 küsurunu kaybetmenin etkisi ile başa
çıkabilecek misiniz?
İyimserlikle, bir şey olmaz demekle başarıya ulaşmak mümkün olmuyor
mâlum. Pareto analizi ile de uyuşan bu %80 sorunundan, Google tekelinden
bir biçimde kurtulmamız gerekli.
Çözüm aramak için rakamları incelemeye devam edelim: İkinci en büyük
ziyaret "-"'den yani site adını doğrudan tarayıcıya elle girenlerden ya da
favorilerinden tıklayanlardan geliyor: 696 kişi, yani %15. Bu da Pareto ile
uyumlu. İlk yüzde 80'den kalan %20'nin %80'ine, yani %16'ya oldukça yakın.
Fakat keşke yer değiştirseler, gelenlerin %80'i siteye elle yazarak,
favorilerinden ya da masaüstü ikonlarından tıklayarak gelse. Marka
bilinirliği denen kavrama daha çok önem vermemiz gerektiği, en azından kısa
ve/veya akılda kalıcı bir domain adı seçmemiz gerektiği ortada.
İkinci olarak insanlar Google dışındaki arama motorlarını çok daha yoğun
kullanmalı. Belki bu, o rakip arama motorlarının problemi. Ama anımsıyorum da
on yıl kadar önce her yerde NetBul'un reklamı vardı; otobüs duraklarında
vs.. Ondan önce de list2000 diye bir firma Türkiye'nin Yahoo'su olma
vaadiyle TV programından TV programına koşturuyordu, ekonomi dergilerine
demeçler veriyordu... Bizden bu iki firmanın yukarıdaki listede
görülmemesinden geçtim, MSN Live Search bile var ile yok arasında: sadece 26
arama; binde 5.6, %0.56. 'Google'ın en büyük rakibi Microsoft dahi %1'i
bulamıyorsa diğerleri ne yapsın' denilebilir.
Sanıyorum burada asıl yük biz internet kullanıcılarına düşüyor.
Alışkanlıklarımızı olabildiğince değiştirip diğer arama motorlarına
yönelmemizde, internete yeni başlayanlara hemen Google'ı değil yerli yabancı
diğerlerini öğretmekte oldukça yarar var. Bu davranış biraz 'Davut Golyat'a
karşı' gibi oldu, ama uzun vadede sağlıklı bir internet için tekellerin önüne
geçmekte saymakla bitmez faydalar var.
İlker Fıçıcılar
23 Mayıs 2008
Arama önerileri:
google,
arama motorları,
arama motoru,
alternatif arama motorları,
Türkçe arama motoru,
internette arama,
linux bash script,
Kaynak gösterecekler için referans:
"Sayfa Ziyaretçilerinin Çıkış Noktaları ve Google Tekeli Endişesi",
İlker Fıçıcılar,
http://www.KlavyeMonitor.com/sayfa_ziyaretci_kaynaklari_ve_google_tekeli_endisesi.html
, Mayıs 2008
İlgili Benzer Yazılar:
|