KlavyeMonitor.com    


MENÜ

. ANASAYFA

. KABLOSUZ & TELSİZ

. AVUÇİÇİ & CEP

. LINUX

. WINDOWS

. WEB

. INTERNET

. BİLGİSAYAR

. ANTİK BİLGİ

. ARAMA

. BAĞLANTILAR
. Spam Gönderenler

POPÜLERLER

htmlders

linux kitapları

proxy adresleri kablo

sayisal loto sans topu

elmekyonlen

TDGTW-WarXing

eposta yazim kurallari

BearShare Morpheus ve iMeshi Hizlandirma Yolu

proxy-hiz

komutlar

web hosting hizmetleri

inet-hiz

linux ile windowslari uyutmak

squidle2kat

yedekleme

internet hizi

database oracle mysql sql komutlari

windows mydoom virus

PDA ve cep telefonu icin www sayfasi yapimi


= = =

Favorilere ekle
Google




Yazar İsimlerinde Geçen Harf Sıklığı ve Sık Rastlanan İsimler



Temmuz 2004

Harf ve isim frekansları çeşitli arama motoru optimizasyonlarında ve SQL sorgularını hızlandırma amacıyla veritabanı tablolarını yeniden düzenlemede kullanılabilir. Bunun yanında, içerik incelemesi ile sorgu öncelikleri belirlemede kullanılabilir. Örneğin, bir kitap arama sorgu satırında sık geçen isimlerden biri bulunuyorsa öncelikle yazarlar tablosu sorgulanarak hız kazanılabilir.


Ad ve soyadlarde yer alan harflerin yüzdeleri

Aşağıda harfler isimlerde yer alma olasılıklarına göre dizilmiş olarak yer alıyor. Örneğin her 100 isimden 84'ü 'a' harfini 74'ü de 'r' harfini içeriyor:


Harf	Yüzde
----	-----
a 	%84
r 	%74
e 	%73
n 	%66
l 	%60
i 	%60
t 	%46
h 	%46
m 	%45
d 	%42
s 	%41
o 	%39
k 	%36
y 	%35
u 	%35
ı 	%26
z 	%26
b 	%23
f 	%21
c 	%21
g 	%19
ü 	%15
v 	%15
p 	%15
ç 	%12
ş 	%10
ö 	%09
ğ 	%09
j 	%05
w 	%04
x 	%00
q 	%00

Bu harf olasılıkları listesini çıkarmak için şu bash scripti kullanılabilir:


#!/bin/bash
#
for a in a b c ç d e f g ğ h ı i j k l m n o ö p q r s ş t u ü v w x y z
do
echo -n $a" "
adet=`cat yazarlar.txt |grep -i $a|wc -l`
yuzde=`expr $adet / 148`
if [ "$yuzde" -lt "10" ];then yuzde="0$yuzde";fi
echo -e "\t%"$yuzde
done |sort -r +1 

Sık rastlanan ad veya soyadlar

Aşağıdakiler, yaklaşık 14800 yazar ad ve soyadı arasında en çok bulunanlardan 156 tanesinin listesi:


Adet Ad veya Soyad
---- -------------
0362 ali
0293 mehmet
0267 ahmet
0194 kemal
0185 mustafa
0133 ismail
0128 hüseyin
0110 osman
0110 hasan
0105 orhan
0105 ibrahim
0096 hakkı
0079 ömer
0078 ziya
0077 mehmed
0077 jean
0076 paul
0075 hikmet
0074 zeki
0074 john
0071 rıza
0070 charles
0069 halil
0063 yusuf
0062 yaşar
0062 emin
0062 abdullah
0059 süleyman
0059 ilhan
0058 mahmut
0056 faik
0056 cemal
0053 sami
0053 robert
0052 yılmaz 
0051 muzaffer
0051 george
0050 pierre
0049 tevfik
0049 muhammed
0049 metin
0048 ihsan
0048 celal
0047 william
0047 nuri
0047 faruk
0047 ekrem
0046 richard
0046 doğan
0045 james
0045 fikret
0045 arif
0045 andre
0044 sabri
0044 ismet
0044 hilmi
0044 efendi
0043 fuat
0042 şükrü
0041 necati
0041 aydın
0041 adnan
0040 tahsin
0040 refik
0040 enver
0038 şevket
0038 nihat
0037 peter
0037 oğuz
0037 mahmud
0037 haluk
0036 hans
0036 aziz
0035 turan
0035 henry
0035 cemil
0034 şerif
0034 cevdet
0033 salih
0033 sadi
0033 reşat
0033 kazım
0033 henri
0033 erdoğan
0032 murat
0032 kamil
0032 david
0031 özdemir
0031 selahattin
0031 hamdi
0031 fuad
0031 cahit
0030 yavuz
0030 hayri
0030 haydar
0030 bekir
0029 yücel
0029 thomas
0029 nazım
0029 lütfi
0029 fahri
0028 tahir
0028 suat
0028 sadık
0028 rahmi
0028 nurettin
0028 münir
0028 muammer
0028 jacques
0028 halit
0028 georges
0028 cevat
0028 cem
0028 burhan
0028 alfred
0028 abdurrahman
0027 yalçın
0026 turgut
0026 tarık
0026 sıtkı
0026 erol
0026 coşkun
0026 asım
0025 sabahattin
0025 nusret
0025 necdet
0025 naci
0025 louis
0025 herbert
0025 feridun
0025 esat
0024 ümit
0024 öztürk
0024 önder
0024 yüksel
0024 turhan
0024 talat
0024 oktay
0024 maurice
0024 kenan
0024 fethi
0024 engin
0024 abdülkadir
0023 şinasi
0023 yahya
0023 süreyya
0023 güngör
0023 general
0023 cengiz
0023 can
0023 bilge
0023 avni
0022 çetin
0022 yıldız
0022 yıldırım
0022 nejat

Yukarıdaki istatistik de şu script ile elde edilebilir:


#!/bin/bash
#
dosya="yazarlar.txt"
i=0;
ds=".ara-k"
(cat "$dosya"|\
tr , "\012"|tr A-HIJ-ZÇĞİÖŞÜ a-hıj-zçğiöşü|\
tr -d .,\"\'\;\!?|tr -t \*\#+-:\;\(\)\[\] \ \ \ \ \ \ \ \ \ \  |\
while read satir;do 
if [ "$satir" != "" ];then
set $satir
while [ "$1" != "" ];do echo "$1";shift;done
fi
done|sort;echo EOF) > "$ds"

gecici="qwerty";i=0;cat "$ds"|while read satir;do
if [ "$satir" != "$gecici" ];then
j=$i
if [ "$i" -lt "10" ];then
j="000$i"
elif [ "$i" -lt "100" ];then
j="00$i"
elif [ "$i" -lt "1000" ];then
j="0$i"
fi
echo $j" $gecici"
gecici="$satir"
i=0
fi
i=`expr $i + 1`
done|sort -r|grep -v qwerty
rm "$ds"

 

Temmuz 2004
İlker Fıçıcılar


Arama önerileri: ad, soyad, isim, harf, optimizasyon, frekans, sıklık, olasılık, veritabanı, arama, bul, bulma, sql, mysql, postgresql, monte,


Kaynak gösterecekler için referans: "İsimlerde Geçen Harf Olasılıkları", İlker Fıçıcılar, http://www.KlavyeMonitor.com/harf_ve_isim_olasiliklari.html , Temmuz 2004


İlgili Benzer Yazılar:


 
 
 
   
Bu sayfaları Linux'ta oluşturan programı yazan: İlker Fıçıcılar