İÇİNDEKİLER
İçindekiler
İçindekiler 7
Önsöz 11
Bölüm 1 GİRİŞ 13
1.1. TANIM 13
1.2. KULLANIM ALANLARI 15
1.3. KULLANILAN YÖNTEMLER 17
1.3.1. Özellik seçim 17
1.3.2. Sınıflandırma 18
1.3.3. Birliktelik 18
1.3.4. Kümeleme 18
SORULAR 19
Bölüm 2 ÖZELLİK SEÇİM YÖNTEMLERİ 21
2.1. RELIEF 23
2.2. Kİ–KARE 24
2.3. ERGS 29
2.3.1. Etkin aralıkların hesaplanması 29
2.3.2. Algoritma 30
2.4. IFSER 31
SORULAR 32
Bölüm 3 SINIFLANDIRMA YÖNTEMLERİ 35
3.1. KARAR AĞACI ALGORİTMALARI 35
3.1.1. ID3 Algoritması 38
3.1.2. C4.5 (J48) Algoritması 50
3.1.3. CART Algoritması 59
3.1.4. CHAID Algoritması 92
3.1.4.1. Ki–kare istatistiğinin hesaplanması 93
3.1.5. Karar Ağacının Budanması 102
3.2. KURAL TEMELLİ ALGORİTMALAR 110
3.2.1. ZeroR Yöntemi 110
3.2.2. OneR Yöntemi 112
3.3. BAYES SINIFLANDIRMA 119
3.4. k KOMŞU YÖNTEMİ 127
3.5. SINIFLANDIRMA KALİTESİNİN ÖLÇÜMÜ 130
3.5.1. Veride Ayrıştırma 131
3.5.1.1. Yüzdesel Bölme (Percentile Split) 131
3.5.1.2. n–Bölme (n–fold) 131
3.5.1.3. Tekrarlı n–Bölme (Repeated n–fold) 132
3.5.1.4. 1 Eksiltme (Leave–one–out) 132
3.5.2. Sınıflandırma Kalitesine İlişkin Ölçüler 135
SORULAR 138
Bölüm 4 BİRLİKTELİK KURALLARI 141
4.1. APRIORI ALGORİTMASI 141
2.1.1. Destek (support) 142
2.1.2. Güven (confidence) 143
2.1.3. Kaldıraç (lift) 143
4.2. AYIRMA ALGORİTMASI 151
SORULAR 153
Bölüm 5 KÜMELEME YÖNTEMLERİ 155
5.1. TANIMLAR 156
5.1.1. Centroid 156
5.1.2. Medoid 156
5.1.3. Radius 156
5.1.4. Diameter 156
5.2. UZAKLIK ÖLÇÜLERİ 161
5.2.1. Gözlemler arasındaki uzaklıkların hesaplanması 161
5.2.2. Kümeler arasındaki uzaklıkların hesaplanması 164
5.3. BÖLÜNMELİ KÜMELEME YÖNTEMLERİ 167
4.3.1. k–Ortalama 167
4.3.2. k–Medoid 170
5.4. HİYERARŞİK KÜMELEME YÖNTEMLERİ 173
5.4.1. Birleştirici hiyerarşik kümeleme (AGNES) 173
5.4.2. Ayrıştırıcı hiyerarşik kümeleme (DIANA) 178
5.5. YOĞUNLUK TABANLI KÜMELEME YÖNTEMLERİ 185
5.5.1. DBSCAN 185
5.6. KÜMELEME KALİTESİNİN ÖLÇÜMÜ 191
5.6.1. Dışsal (External) Ölçüler 192
5.6.1.1. Saflık (Purity) ölçüsü 194
5.6.1.2. F–ölçüsü 194
5.6.1.3. Koşullu entropi 197
5.6.1.4. Karşılıklı bilgi ölçüsü 198
5.6.1.5. Bilgi değişimi ölçüsü 198
5.6.2. İçsel (Internal) Ölçüler 203
5.6.2.1. BetaCV ölçüsü 206
5.6.2.2. C–indeksi 207
5.6.3. Göreli (Relative) Ölçüler 209
5.6.3.1. Calinski–Harabasz indeksi 209
SORULAR 213
Bölüm 6 İKİLİ KÜMELEME (BICLUSTERING) 215
6.1. GİRİŞ 215
6.1.1. İkili Küme Türleri 217
6.1.2. İkili Kümelerin Yapıları 218
6.2. CC ALGORİTMASI 219
6.2.1. Kümeleme sonuçlarının incelenmesi 229
6.3. GEN VERİLERİ 232
Bölüm 7 R: TEMEL BİLGİLER 235
7.1. TEMEL ARİTMETİK İŞLEMLER 237
7.2. VEKTÖRLER VE MATRİSLER 238
7.3. TEMEL İSTATİSTİKSEL ANALİZLER 244
7.4. TEMEL GRAFİK İŞLEMLERİ 247
Kaynaklar 249
Kavram Dizini 253 |