İÇİNDEKİLER
İçindekiler
Önsöz 7
1. Bölüm
YAPAY SİNİR AĞLARINA GİRİŞ
1. YAPAY ZEKA GİRİŞ 29
1.1. Akıl 29
Aklın Özellikleri 29
1.2. Zeka 30
Zekanın Özellikleri 30
1.3. Akıl ve Zeka’nın Karşılaştırılması 30
1.4. Yapay Zeka 32
1.4.1. Yapay Zeka’nın Alt Dalları 33
1.4.1.1. Makine Öğrenmesi 34
1.4.1.2. Yapay Sinir Ağları 34
1.4.1.3. Derin Öğrenme 35
1.4.1.4. Doğal Dil İşleme 35
1.4.1.5. Bilgisayarla Görme 36
1.4.1.6. Robotik 36
1.4.1.7. Bulanık Mantık 36
1.4.1.8. Uzman Sistemler 37
1.4.1.9. Genetik Algoritma 38
1.4.2. Yapay Zekanın Özellikleri 38
1.4.2.1. Öğrenme Yeteneği 39
1.4.2.2. Uyarlanabilirlik 39
1.4.2.3. Veri İşleme ve Analiz Yeteneği 39
1.4.2.4. Karar Verme Kabiliyeti 39
1.4.2.5. Doğal Dil İşleme 39
1.4.2.6. Tahmin ve Öngörü Yeteneği 40
1.4.2.7. Otonom (Özerk) Çalışabilme 40
1.4.2.8. Yaratıcılık 40
1.4.2.9. Hız ve Verimlilik 40
1.4.2.10. Mantık Yürütme 40
1.4.2.11. Paralel İşlem Yapabilme 41
1.4.2.12. Genelleme Yeteneği 41
1.4.2.13. Örüntü Tanıma 41
1.4.2.14. Belirsizlikle Başa Çıkabilme 41
1.4.2.15. Sürekli İyileşme 41
1.4.3. Yapay Zeka Uygulamaları: Alanlar ve Örnekler 41
1.4.3.1. Doğal Dil İşleme ve Çeviri Sistemleri 41
1.4.3.2. Görüntü İşleme ve Bilgisayarla Görme 42
1.4.3.3. Tavsiye Sistemleri 43
1.4.3.4. Oyun ve Eğlence Sektöründe Yapay Zeka 43
1.4.3.5. Otonom Araç Teknolojileri 44
1.4.3.6. Robotik Uygulamalar 44
1.4.3.7. Endüstriyel Otomasyon 45
1.4.3.8. Finansal Teknolojiler ve Dolandırıcılık Tespiti 45
1.4.3.9. Sağlık ve İlaç Sektörü 45
1.4.3.10. Eğitim Uygulamaları 46
1.4.3.11. Karar Destek Sistemleri 47
1.4.3.12. Güvenlik Uygulamaları 47
1.4.3.13. Görsel Sanat ve Yaratıcı Uygulamalar 48
1.4.3.14. Biyoinformatik Uygulamaları 48
2. Bölüm
YAPAY SİNİR AĞLARININ TEMELLERİ
2. YAPAY SİNİR AĞLARININ TEMELLERİ 53
2.1. Yapay Sinir Ağlarına Giriş 53
2.1.1. Yapay Sinir Ağlarının Tarihçesi 55
19. ve 20. Yüzyılın Başları: Biyolojik Mekanizmaların Keşfi 55
1943: İlk Yapay Sinir Ağ Modeli – McCulloch ve Pitts'in Çalışmaları 55
1948–1949: Wiener ve Hebb'in Çalışmaları 55
1950'ler: IBM Çalışmaları ve Rosenblatt'ın Algılayıcısı 56
1959: Widrow ve Hoff'un ADALINE ve MADALINE Modelleri 56
1969: Algılayıcının Sınırlamaları ve XOR Problemi 56
1980'ler: Hopfield, Kohonen, Rumelhart ve Hinton'in Katkıları 56
2000'ler ve Sonrası: Derin Öğrenme Dönemi 57
Günümüz ve Gelecek Vizyonu 58
2.2. İnsan Beyni ve Biyolojik Bir Sinirin Yapısı 58
2.2.1. Biyolojik Bir Sinirin Yapısı 60
2.3. Bir Yapay Sinirin Ana Öğeleri 62
2.3.1. Girişler 63
2.3.2. Ağırlıklar 63
2.3.3. Toplama İşlevi 63
2.3.4. Etkinlik İşlevi 63
2.3.4.1. İkili Basamak Etkinlik İşlevi 64
1. Uygulama Alanları 65
2. Üstünlükler ve Eksiklikler 65
2.3.4.2. Doğrusal Etkinlik İşlevi 66
1. Uygulama Alanları 66
2. Üstünlükler ve Eksiklikler 67
2.3.4.3. Sigmoid İşlevi 68
1. Uygulama Alanları 69
2. Üstünlükler ve Eksiklikler 69
2.3.4.4. Hiperbolik Tanjant (Tanh) İşlevi 70
1. Uygulama Alanları 72
2. Üstünlükler ve Eksiklikler 72
2.3.4.5. Düzeltmeli Doğrusal Birim–ReLU İşlevi 73
1. Uygulama Alanları 75
2. Üstünlükler ve Eksiklikler 75
2.3.4.6. Softmax İşlevi 76
1. Uygulama Alanları 77
2. Üstünlükler ve Eksiklikler 77
2.3.4.7. SoftPlus işlevi 78
1. Uygulama Alanları 80
2. Üstünlükler ve Eksiklikler 81
2.3.4.8. Etkinlik İşlevinin Seçim Ölçütleri 81
1. Problem Türü 81
2. Ağ Mimarisi 82
3. Performans Ölçütleri 82
4. Özel Özellikler 83
5. Hesaplama Maliyeti 83
2.3.4.9. Farklı Etkinlik İşlevlerinin Performans Değerlendirmesi 83
1. Model Tasarımı 84
2. Eğitim Süreci 84
3. Değerlendirme 84
4. Genelleme Yeteneği 85
2.3.5. Ölçekleme ve Sınırlama 85
2.3.5.1. Ölçekleme 85
2.3.5.2. Sınırlama 86
2.3.5.3. Ölçekleme ve Sınırlamanın Birlikte Kullanımı 86
2.3.5.4. Yapay Sinir Ağlarında Ölçekleme ve Sınırlamanın Uygulama Alanları 87
2.3.6. Çıkış İşlevi 87
2.3.7. Öğrenme 87
2.3.7.1. Öğrenme Kuralının Kavranması 89
2.4. Algılayıcı (Perceptron) 90
2.4.1. Turing Makinesi ve Algılayıcı 90
2.5. Bir Yapay Sinir Ağı 93
2.5.1. Dağıtılmış Bellek 94
2.5.2. Birleştirilmiş Bellek 95
2.5.3. Sayısal Bilgisayarlar ve Yapay Sinir Ağlarının Karşılaştırılması 95
2.6. Çok Katmanlı Bir Yapay Sinir Ağı 96
2.6.1. Katmanlar 97
2.6.2. Sinirler ve Katmanlar Arası Bağlantılar 98
2.6.2.1. Tam Bağlantılı (Fully Connected / Dense) 98
2.6.2.2. Evrişimli (Convolutional) 98
2.6.2.3. Tekrarlayan (Recurrent) 98
2.6.2.4. Atlamalı Bağlantı (Skip Connection / Residual Connection) 99
2.6.2.5. Birleştirme (Pooling / Subsampling) 99
2.7. Öğrenme Uygulama Örnekleri 99
2.7.1. Delta Öğrenme Kuralı 99
2.7.1.1. Delta Kuralı Kullanılarak Yapılan Bir Örnek 103
2.7.2. Pekiştirmeli Öğrenme 109
2.7.2.1. Pekiştirmeli Öğrenme Kullanılarak Yapılan Bir Örnek 110
2.7.2.2. Algoritma 110
2.7.2.3. Sınırlamalar ve Uygulamalar 112
2.7.2.4. Sınıflama 113
2.7.2.5. Benzerlik 114
2.8. Yapay Sinir Ağlarının Üstünlükleri ve Eksiklikleri 115
3. Bölüm
YAPAY SİNİR AĞLARININ MİMARİ YAPILARI
3. YAPAY SİNİR AĞLARININ MİMARİ YAPILARI 119
3.1. Geri Yayılım Ağı 119
3.1.1. Geri Yayılım Ağı'nın Çalışma Prensibi 121
3.1.2. Matematiksel Model 123
3.1.3. Geri Yayılım Kuralı Kullanılarak Yapılan Bir Örnek 124
3.1.4. Geri Yayılım Algoritması 130
3.1.5. Geri Yayılım Etkinlik (Aktarım) İşlevleri 131
3.1.6. Öğrenme Oranının Ağ Üzerindeki Etkisi 133
3.1.7. Momentum Teriminin Ağ Üzerindeki Etkisi 133
3.1.8. Gizli Katman Sinir Sayısının Ağ Üzerindeki Etkisi 134
3.1.9. Hata Farkı Değişkeninin Ağ Üzerindeki Etkisi 134
3.1.10. Geri Yayılım Ağı'nın Üstünlükleri ve Eksiklikleri 134
3.2. Hopfield ağı 134
3.2.1. Çalışma Prensibi 136
3.2.2. Matematiksel Model 136
3.2.2.1. Ağırlık Matrisi 136
3.2.2.2. Enerji Fonksiyonu 137
3.2.2.3. Etkinlik Güncelleme Kuralı 137
3.2.3. Hopfield Ağı ile Örüntü Tanıma Uygulama Örneği 138
3.2.3.1. Adım 1: Örüntülerin Tanımlanması 138
3.2.3.2. Adım 2: Ağırlık Matrisinin Hesaplanması 138
3.2.3.3. Adım 3: Ağa Yeni Girdi Sağlanması 139
3.2.4. Hopfield Sinir Ağı’nın Üstünlükleri ve Eksiklikleri 139
3.3. Boltzman Makinesi 140
3.3.1. Çalışma Prensibi 141
3.3.2. Matematiksel Model 141
3.3.2.1. Enerji Fonksiyonu 141
3.3.2.2. Olasılık Dağılımı 142
3.3.2.3. Öğrenme ve Güncelleme 142
3.3.3. Boltzmann Makinesi ile Örnek Bir Uygulama 143
3.3.3.1. Film Tavsiyesi 143
3.3.3.2. Boltzmann Makinesi ile Çözüm 143
1. Verilerin Hazırlanması 143
2. Modelleme 143
3. Eğitim 144
4. Öneri Tahmini 144
5. Test ve Performans Analizi 144
3.3.4. Boltzmann Makinesi’nin Üstünlükleri ve Eksiklikleri 144
3.4. Özörgütlemeli Harita Ağı 145
3.4.1. Kohonen ağı 147
3.4.2. Özörgütlemeli Haritanın Algoritması 148
3.4.3. Özörgütlemeli Harita Örneği 150
3.4.4. Özörgütlemeli Haritanın Eğitim Aşaması 150
3.4.5. Özörgütlemeli Haritanın Çağırma Aşaması 154
3.4.6. Özörgütlemeli Harita Ağı Örnek Uygulaması: Müşteri Segmentasyonu 155
3.4.7. Özörgütlemeli Harita Ağı’nın Üstünlükleri ve Eksiklikleri 157
4. Bölüm
MAKİNE ÖĞRENMESİ
4. MAKİNE ÖĞRENMESİ 163
4.1. Makine Öğrenmesinin süreç Adımları 163
4.1.1. Veri Kümesi 163
4.1.2. Model Seçimi 164
4.1.3. Model Eğitimi 164
4.1.3.1. Makine Öğrenmesinde Eğitim İle İlgili Kavramlar 166
1. İnce Ayar 166
2. Kayıp Fonksiyonu 166
3. Token 167
Token Türleri 167
Tokenizasyon 168
4. Değişken 169
Değişken Türleri 169
Değişkenlerin Model Eğitimindeki Rolü 170
Token ve Değişken Arasındaki Farklar 171
4.1.3.2. Eğitim Sonucu Verinin Öğrenilmesi 172
1. Doğru Öğrenme 172
2. Yetersiz Öğrenme 173
Yetersiz Öğrenmenin Nedenleri 174
Yetersiz Öğrenmenin Sonuçları 175
Yetersiz Öğrenmenin Önlenmesi İçin Stratejiler 175
Örnek Uygulama 176
3. Aşırı Öğrenme 176
Aşırı Öğrenmenin Nedenleri 177
Aşırı Öğrenmenin Belirtileri 178
Aşırı Öğrenmenin Etkileri 178
4.1.4. Doğrulama 178
4.1.4.1. Aşırı Öğrenmenin Tespit Yöntemleri 179
4.1.4.2. Aşırı Öğrenmeyi Önleme Yöntemleri 179
4.1.4.1. Değerlendirme Teknikleri 180
4.2. Makine Öğrenmesi Modelleri ve Eğitim Türleri 180
4.3. Gözetimli Öğrenme 181
4.3.1. Regresyon 182
4.3.1.1. Doğrusal Regresyon 183
1. Temel Kavramlar 183
2. Çalışma Prensibi 184
3. Matematiksel Model 185
4. Temel Adımlar 186
5. Üstünlükler ve Eksiklikler 187
6. Uygulama Alanları 187
4.3.1.2. Çokterimli Regresyon 188
1. Temel Kavramlar 188
2. Çalışma Prensibi 189
3. Matematiksel Model 190
4. Temel Adımları 190
5. Üstünlükler ve Eksiklikler 191
6. Uygulama Alanları 191
4.3.1.3. Lasso Regresyon 192
1. Temel Kavramlar 192
2. Çalışma Prensibi 192
3. Matematiksel Model 193
5. Üstünlükler ve Eksiklikler 194
6. Uygulama Alanları 195
4.3.1.4. Destek Vektör Regresyonu 196
1. Temel Kavramlar 196
2. Çalışma Prensibi 196
3. Matematiksel Model 197
4. Temel Adımları 197
5. Üstünlükler ve Eksiklikler 198
6. Uygulama Alanları 199
4.3.1.5. Karar Ağaçları Regresyonu 199
1. Temel Kavramlar 199
2. Çalışma Prensibi 200
3. Matematiksel Model 201
4. Temel Adımlar 201
5. Üstünlükler ve Eksiklikler 202
6. Uygulama Alanları 202
4.3.1.6. Değişim Artırma Regresyonu 203
1. Temel Kavramlar 203
2. Çalışma Prensibi 203
3. Matematiksel Model 204
4. Temel Adımlar 205
5. Üstünlükler ve Eksiklikler 205
6. Uygulama Alanları 206
4.3.2. Sınıflandırma 206
4.3.2.1. Lojistik Regresyon 206
1. Temel Kavramlar 207
2. Çalışma Prensibi 207
3. Matematiksel Model 209
4. Temel Adımlar 210
5. Üstünlükler ve Eksiklikler 210
6. Uygulama Alanları 211
4.3.2.2. k–En Yakın Komşular 211
1. Temel Kavramlar 212
2. Çalışma Prensibi 212
3. Matematiksel Model 214
4. Temel Adımlar 214
5. Üstünlükler ve Eksiklikler 214
6. Uygulama Alanları 215
4.3.2.3. Naive Bayes 216
1. Temel Kavramlar 216
2. Çalışma Prensibi 216
3. Matematiksel Model 216
4. Temel Adımlar 217
5. Üstünlükler ve Eksiklikler 217
6. Uygulama Alanları 218
4.3.2.4. Destek Vektör Makineleri 219
1. Temel Kavramlar 222
2. Çalışma Prensibi 223
3. Matematiksel Model 224
4. Temel Adımlar 224
5. Üstünlükler ve Eksiklikler 225
6. Uygulama Alanları 225
4.3.2.5. Karar Ağaçları 226
1. Temel Kavramlar 226
2. Çalışma Prensibi 226
3. Matematiksel Model 228
4. Temel Adımlar 229
5. Üstünlükler ve Eksiklikler 229
6. Uygulama Alanları 230
4.3.2.6. Değişim Artırma 230
1. Temel Kavramlar 231
2. Çalışma Prensibi 231
3. Matematiksel Model 232
4. Temel Adımlar 232
5. Üstünlükler ve Eksiklikler 233
6. Uygulama Alanları 234
Popüler Gradient Boosting Kütüphaneleri 234
4.4. Gözetimsiz Öğrenme 234
4.4.1. Kümeleme 235
4.4.1.1. k–Means Kümeleme 236
1. Temel Kavramlar 236
2. Çalışma Prensibi 236
3. Matematiksel Model 237
4. Temel Adımlar 238
5. Üstünlükler ve Eksiklikler 238
6. Uygulama Alanları 239
4.4.1.2. Gaussian Karışım Modelleri 239
1. Temel Kavramlar 240
2. Çalışma Prensibi 240
3. Matematiksel Model 241
4. Temel Adımlar 241
5. Üstünlükler ve Eksiklikler 242
6. Uygulama Alanları 243
4.4.1.3. Hiyerarşik kümeleme 243
1. Temel Kavramlar 243
2. Çalışma Prensibi 244
3. Matematiksel Model 245
4. Temel Adımlar 245
5. Üstünlükler ve Eksiklikler 246
6. Uygulama Alanları 246
4.4.1.4. Gürültülü Uygulamaların Yoğunluk Tabanlı Mekansal Kümelenmesi 247
1. Temel Kavramlar 247
2. Çalışma Prensibi 247
3. Matematiksel Model 248
4. Temel Adımlar 248
5. Üstünlükler ve Eksiklikler 249
6. Uygulama Alanları 249
4.4.2. Boyut İndirgeme 250
4.4.2.1. Temel Bileşen Analizi 250
1. Temel Kavramlar 250
2. Çalışma Prensibi 251
3. Matematiksel Model 251
4. Temel Adımlar 252
5. Üstünlükler ve Eksiklikler 253
6. Uygulama Alanları 253
4.4.2.2. t–Dağıtılmış Stokastik Komşu Gömme 254
1. Temel Kavramlar 254
2. Çalışma Prensibi 254
3. Matematiksel Model 255
4. Temel Adımlar 256
5. Üstünlükler ve Eksiklikler 256
6. Uygulama Alanları 257
4.4.2.3. Doğrusal Ayrım Analizi 257
1. Temel Kavramlar 257
2. Çalışma Prensibi 258
3. Matematiksel Model 258
4. Temel Adımlar 259
5. Üstünlükler ve Eksiklikler 259
6. Uygulama Alanları 260
4.4.2.4. Bağımsız Bileşen Analizi 260
1. Temel Kavramlar 261
2. Çalışma Prensibi 261
3. Matematiksel Model 261
4. Temel Adımlar 262
5. Üstünlükler ve Eksiklikler 262
6. Uygulama Alanları 263
4.4.2.5. Düzgün Çokkatlı Yaklaşım ve Projeksiyon 264
1. Temel Kavramlar 264
2. Çalışma Prensibi 264
3. Matematiksel Model 265
4. Temel Adımlar 265
5. Üstünlükler ve Eksiklikler 266
6. Uygulama Alanları 267
4.5. Pekiştirmeli Öğrenme 267
4.5.1. Modelden Bağımsız Yöntemler 268
4.5.1.1. Q–Öğrenme 268
1. Temel Kavramlar 269
2. Çalışma Prensibi 269
3. Matematiksel Model 270
4. Temel Adımlar 271
5. Üstünlükler ve Eksiklikler 271
6. Uygulama Alanları 272
4.5.1.2. Derin Q–Ağı 272
1. Temel Kavramlar 273
2. Çalışma Prensibi 273
3. Matematiksel Model 274
4. Temel Adımlar 274
5. Üstünlükler ve Eksiklikler 275
6. Uygulama Alanları 275
4.5.2. Model Temelli Yöntemler 276
4.5.2.1. Derin Deterministik Politika Gradyanı 276
1. Temel Kavramlar 276
2. Çalışma Prensibi 276
3. Matematiksel Model 277
4. Temel Adımlar 277
5. Üstünlükler ve Eksiklikler 278
6. Uygulama Alanları 278
4.5.2.2. Yakınsal Politika Optimizasyonu 279
1. Temel Kavramlar 279
2. Çalışma Prensibi 280
3. Matematiksel Model 280
4. Temel Adımlar 281
5. Üstünlükler ve Eksiklikler 281
6. Uygulama Alanları 281
4.6. Topluluk Öğrenmesi 282
4.6.1. Bagging 283
1. Temel Kavramlar 283
2. Çalışma Prensibi 283
3. Matematiksel Model 284
4. Temel Adımlar 285
5. Üstünlükler ve Eksiklikler 285
6. Uygulama Alanları 286
4.6.1.1. Bagging Örneği Rastgele Orman 286
1. Temel Kavramlar 286
2. Çalışma Prensibi 287
3. Matematiksel Model 289
4. Temel Adımlar 289
5. Üstünlükler ve Eksiklikler 289
6. Uygulama Alanları 290
4.6.2. Boosting 290
1. Temel Kavramlar 291
2. Çalışma Prensibi 291
3. Matematiksel Model 292
4. Temel Adımlar 293
5. Üstünlükler ve Eksiklikler 293
6. Uygulama Alanları 294
4.6.3. Stacking Yöntemi 294
1. Temel Kavramlar 295
2. Çalışma Prensibi 295
3. Matematiksel Model 295
4. Temel Adımlar 296
5. Üstünlükler ve Eksiklikler 296
6. Uygulama Alanları 297
5. Bölüm
DERİN ÖĞRENME
5. DERİN ÖĞRENME 301
5.1. Derin Sinir Ağ Mimarileri ve Kullanım Alanları 303
5.2. Sayısal Görüntü İşleme 305
5.2.1. Analog Görüntü 306
5.2.2. Sayısal Görüntü 306
5.2.2.1. Siyah–Beyaz Görüntü 308
5.2.2.2. Gri Seviyeli Görüntü 308
5.2.2.3. Renkli Görüntü 308
5.3. Derin Ağlarda Kullanılan Veri Kümeleri 309
5.3.1. Görsel Veriler (Resim ve Video Kümeleri) İçin 309
5.3.1.1. MNIST 309
5.3.1.2. CIFAR–10 / CIFAR–100 309
5.3.1.3. ImageNet 310
5.3.1.4. COCO (Common Objects in Context) 310
5.3.1.5. Pascal VOC 310
5.3.1.6. CelebA 310
5.3.2. Metinsel Veriler (Doğal Dil İşleme Kümeleri) İçin 311
5.3.2.1. IMDB Review Dataset 311
5.3.2.2. AG News 311
5.3.2.3. SQuAD (Stanford Question Answering Dataset) 311
5.3.2.4. GLUE ve SuperGLUE 311
5.3.2.5. WikiText 312
5.3.3. Ses (Audio) ve Konuşma Verileri İçin 312
5.3.3.1. LibriSpeech 312
5.3.3.2. VoxCeleb 312
5.3.3.3. Common Voice 312
5.3.4. Çoklu Modalite Kümeleri (Görsel + Metin, Görsel + Ses vb.) İçin 313
5.3.4.1. VQA (Visual Question Answering) 313
5.3.4.2. LRS (Lip Reading Sentences) 313
5.3.4.3. MSR–VTT 313
5.3.5. Özel Uygulama Alanları İçin 313
5.3.5.1. Cityscapes 313
5.3.5.2. Medical Decathlon 314
5.3.5.3. LFW (Labeled Faces in the Wild) 314
5.3.5.4. Kaggle ve Özelleşmiş Kümeler 314
5.3.6. Veri Kümesi Seçim Kriterleri 314
5.4. Derin Öğrenme Kütüphaneleri 315
5.4.1. Temel Derin Öğrenme Kütüphaneleri 315
5.4.1.1. TensorFlow 315
5.4.1.2. PyTorch 315
5.4.1.3. Keras 316
5.4.2. Özelleşmiş Kütüphaneler 316
5.4.2.1. Hugging Face Transformers 316
5.4.2.2.OpenCV 317
5.4.2.3.Detectron2 317
5.4.3. Yüksek Performans ve Araştırma Odaklı Kütüphaneler 318
5.4.3.1. JAX 318
5.4.3.2. FastAI 318
5.4.4. Model Dağıtımı ve Optimizasyon 319
5.4.4.1. ONNX (Open Neural Network Exchange) 319
5.4.4.2. TensorRT 319
5.4.5. Bulut ve Platform Entegrasyonları 319
5.4.5.1. Amazon SageMaker 319
5.4.5.2. Google Colab 320
5.4.5.3. Azure Machine Learning 320
5.4.6. Özel Donanım ve Accelerator Desteği 320
5.4.6.1. CUDA ve cuDNN 320
5.4.6.2. TPU (Tensor Processing Unit) 320
5.4.7. Kütüphane Seçim Kriterleri 321
5.4.7.1. Yeni Başlayanlar İçin 321
5.4.7.2. Araştırmacılar İçin 321
5.4.7.3. Prodüksiyon İçin 321
5.5. Derin Ağlarda kullanılan Programlama Dilleri 321
5.5.1. Python 321
5.5.2. C++ 322
5.5.3. CUDA 323
5.5.4. JavaScript 324
5.5.5. Julia 324
5.5.6. R 325
5.5.7. Dil Seçimi Tavsiyesi 325
6. Bölüm
EVRİŞİMLİ SİNİR AĞLARI
6. EVRİŞİMLİ SİNİR AĞLARI 329
6.1. Evrişim 329
6.2. Bir Boyutlu Görüntülerde Evrişim İşlemi 329
6.3. Üç Boyutlu Görüntülerde Evrişim İşlemi 333
6.3.1. Evrişim İşleminin Görüntülere Etkisi 335
6.3.2. Sıfır Dolgu 337
6.4. Havuzlama (Pooling) 337
6.4.1. Evrişim ve Havuzlama Hesaplamaları 340
6.4.1.1. İlk Evrişim Katmanının Boyutlarının Hesaplanması 340
6.4.1.2. Evrişim Katmanının Boyutlarının Hesaplanması 341
6.4.1.3. Havuzlama Katmanının Boyutlarının Hesaplanması 342
6.5. Etkinlik İşlevleri 343
6.6. Katman ve Bağlantılar 345
6.7. Evrişimli Sinir Ağının Eğitimi 346
6.8. Düzenlileştirme (Regularization) 346
6.9. Seyreltme 347
6.10. Yapay Sinir Ağları İle Karakter Algılama 348
6.11. Evrişimli Sinir Ağları İle Karakter Algılama 350
7. Bölüm
EVRİŞİMLİ SİNİR AĞ MİMARİLERİ
7. EVRİŞİMLİ SİNİR AĞ MİMARİLERİ 355
7.1. LeNet 355
7.2. AlexNet 356
7.3. ZF Net 358
7.4. GoogLeNet 359
7.5. VGGNet 364
7.6. Microsoft ResNet 366
7.7. Kapsül Ağları (Capsule Network) 369
7.8. Üretken Çekişmeli Ağlar 377
8. Bölüm
OTOKODLAYICI AĞLARI
8. OTOKODLAYICI AĞLARI 381
8.1. Yığınlanmış Otokodlayıcı 383
8.2. Yığınlanmış Gürültülü Otokodlayıcı 383
8.3. Otokodlayıcının Eğitimi 384
8.4. Otokodlayıcı Ağlarının oluşturulması 386
8.5. Evrişimli Otokodlayıcı Ağları 387
9. Bölüm
TEKRARLAYAN SİNİR AĞLARI
9. TEKRARLAYAN SİNİR AĞLARI 393
9.1. Tekrarlayan Sinir Ağlarının Uygulama Alanları 393
9.2. Tekrarlayan Sinir Ağları Nasıl Çalışır? 394
9.3. Tekrarlayan Sinir Ağ Mimarileri 398
9.3.1. Uzun Kısa Dönemli Bellek Ağları 398
9.3.2. Kapılı Tekrarlayan Birimler 400
9.4. Tekrarlayan ve Evrişimli Sinir Ağlarının Birleşimi 402
10. Bölüm
ÜRETKEN YAPAY ZEKA
10. ÜRETKEN YAPAY ZEKA 407
10.1. Dönüştürücü Temelli Mimariler 407
10.2. Dönüştürücü Temelli Mimarilerin Üstünlükleri ve Eksiklikleri 408
10.3. Otokodlayıcı Temelli Üretken Yapay Zeka Modelleri 409
10.3.1. Değişken Otokodlayıcılar 409
10.3.1.1. Mimari Yapı 409
10.3.1.2. Çalışma Prensibi 410
10.3.1.3. Matematiksel Model 411
10.3.1.4. Üstünlükler ve Eksiklikler 411
10.3.2. Çekişmeli Otokodlayıcılar 412
10.3.2.1. Mimari Yapısı 412
10.3.2.2. Çalışma Prensibi 413
10.3.2.3. Matematiksel Model 413
10.3.2.4. Üstünlükler ve Eksiklikler 414
10.3.3. Gürültü Giderici Otokodlayıcılar 415
10.3.3.1. Mimari Yapı 415
10.3.3.2. Çalışma Prensibi 416
10.3.3.3. Matematiksel Model 416
10.3.3.4. Üstünlükler ve Eksiklikler 417
10.4. Yayılım Temelli Mimariler 418
10.4.1. Çalışma Prensipleri 418
10.4.2. Yayılım Temelli Mimarilerin Üstünlükleri ve Eksiklikleri 418
10.5. Üretken Çekişmeli Ağlar 419
10.5.1. ÜÇA'ların Temel Yapısı ve Çalışma Prensibi 420
10.5.1.1. Üretken Çekişmeli Ağ Türleri 420
1. Temel ÜÇA 421
Temel ÜÇA'ın Çalışma Prensibi 422
Matematiksel Model 422
2. Derin Evrişimli Üretken Çekişmeli Ağ 423
Mimari Yapısı 424
Çalışma Prensibi 424
Matematiksel Model 425
DEÜÇA’ın Üstünlükleri ve Eksiklikleri 426
3. Koşullu ÜÇA 426
Mimari Yapısı 426
Çalışma Prensibi 427
Matematiksel Model 428
Koşullu ÜÇA'ın Üstünlükleri ve Kullanım Alanları 429
4. Çevrimsel ÜÇA 429
Mimari Yapısı 430
Çalışma Prensibi 430
Matematiksel Model 431
Çevrimsel ÜÇA’ın Üstünlükleri ve Eksiklikleri 432
5. Aşamalı Büyüyen ÜÇA 432
Mimari Yapısı 432
Çalışma Prensibi 433
Matematiksel Model 434
Aşamalı Büyüyen ÜÇA’ın Üstünlükleri ve Eksiklikleri 434
6. Süper Çözünürlüklü ÜÇA 435
Mimari Yapısı 435
Çalışma Prensibi 436
Matematiksel Model 437
Süper Çözünürlüklü ÜÇA’ın Üstünlükleri ve Eksiklikleri 438
10.6. Büyük Dil Modelleri 438
10.6.1. OpenAI Modeller 438
10.6.1.1. GPT (2018) 439
10.6.1.2. GPT–2 (2019) 439
10.6.1.3. GPT–3 (2020) 440
10.6.1.4. GPT–4o (2024) 441
10.6.1.5. GPT 4.5 (2025) 442
OpenAI Modellerinin Üstünlükleri ve Eksiklikleri 443
10.6.2. Google Modelleri 443
10.6.2.1. BERT (Bidirectional Encoder Representations from Transformers) – 2018 444
10.6.2.2. T5 (Text–to–Text Transfer Transformer) – 2019 445
10.6.2.3. Gemini – 2023 446
Google Modellerinin Üstünlükleri ve Eksiklikleri 446
10.6.2.4. Karşılaştırmalı Analiz ve Sonuç 446
10.6.3. Meta LLaMA Modelleri 447
10.6.3.1. Teknolojik Temeller 447
10.6.3.2. Mimari Yapı 448
10.6.3.3. Eğitim Süreçleri ve Veri Setleri 448
10.6.3.4. Model Versiyonları ve Teknik Özellikler 448
Meta Modellerinin Üstünlükleri ve Eksiklikleri 449
10.6.4. Anthropic Claude Modelleri 449
10.6.4.1. Teknolojik Temeller 450
10.6.4.2. Dil Modeli Yapısı 450
10.6.4.3. Mimari ve Optimizasyon 450
10.6.4.4. Eğitim Yöntemleri 450
10.6.4.5. Değişkenler ve Token Kapasitesi 451
10.6.4.6. Açık Kaynak Durumu 451
Claude modellerinin Üstünlükleri ve Eksiklikleri 451
10.6.5. Microsoft Copilot 451
10.6.5.1. Teknolojik Altyapı ve Temel Dil Modeli 452
10.6.5.2. Mimari Yapı ve GPT–4 Entegrasyonu 452
10.6.5.3. Eğitim Yöntemleri ve Veri Kaynakları 452
10.6.5.4. Değişken ve Token Boyutları 452
10.6.5.5. Açık Kaynak Durumu 453
Copilot’un Üstünlükleri ve Eksiklikleri 453
10.6.6. DeepSeek 453
10.6.6.1. DeepThink V3 454
Teknoloji ve Dil Modeli 454
Mimari Yapı 454
Eğitim Yöntemi 454
Değişkenler ve Token Kapasitesi 454
Açık Kaynak Durumu 454
10.6.6.2. DeepThink R1 Modeli 454
Teknoloji ve Dil Modeli 454
Mimari Yapı 455
Eğitim Yöntemi 455
Değişkenler ve Token Kapasitesi 455
10.6.6.3. Açık Kaynak Durumu 455
10.6.6.4. Kullanım Alanları ve Performans 455
DeepSeek’in Üstünlükleri ve Eksiklikleri 455
10.6.7. Grok 456
10.6.7.1. Teknolojik Temeller 456
10.6.7.2. Dil Modeli Yapısı 457
10.6.7.3. Mimari Yapı 457
10.6.7.4. Eğitim Süreci ve Veri Kaynakları 457
10.6.7.5. Değişken ve Token Kapasitesi 457
10.6.7.6. Açık Kaynak Durumu 458
Grok’un Üstünlükleri ve Eksiklikleri 458
Kaynaklar 459
Kavram Dizini 491 |