|
1. hafta |
Veri madenciliğine giriş; veri toplama ve işleme sürecinin genel çerçevesi; veri madenciliğinin temel bileşenleri ve uygulama alanları. |
|
2. hafta |
Veri nesneleri; öznitelik türleri; temel tanımlayıcı istatistikler.
|
|
3. hafta |
Veri dağılım ölçütleri; görselleştirme yöntemleri; grafiğe dayalı analiz.
|
|
4. hafta |
Benzerlik ve farklılık ölçütleri; uzaklık fonksiyonları; veri benzerliği hesaplama. |
|
5. hafta |
Veri temizleme; eksik veri; gürültü azaltma; tutarsızlıkların giderilmesi. |
|
6. hafta |
Veri entegrasyonu; veri indirgeme; örnekleme; normalizasyon ve ayrıklaştırma. |
|
7. hafta |
Sık örüntü kavramları; destek, güven, birliktelik kuralları. |
|
8. hafta |
Sınıflandırmanın temelleri; eğitim/test veri setleri; hata türleri. |
|
9. hafta |
Karar ağaçları; bilgi kazancı; Gini indeksi; model değerlendirme. |
|
10. hafta |
Naive Bayes; Bayesyen kavramlar; kural tabanlı sınıflandırma. |
|
11. hafta |
Kümeleme kavramları; kümeleme türleri; benzerlik temelli gruplama. |
|
12. hafta |
K-means; hiyerarşik kümeleme; yoğunluk temelli yöntemler. |
|
13. hafta |
Aykırı değer kavramı; uzaklık, yoğunluk ve model tabanlı aykırılık tespiti. |
|
14. hafta |
Dönem boyunca öğrenilen veri ön işleme, örüntü madenciliği, sınıflandırma, kümeleme ve aykırı değer tespit yöntemlerinin bir arada kullanıldığı uçtan uca bir veri işleme boru hattı tasarımı. Gerçek bir veri seti üzerinde özet uygulama, model seçimi, sonuçların yorumlanması ve karşılaştırılması. |