Browsing by Author "Hassan, Masoud Muhammed"
Now showing 1 - 1 of 1
- Results Per Page
- Sort Options
Master Thesis Combination of Pca With Smote Oversampling for Classification of High-Dimensional Imbalanced Data(2021) Mulla, Guhdar Abdulazız Ahmed; Demir, Yıldırım; Hassan, Masoud MuhammedDengesiz verilerin sınıflandırması, sınıflandırıcıların daha büyük veri sınıfına doğru çarpıtıldığı veri madenciliğinde yaygın bir konudur. Yüksek boyutlu çarpık (dengesiz) verilerin sınıflandırılması, daha zor olduğundan karar vericiler için büyük ilgi görmektedir. Değişkenlerin azaltıldığı bir süreç olan boyut indirgeme yöntemi, yüksek boyutlu veri setlerinin belirli bir kayıpla daha kolay yorumlanmasını sağlamaktadır. Ayrıca, yüksek boyutlu dengesiz verilerin sınıflandırılması tekrarlanan bir sorun haline gelmiştir. Bu çalışmada, yüksek boyutlu verilerde dengesizlik problemini çözmek için SMOTE aşırı örnekleme ile Temel Bileşen Analizini (PCA) birleştiren yeni bir yöntem önerilmiştir. Önerilen yöntemin etkinliğini kontrol etmek ve sınıflandırıcıların performansını belirlemek için Karar Ağacı (DT), Destek Vektör Makineleri (SVM), En Yakın Komşu (K-NN), Naive Bayes (NB), Lojistik Regresyon (LR) ve Yapay Sinir Ağlarından (ANN) oluşan altı sınıflandırma algoritması ve altı farklı veri kümesi kullanılmıştır. Sırasıyla, ham veri setleri, PCA, SMOTE ve SMOTE+PCA yöntemleriyle dönüştürülen veri setleri verilen algoritmalarla analiz edilmiştir. Analizler WEKA programlama dillerinden yararlanılarak yapılmıştır. Analiz sonuçları, neredeyse tüm sınıflandırma algoritmalarının PCA, SOMTE ve SMOTE+PCA yöntemlerini kullanarak sınıflandırma performanslarını iyileştirdiğini göstermektedir. Bununla birlikte, SMOTE yöntemi, verilerin yeniden dengelenmesi için PCA ve PCA+SMOTE yöntemlerinden daha etkili sonuçlar vermiştir. Ayrıca deneysel sonuçlar, SVM ve K-NN sınıflandırıcılarının diğer algoritmalara kıyasla daha yüksek sınıflandırma performansı sağladığını göstermektedir.
