YYÜ GCRIS Basic veritabanının içerik oluşturulması ve kurulumu Research Ecosystems (https://www.researchecosystems.com) tarafından devam etmektedir. Bu süreçte gördüğünüz verilerde eksikler olabilir.
 

Classification of Diabetes Data Set From Iraq Via Different Machine Learning Techniques

No Thumbnail Available

Date

2022

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Uluslararası Diyabet Federasyonu verileri, dünya çapında yüz milyonlarca insanın diyabetle yaşadığını göstermektedir. Günümüzde diyabet en önemli ölüm nedenleri arasında yer almaktadır. Makine öğrenimi yaklaşımları, Irak'taki diyabetik hastalardan toplanan tanısal tıbbi veri kümelerinden tahmine dayalı modeller oluşturarak bilgi çıkarımı için etkili sonuçlar sağlamaktadır. Sınıflandırma, çok önemli denetimli veri tekniklerinden birisidir. Bu çalışmada, makine öğrenme ve sınıflandırma performanslarını belirlemek amacıyla; Regresyon Ağaçları (CART), Doğrusal Ayırma Analizi (LDA), Destek Vektör Makinesi (SVM), K-En Yakın Komşular (K-NN) ve Rastgele Orman (RF) sınıflandırma algoritmaları kullanılmış ve bu algoritmalar karşılaştırılmıştır. Veriler üzerinde algoritma modelleri eğitilmiş ve uygun sayıda katlama ve iterasyon ile tekrarlı çapraz doğrulama kullanılarak modeller karşılaştırılmıştır. Algoritmalardan elde edilen sonuçlar eğitim verileriyle karşılaştırıldığında, ilgili algoritmaların doğruluk sıraları eğitim verileriyle tamamen aynı sonuçları göstermektedir. Test veri sonuçları doğruluk sıralamasında bazı farklılıklar gösterirken, algoritmaların sırasıyla en yüksek sıralaması SVM, RF, CART, LDA ve KNN şeklinde belirlenmiştir. Eğitim veri seti, modeli oluşturmak için kullanılan örnekleri ifade ederken, test veri seti, modelin performansını değerlendirmek için kullanılmaktadır. Çalışma bulgularının, Irak'ta diyabetin erken teşhis ve kontrol altına alınması için daha iyi klinik kararlar alınmasında sağlık çalışanlarına yardımcı olacağı ve dolayısıyla potansiyel olarak hayat kurtaracağı umulmaktadır. Çalışmada gerekli analizler için R-Studio paket programı kullanılmıştır.
International Diabetes Federation data shows that hundreds of millions of people live with diabetes worldwide. Nowadays, diabetes is consistently listed as the number one cause of death. Machine learning approaches provide effective results for information extraction by creating predictive models from diagnostic medical datasets collected from diabetic patients in Iraq. One of the really crucial supervised data techniques is classification. We apply machine learning to compare and contrast the performance of Classification and Regression Trees (CART), Linear Discrimination Analysis (LDA), Support Vector Machine (SVM), K-Nearest Neighbors (K-NN), and Random Forest (RF) in this study. We train the models of the algorithms on the data and compare the models using iterative cross-validation with the appropriate number of folds and iterations. Based on the results obtained from the algorithms, it shows that the accuracy and sequence of the algorithms concerning the training data are completely identical to the results of the comprehensive comparison because the latter mainly depends on the results training data RF, CART, SVM, LDA, and KNN. While the test data results showed some difference, the sequence of the algorithms was as SVM, RF, CART, LDA, and KNN being the highest, respectively. The training data set refers to the samples that were used to construct the model, whereas the testing data set is used to evaluate the model's performance. The study's findings will help healthcare workers detect diabetes in Iraq early and make better clinical decisions to control it, potentially saving lives. R-Studio used in this study.

Description

Keywords

İstatistik, Anahtar kelime, Destek vektör makineleri, Doğrusal analiz, Makine öğrenmesi, Rastgele ormanlar, Regresyon ağaçları, Sınıflandırma, Statistics, Keyword, Support vector machines, Linear analysis, Machine learning, Random forests, Regression trees, Classification

Turkish CoHE Thesis Center URL

WoS Q

Scopus Q

Source

Volume

Issue

Start Page

End Page

150

Collections