Online Makale
Online Hizmetlere Toplu BakışPamukkale Üniversitesi Mühendislik Bilimleri Dergisi
Pamukkale Univ Muh Bilim Derg. Baskıdaki Makaleler: PAJES-52882 | DOI: 10.5505/pajes.2025.52882 | |||
Makine Öğrenmesi Tabanlı Diyabet Teşhisinin Yeniden Örnekleme Teknikleri ile İyileştirilmesiİrem Şenyer Yapıcı1, Rukiye Uzun Arslan2, Mustafa Alptekin Engin31Zonguldak Bülent Ecevit Üniversitesi Mühendislik Fakültesi, Bilgisayar Mühendisliği Bölümü, Zonguldak2Zonguldak Bülent Ecevit Üniversitesi Mühendislik Fakültesi, Elektrik Elektronik Mühendisliği Bölümü, Zonguldak 3Bayburt Üniversitesi Mühendislik Fakültesi, Elektrik Elektronik Mühendisliği Bölümü, Bayburt Bu çalışmanın amacı, makine öğrenimi teknikleri ve yeniden örnekleme yöntemlerini kullanarak diyabet teşhisinin doğruluğunu artırmaktır. Diyabet veri setlerinin dengesiz yapısı, sonuçları doğru bir şekilde tahmin etmekte zorlanan geleneksel sınıflandırma algoritmaları için önemli bir zorluk teşkil etmektedir. Modelin etkinliğini artırmak amacıyla, SMOTE, ADASYN, Borderline SMOTE, SVM SMOTE, Random Under Sampler, Near Miss, One Sided Selection, Neighbourhood Cleaning Rule, Edited Nearest Neighbours, Instance Hardness Threshold, AllKNN ve Tomek Links dahil olmak üzere bir dizi aşırı örnekleme ve düşük örnekleme tekniklerinin performansını değerlendirmek için karşılaştırmalı bir analiz yapılmıştır. Yukarıda bahsedilen teknikler daha sonra Karar Ağacı, Rastgele Orman, K-En Yakın Komşular, AdaBoost, Ekstra Ağaç Sınıflandırıcı ve makine öğrenimi sınıflandırıcılarına uygulanmış ve performansları doğruluk, geri çağırma, kesinlik, F-Skoru ve AUC-ROC performans ölçütleri kullanılarak değerlendirilmiştir. SVMSMOTE yeniden örnekleme tekniği, karar ağacı sınıflandırıcısı ile birlikte kullanıldığında %99,06 doğruluk elde ederek en başarılı yöntem olarak belirlenmiştir. Bulgular, yeniden örnekleme tekniklerinin dahil edilmesinin teşhis yeterliliğini önemli ölçüde artırdığını ve daha güvenilir tahminler sağladığını göstermektedir. Bu araştırma, diyabet teşhisi için sağlam bir çerçeve sağlayarak ve makine öğreniminin sağlık hizmetlerinde uygulanmasına ilişkin değerli bilgiler sunarak tıbbi bilişim alanına önemli bir katkıda bulunmaktadır. Anahtar Kelimeler: Diyabet teşhisi, Yeniden örnekleme teknikleri, Dengesiz veri kümesi, Makine öğrenmesiImprovement of Machine Learning-Based Diabetes Diagnosis via Resampling Techniquesİrem Şenyer Yapıcı1, Rukiye Uzun Arslan2, Mustafa Alptekin Engin31Department of Computer Engineering, Zonguldak Bülent Ecevit University, Zonguldak, Türkiye2Department of Electrical and Electronics Engineering, Zonguldak Bülent Ecevit University, Zonguldak, Türkiye 3Department of Electrical and Electronics Engineering, Bayburt University, Bayburt, Türkiye The objective of this study is to enhance the accuracy of diabetes diagnosis through the utilisation of machine learning techniques and resampling methods. The imbalanced nature of diabetes datasets presents a significant challenge for traditional classification algorithms, which often struggle to accurately predict results. In order to enhance the efficacy of the model, a comparative analysis was conducted to assess the performance of a range of over-sampling and under-sampling techniques, including SMOTE, ADASYN, Borderline SMOTE, SVM SMOTE, Random Under Sampler, Near Miss, One Sided Selection, Neighbourhood Cleaning Rule, Edited Nearest Neighbours, Instance Hardness Threshold, AllKNN and Tomek Links. The aforementioned techniques were then applied to the Decision Tree, Random Forest, K-Nearest Neighbours, AdaBoost, Extra Tree Classifier, and machine learning classifiers, and their performance was evaluated using the accuracy, recall, precision, F-Score, and AUC-ROC performance metrics. The SVMSMOTE resampling technique was identified as the most successful method, achieving 99.06% accuracy when used in combination with the decision tree classifier. The findings demonstrate that the incorporation of resampling techniques markedly enhances diagnostic proficiency and yields more dependable forecasts. This research makes a significant contribution to the field of medical informatics, providing a robust framework for diabetes diagnosis and offering valuable insights into the application of machine learning in healthcare. Keywords: Diabetes diagnosis, Resampling techniques, Imbalanced dataset, Machine learningSorumlu Yazar: Mustafa Alptekin Engin, Türkiye |
|