مقایسه سه الگوریتم داده کاوی برای شناسایی عوامل خطر مرتبط با دیابت نوع2
منتظر شده در 1399/01/20
افزایش شیوع دیابت نوع 2 باعث ایجاد نگرانی در بین ارائه دهندگان خدمات و مدیران بهداشتی شده است. مطالعه حاضر با هدف توسعه و مقایسه برخی از مدلهای آماری برای شناسایی عوامل خطر مرتبط با دیابت نوع 2 انجام شده است. در این سبک ANN ، SVM و مدلهای چندگانه رگرسیون لجستیک MLR با استفاده از مشخصات دموگرافیک ، آنتروپومتری و بیوشیمیایی بر روی نمونه ای از 9528 نفر از شهر مشهد در ایران استفاده شد. این مطالعه بطور تصادفی 6654 مورد (70٪) را برای آموزش انتخاب کرده است و 2874 مورد (30٪) باقیمانده را نیز برای آزمایش اختصاص داده است. سه روش با کمک منحنی ROC مقایسه شدند.
يافته ها: شيوع ديابت نوع 2 در جمعيت ما 14٪ بود. مدل ANN دارای دقت 78.7٪ ، حساسیت 63.1٪ و ویژگی 81.2٪ بود. همچنین مقادیر این سه پارامتر برای 76.8% ، 64.5٪ و 78.9٪ برای SVM و 77.7٪ ، 60.1٪ و 5/80٪ برای MLR بود. مساحت زیر منحنی ROC برای ANN 0.71 ، برای SVM 0.73 و برای MLR 0.70بود. یافته های ما نشان داد که ANN عملکرد بهتری نسبت به دو مدل SVM) و ( MLR دارد و می تواند به طور موثر برای شناسایی عوامل خطر مرتبط با دیابت نوع 2 مورد استفاده قرار گیرد