1403/09/01
مریم امیری

مریم امیری

مرتبه علمی: استادیار
ارکید: https://orcid.org/0000-0002-7411-9552
تحصیلات: دکترای تخصصی
اسکاپوس: 57146848900
دانشکده: دانشکده فنی مهندسی
نشانی: دانشگاه اراک
تلفن: 32625522

مشخصات پژوهش

عنوان
ارائه یک نسخه بهبود یافته از الگوریتم K-means بر مبنای الگوکاوی
نوع پژوهش
مقاله ارائه‌شده
کلیدواژه‌ها
خوشه‌بندی، انتخاب ویژگی، الگوکاوی، مرکزخوشه، K-means
سال 1401
پژوهشگران زهرا هاشمی ، مریم امیری

چکیده

خوشه‌‌بندی یکی از مهم‌ترین مباحث در زمینه‌ی داد‌ه‌کاوی است. هدف از خوشه‌بندی تفکیک داده‌ها است به‌گونه‌ای که داده‌های موجود در یک خوشه بیشترین شباهت را به یکدیگر و کمترین شباهت را با اعضای خوشه‌های دیگر داشته باشند. یکی از مهم‌ترین الگوریتم‌های خوشه‌بندی الگورریتم K-means می‌باشد. در این الگوریتم ابتدا به تعداد خوشه‌ها به‌صورت تصادفی از داده‌های اصلی مراکز خوشه اولیه انتخاب می‌شوند و سپس عملیات یافتن خوشه‌ها اجرا می‌شود. چالش اصلی در K-means انتخاب مراکز خوشه‌ها به-صورت بهینه است. درگذشته پژوهش‌های متعددی در زمینه انتخاب مراکز اولیه خوشه‌ها در الگوریتم K-means صورت گرفته است. در این مقاله برای نخستین بار روش جدیدی برای انتخاب مراکز خوشه‌ها مبتنی بر الگوکاوی ارائه می‌شود. در این روش ابتدا برای کاهش حجم داده‌ها، انتخاب ‌ویژگی روی داده‌ها اعمال می‌شود؛ سپس الگوهای پرتکرار استخراج و برپایه‌ی این الگوها مراکز اولیه خوشه‌ها مشخص می‌شود. روش‌پیشنهادی با روش پایه K-means و با روش جدید BDD بر روی 8 مجموعه‌داده با ابعاد گوناگون ارزیابی می‌شود. نتایج به‌دست آمده نشان می‌دهد در اغلب موارد، روش پیشنهادی عملکرد بهتری دارد.