عنوان
|
ارائه یک نسخه بهبود یافته از الگوریتم K-means بر مبنای الگوکاوی
|
نوع پژوهش
|
مقاله ارائهشده
|
کلیدواژهها
|
خوشهبندی، انتخاب ویژگی، الگوکاوی، مرکزخوشه، K-means
|
چکیده
|
خوشهبندی یکی از مهمترین مباحث در زمینهی دادهکاوی است. هدف از خوشهبندی تفکیک دادهها است بهگونهای که دادههای موجود در یک خوشه بیشترین شباهت را به یکدیگر و کمترین شباهت را با اعضای خوشههای دیگر داشته باشند. یکی از مهمترین الگوریتمهای خوشهبندی الگورریتم K-means میباشد. در این الگوریتم ابتدا به تعداد خوشهها بهصورت تصادفی از دادههای اصلی مراکز خوشه اولیه انتخاب میشوند و سپس عملیات یافتن خوشهها اجرا میشود. چالش اصلی در K-means انتخاب مراکز خوشهها به-صورت بهینه است. درگذشته پژوهشهای متعددی در زمینه انتخاب مراکز اولیه خوشهها در الگوریتم K-means صورت گرفته است. در این مقاله برای نخستین بار روش جدیدی برای انتخاب مراکز خوشهها مبتنی بر الگوکاوی ارائه میشود. در این روش ابتدا برای کاهش حجم دادهها، انتخاب ویژگی روی دادهها اعمال میشود؛ سپس الگوهای پرتکرار استخراج و برپایهی این الگوها مراکز اولیه خوشهها مشخص میشود. روشپیشنهادی با روش پایه K-means و با روش جدید BDD بر روی 8 مجموعهداده با ابعاد گوناگون ارزیابی میشود. نتایج بهدست آمده نشان میدهد در اغلب موارد، روش پیشنهادی عملکرد بهتری دارد.
|
پژوهشگران
|
مریم امیری (نفر دوم)، زهرا هاشمی (نفر اول)
|