عنوان
|
انتخاب ویژگی با استفاده از آنتروپی مبتنی بر همسایگی
|
نوع پژوهش
|
مقاله ارائهشده
|
کلیدواژهها
|
شاخص تمایز، رابطه ی همسایگی، انتخاب ویژگی، چگالی، توانایی تمایز، آنتروپی
|
چکیده
|
انتخاب ویژگی به عنوان یک مرحله ی پیش پردازش مهم برای شناسایی الگو، یادگیری ماشین و داده کاوی شناخته شده است. مفاهیم مختلفی برای ارزیابی زیرمجموعه های ویژگی وجود دارد که آنتروپی و همسایگی از پرکاربردترین آن ها هستند. معیار شاخص تمایز همسایگی معیاری مبتنی بر آنتروپی و همسایگی است که برای تعیین توانایی تمایز زیرمجموعه های ویژگی در فرآیند انتخاب ویژگی استفاده می شود. در این معیار برای ایجاد روابط همسایگی از مفهوم شعاع همسایگی (ε) استفاده شده که تعیین مقدار آن به مجموعه داده ها وابسته است. در این مقاله روش جدیدی برای ایجاد روابط همسایگی براساس نقاط هدف ارائه شده است. برای مشخص کردن نقاط هدف ابتدا با استفاده از مفهوم چگالی که بیانگر تراکم نقاط داده در اطراف یک نقطه است، نقاط داده رتبه بندی شده و نقاط با رتبه ی بالا به عنوان نقاط هدف انتخاب میشوند. سپس دایره هایی حول نقاط هدف ترسیم شده و نقاط درون و روی دایره های یکسان به عنوان همسایه در نظر گرفته می شوند. با به کارگیری روش ارائه شده در معیار شاخص تمایز همسایگی یک معیار اهمیت ویژگی پیشنهاد می شود. سرانجام یک الگوریتم بر اساس این معیار به انتخاب ویژگی می پردازد. نتایج به دست آمده از ارزیابی ها نشان می دهد که روش ارائه شده عملکرد بهتری نسبت به روش های قبلی دارد.
|
پژوهشگران
|
محسن رحمانی (نفر دوم)، فاطمه فرنقی زاده (نفر اول)، مریم امیری (نفر سوم)
|