عنوان
|
انتخاب ویژگی با استفاده از آنتروپی مبتنی بر همسایگی
|
نوع پژوهش
|
پایان نامه های تقاضا محور و غیر تقاضا محور
|
کلیدواژهها
|
شاخص تمایز، رابطه ی همسایگی، انتخاب ویژگی، چگالی، توانایی تمایز، آنتروپی
|
چکیده
|
انتخاب ویژگی به عنوان یک مرحله ی پیش پردازش مهم برای شناسایی الگو، یادگیری ماشین وداده کاوی شناخته شده است. مفاهیم مختلفی برای ارزیابی زیرمجموعه های ویژگی وجود دارد که آنتروپی و همسایگی از پرکاربردترین آن ها هستند. شاخص تمایز همسایگی یک معیار مبتنی بر آنتروپی و روابط همسایگی است که برای تعیین توانایی تمایز زیرمجموعه های ویژگی در فرآیند انتخاب ویژگی استفاده می شود. در این معیار برای ایجاد روابط همسایگی از مفهوم شعاع همسایگی (ε) استفاده شده است.یکی از چالش های این معیار تعیین مقدار ε است، زیرا این پارامترتأثیر بسیار زیادی در محاسبه ی توانایی تمایز زیرمجموعه های ویژگی داشته و به مجموعه داده ها وابسته است. در این پایان نامه روش جدیدی برای ایجاد روابط همسایگی بر اساس نقاط هدف ارائه شده است. برای مشخص کردن نقاط هدف ابتدا با استفاده از مفهوم چگالی که بیانگر تراکم نقاط داده در اطراف یک نقطه است، نقاط داده رتبه بندی شده و سپس به تعداد کلاس های موجود نقاط با رتبه ی بالا به عنوان نقاط هدف انتخاب میشوند. برای تعیین رابطه ی همسایگی دایره هایی حول نقاط هدف ترسیم شده و نقاط درون و روی دایره های یکسان به عنوان همسایه در نظر گرفته می شوند. در گام بعد با به کارگیری روش ارائه شده برای ایجاد روابط همسایگی و مبتنی بر معیار شاخص تمایز همسایگی، یک معیار اهمیت ویژگی پیشنهاد می شود. سرانجام الگوریتمی ارائه میشود که بر اساس این معیار به انتخاب ویژگی می پردازد. روش پیشنهادی علاوه بر الگوریتمهای پایه ی CFS و FCBF با جدیدترین الگوریتم های انتخاب ویژگی از جمله الگوریتم HANDI بر روی چند مجموعه داده ارزیابی می شود. نتایج به دست آمده نشان می دهد که روش ارائه شده عملکرد بهتری نسبت به روش های قبلی دارد.
|
پژوهشگران
|
مریم امیری (استاد مشاور)
|