1403/02/27
مریم امیری

مریم امیری

مرتبه علمی: استادیار
ارکید: https://orcid.org/0000-0002-7411-9552
تحصیلات: دکترای تخصصی
اسکاپوس: 57146848900
دانشکده: دانشکده فنی مهندسی
نشانی: دانشگاه اراک
تلفن: 32625522

مشخصات پژوهش

عنوان
انتخاب ویژگی با استفاده از آنتروپی مبتنی بر همسایگی
نوع پژوهش
پایان نامه های تقاضا محور و غیر تقاضا محور
کلیدواژه‌ها
شاخص تمایز، رابطه ی همسایگی، انتخاب ویژگی، چگالی، توانایی تمایز، آنتروپی
سال 1399
پژوهشگران مریم امیری(استاد مشاور)

چکیده

انتخاب ویژگی به عنوان یک مرحله ی پیش پردازش مهم برای شناسایی الگو، یادگیری ماشین وداده کاوی شناخته شده است. مفاهیم مختلفی برای ارزیابی زیرمجموعه های ویژگی وجود دارد که آنتروپی و همسایگی از پرکاربردترین آن ها هستند. شاخص تمایز همسایگی یک معیار مبتنی بر آنتروپی و روابط همسایگی است که برای تعیین توانایی تمایز زیرمجموعه های ویژگی در فرآیند انتخاب ویژگی استفاده می شود. در این معیار برای ایجاد روابط همسایگی از مفهوم شعاع همسایگی (ε) استفاده شده است.یکی از چالش های این معیار تعیین مقدار ε است، زیرا این پارامترتأثیر بسیار زیادی در محاسبه ی توانایی تمایز زیرمجموعه های ویژگی داشته و به مجموعه داده ها وابسته است. در این پایان نامه روش جدیدی برای ایجاد روابط همسایگی بر اساس نقاط هدف ارائه شده است. برای مشخص کردن نقاط هدف ابتدا با استفاده از مفهوم چگالی که بیانگر تراکم نقاط داده در اطراف یک نقطه است، نقاط داده رتبه بندی شده و سپس به تعداد کلاس های موجود نقاط با رتبه ی بالا به عنوان نقاط هدف انتخاب می‎شوند. برای تعیین رابطه ی همسایگی دایره هایی حول نقاط هدف ترسیم شده و نقاط درون و روی دایره های یکسان به عنوان همسایه در نظر گرفته می شوند. در گام بعد با به کارگیری روش ارائه شده برای ایجاد روابط همسایگی و مبتنی بر معیار شاخص تمایز همسایگی، یک معیار اهمیت ویژگی پیشنهاد می شود. سرانجام الگوریتمی ارائه می‎شود که بر اساس این معیار به انتخاب ویژگی می پردازد. روش پیشنهادی علاوه بر الگوریتم‎های پایه ی CFS و FCBF با جدیدترین الگوریتم های انتخاب ویژگی از جمله الگوریتم HANDI بر روی چند مجموعه داده ارزیابی می شود. نتایج به دست آمده نشان می دهد که روش ارائه شده عملکرد بهتری نسبت به روش های قبلی دارد.