عنوان
|
ارائه یک چارچوب توزیع شده برای انتخاب ویژگی چندمتغیره
|
نوع پژوهش
|
مقاله چاپشده
|
کلیدواژهها
|
انتخاب ویژگی فیلتر چندمتغیره، انتخاب ویژگی نهفته، طبقهبندی، توزیع شدگی
|
چکیده
|
در بسیاری از مسائل یادگیری ماشین، انتخابِ ویژگی های مرتبط و اجتناب از ویژگی های افزونه، برای بهبود کارایی انتخاب ویژگی ضروری است. در اکثر رویکردهای موجود، از الگوریتم های فیلتر چندمتغیره برای این منظور استفاده میشود که در آنها تعامل با طبقه بند نادیده گرفته میشود. این مقاله با ارائه یک چارچوب، ترکیب روش های نهفته با روش های فیلتر چندمتغیره را پیشنهاد میدهد تا با درنظر گرفتن تعامل با طبقه بند در انتخاب ویژگی ها، این مشکل را برطرف نماید. در چارچوب پیشنهاد شده، ارتباط بین هر ویژگی و برچسبهای کلاس توسط الگوریتم های نهفته محاسبه می شود و افزونگی بین ویژگی ها از طریق الگوریتمهای فیلتر چندمتغیره بررسی می شود. این چارچوب پیشنهادی، دقت طبقه بندی را روی چندین مجموعه داده بهبود داده است. به علاوه در فرایند انتخاب ویژگی پیشنهاد شده، بجای استفاده یکدفعه از همه مجموعه داده ها، از توزیع افقی آنها استفاده شده است. این خصوصیت برای مجموعه داده هایی که دارای نمونه های زیادی هستند و نیز در محیط هایی که داده ها متمرکز نیستند، باعث کاهش زمان اجرای فرایند انتخاب ویژگی شده است. کیفیت روش ما با استفاده از شش مجموعه داده ارزیابی شده است. نتایج ثابت میکنند که چارچوب پیشنهاد شده، میتواند دقت طبقه بندی را در مقایسه با روشهای صرفا مبتنی بر فیلتر چندمتغیره بهبود دهد. همچنین سرعت اجرا می تواند در مقایسه با روش های متمرکز بهبود یابد.
|
پژوهشگران
|
حسین غفاریان (نفر سوم)، محسن رحمانی (نفر دوم)، مونا شریفی نژاد (نفر اول)
|