عنوان
|
IFSB-ReliefF: یک روش انتخاب نمونه و ویژگی همزمان بر مبنای ReliefF
|
نوع پژوهش
|
مقاله چاپشده
|
کلیدواژهها
|
کاهش دادهها، انتخاب نمونه، انتخاب ویژگی، ReliefF.
|
چکیده
|
افزایش استفاده از اینترنت و برخی از پدیدهها مانند شبکههای حسگر، منجر به افزایش غیرضروری اطالعات شده است. اگرچه این امر مزایای بسیاری دارد، اما باعث ایجاد مشکالتی مانند نیاز به فضای ذخیرهسازی و پردازندههای بهتر و همچنین پاالیش اطالعات برای حذف اطالعات غیرضروری می شود. الگوریتمهای کاهش داده، روشهایی برای انتخاب اطالعات مفید از مقدار زیادی دادههای تکراری، ناقص و زائد فراهم میکنند. در این مقاله، الگوریتم ReliefF که یک الگوریتم رتبهبندی ویژگی است، تغییر داده شده تا به طور همزمان ویژگیها و نمونهها را انتخاب کند. الگوریتم پیشنهاد شده میتواند بر روی ویژگیهای اسمی و عددی و مجموعه دادهها با مقادیر مفقود اجرا شود. همچنین، الگوریتم میتواند به صورت موازی روی یک پردازنده چند هستهای اجرا شود، که این امر باعث کاهش بسیار چشمگیر زمان اجرا و امکان اجرای آن روی مجموعه دادههای بزرگ میشود. عالوه بر این، در این الگوریتم، انتخاب نمونه از هر کالس متناسب با احتمال پیشین کالس است و در نتیجه توازن و نسبت اولیه کالسها در مجموعه اصلی از بین نخواهد رفت. نتایج آزمایش بر روی چهار مجموعه داده نشاندهنده موفقیت الگوریتم پیشنهادی در این امر است.
|
پژوهشگران
|
حسین غفاریان (نفر سوم)، محسن رحمانی (نفر دوم)، زینب عباسی (نفر اول)
|