مشخصات پژوهش

صفحه نخست /دسته بندی بیزین جمعی با ...
عنوان دسته بندی بیزین جمعی با استفاده از انتخاب ویژگی رپر مبتنی بر الگوریتم ژنتیک در تشخیص هرزنامه
نوع پژوهش مقاله چاپ‌شده
کلیدواژه‌ها ایمیل، هرزنامه، دسته بندی، الگوریتم ژنتیک، انتخاب ویژگی، ماتریس انتقال، یادگیری جمعی
چکیده جایگاه ایمیل در ارتباطات، با ورود پدیده ای به نام هرزنامه با تهدید جدی مواجه شده است. تاکنون، به منظور مقابله با این پدیده، روشهای فراوانی پیشنهاد شده که یکی از مه مترین این روش ها، دسته بندی آنها بر اساس محتوا به دو دسته هرزنامه و غیرهرزنامه است. دسته بندی بر اساس محتوا با استفاده از کلمات ب هعنوان ویژگی انجام می شود که ب هدلیل تعداد زیاد ویژگی ها، استفاده از یک سازوکار انتخاب ویژگی کارآمد موضوعی حیاتی به نظر می رسد. بر این اساس، تمرکز روش پیشنهادی در این مقاله روی انتخاب ویژگی های مفید بوده و یک فرایند انتخاب ویژگی رپر با بهره گیری از الگوریتم قدرتمند ژنتیک و با همکاری دسته بند بیزین که دارای کارایی بالایی در مسائل دسته بندی متون است، ارائه می شود. روش کار نیز به این صورت است که ابتدا یک بردار ویژگی اولیه ساخته شده، سپس با ضرب کردن آن در یک ماتریس با عنوان ماتریس انتقال، با استفاده از الگوریتم ژنتیک، روی آن عملیات بهینه سازی اعمال شده و در پایان K بردار ویژگی نهایی ساخته می شوند. عملیات دسته بندی نیز به صورت جمعی و با اعمال k دسته بند بیزین روی بردارهای ویژگی اعمال شده و از بین آنها رأی گیری انجام می شود. روش پیشنهادی روی دو پایگاه داده اجرا شده که بر اساس نتایج، روش پیشنهادی با مقدار k=7 دارای نرخ صحت 87/76 و 87/91 در دو پایگاه داده PU1 و PU2 است. همچنین نتایج مقایسه روش پیشنهادی، حاکی از کارآمدی روش پیشنهادی در مقایسه با بیزین پایه و دو دسته بند KNN و SVM است.
پژوهشگران محسن رحمانی (نفر دوم)، وحید نصرتی (نفر اول)