با توجه به پیشرفت تکنولوژی و وابستگی دنیای امروز به کامپیوتر و اینترنت، حفاظت از سیستم های کامپیوتری و اطلاعات آن امری دشوار و حیاتی است. از آنجایی که کامپیوترها همواره مورد هجوم انواع برنامه های مخرب از جمله بدافزارها قرار می گیرند، بنابراین عملیات حفاظت و برقراری امنیت دشوار خواهد بود. ما در این پژوهش یک راه حل مبتنی بر یادگیری ماشین با دقت بالا و سربار محاسباتی کم، برای طبقه بندی نمونه ها به دو دسته ی مخرب یا خوب را اجرا می کنیم. به منظور پیاده سازی، پنج الگوریتم درخت تصمیم گیری را به کار می گیریم. در این پژوهش از دو مجموعه ی داده ی خام و یکپارچه استفاده می کنیم. هدف ما مقایسه ی کارایی و دقت این دو مجموعه داده است. در ابتدا روال ساخت و پیش پردازش این دو مجموعه را مورد مطالعه قرار می دهیم. مجموعه داده ویژگی خام، شامل فیلدهای اجرایی قابل حمل سرآیند PE می باشد که درطی مسیری که در ادامه ی پژوهش موردمطالعه قرار خواهدگرفت با ویژگی های مشتق شده ترکیب می شوند و حاصل آن مجموعه ویژگی یکپارچه است، که معیار دقت کلی آن نسبت به مجموعه ویژگی خام ارتقا پیدا کرده است. در این پژوهش با کمک پنج آزمون میزان ارتقای مجموعه داده یکپارچه را نسبت به مجموعه داده خام اندازه گیری می کنیم. ابزار مورداستفاده در این پژوهش، WEKA می باشد.