۱۴۰۴/۰۱/۲۳
مریم امیری

مریم امیری

مرتبه علمی: استادیار
ارکید: https://orcid.org/۰۰۰۰-۰۰۰۲-۷۴۱۱-۹۵۵۲
تحصیلات: دکترای تخصصی
اسکاپوس: ۵۷۱۴۶۸۴۸۹۰۰
دانشکده: دانشکده فنی مهندسی
نشانی: دانشگاه اراک
تلفن: ۳۲۶۲۵۵۲۲

مشخصات پژوهش

عنوان
بهینه سازی الگوریتم درخت تصمیم CART با استفاده از الگوریتم گرگ خاکستری
نوع پژوهش
پایان نامه های تقاضا محور و غیر تقاضا محور
کلیدواژه‌ها
درخت تصمیم، طبقه بندی، بهینه سازی، انتخاب ویژگی، گرگ خاکستری و پیچیدگی محاسباتی
سال 1403
پژوهشگران مریم امیری(استاد راهنما)، مهدی جمالو(دانشجو)

چکیده

درخت تصمیم CART یکی از روش‌های پرکاربرد در حوزه یادگیری ماشین است که به دلیل ساختار ساده و تفسیرپذیری بالا، توجه بسیاری از محققان را به خود جلب کرده است. با این حال، این مدل با چالش‌هایی همچون بیش‌برازش، حساسیت به انتخاب ویژگی‌ها و پیچیدگی در ساختار درخت مواجه است. انتخاب ویژگی به عنوان یکی از مراحل حیاتی در فرآیند ساخت مدل‌های یادگیری ماشین، نقش بسزایی در بهبود عملکرد الگوریتم‌های طبقه‌بندی دارد. با انتخاب صحیح و بهینه ویژگی‌ها، نه‌تنها دقت مدل افزایش می‌یابد، بلکه از بیش‌برازش جلوگیری شده و کارایی مدل در مواجهه با داده‌های جدید بهبود می‌یابد. در این پژوهش، از الگوریتم گرگ خاکستری به عنوان یک روش فراابتکاری قدرتمند برای بهینه‌سازی فرآیند انتخاب ویژگی در درخت تصمیم CART استفاده شده است. الگوریتم گرگ خاکستری، که از رفتار اجتماعی و استراتژی‌های شکار گرگ‌های خاکستری الهام گرفته شده است، توانایی بالایی در جستجوی فضای ویژگی‌ها و یافتن ترکیب‌های بهینه دارد. این الگوریتم با شبیه‌سازی ساختار سلسله‌مراتبی گرگ‌ها، که شامل رهبری گرگ آلفا به عنوان بهترین راه‌حل است، می‌تواند تعادلی مناسب بین جستجوی محلی و جهانی برقرار کند. این ویژگی‌ها، GWO را به یک ابزار کارآمد برای حل مسائل پیچیده در فضای بزرگ ویژگی‌ها تبدیل کرده است. ارزیابی‌ها بر روی 9 مجموعه‌ داده از داده‌های استاندارد و شناخته‌شده در حوزه یادگیری ماشین انجام شده است تا کارایی روش پیشنهادی در مقایسه با روش‌های پایه و دو نمونه از الگوریتم‌های جدید این حوزه بررسی شود. نتایج به‌دست‌آمده نشان می‌دهد که بهینه‌سازی فرآیند انتخاب ویژگی با استفاده از الگوریتم گرگ خاکستری، منجر به بهبود قابل توجهی در عملکرد درخت تصمیم CART شده است. مدل‌ بهینه‌شده، دقت بالاتری را در طبقه‌بندی داده‌های آزمایشی نشان داده‌ است و در عین حال، ساختاری ساده‌تر، با تعداد ویژگی‌های کمتر و سرعت بالای ساخت درخت ایجاد شده است. این امر موجب کاهش پیچیدگی محاسباتی و افزایش سرعت اجرای مدل شده است که در کاربردهای واقعی، به‌ویژه در مواجهه با داده‌های حجیم، از اهمیت بالایی برخوردار است.