سامانه پژوهشی دانشگاه اراک | بررسی عملکرد الگوریتم های یادگیری ماشین در تشخیص نویسه های اعداد فارسی

عنوان	بررسی عملکرد الگوریتم های یادگیری ماشین در تشخیص نویسه های اعداد فارسی
نوع پژوهش	مقاله ارائه‌شده
کلیدواژه‌ها	رگرسیون لجستیک چند جمله ای، ماشین بردارپشتیبان ، الگوریتم جنگل تصادفی، OCR
چکیده	در این مقاله پردازش تصاویر نویسه های اعداد فارسی با هدف تشخیص نوری نویسه ها (OCR) با سه الگوریتم یادگیری ماشین شامل رگرسیون لجستیک چندجمله ای، ماشین بردار پشتیبان، و جنگل تصادفی صورت گرفته است. هدف اصلی یافتن مدل بهینه از نظر دقت و زمان پردازش و نیز بررسی اثر کاهش بُعد و انتخاب ویژگی بر عملکرد الگوریتم های مورد استفاده است. در این مقاله دو روش کاهش بُعد تحلیل مولفه های اصلی و تحلیل تناظر چندمتغیره با تعداد مولفه های متفاوت و یک الگوی انتخاب ویژگی و جمعا 30 مدل مختلف مورد بررسی قرار گرفته و مدل ها بر حسب دقت پیش بینی روی مجموعه داده های آزمایش و زمان مورد نیاز برای پیش بینی ارزیابی شده اند. با بررسی بعمل آمده برترین عملکرد مربوط به الگوریتم ماشین بردارپشتیبان با انتخاب ویژگی و کاهش بُعد تحلیل مولفه های اصلی است.
پژوهشگران	سید جمال میرکمالی (نفر سوم)، محراب عتیقی (نفر اول)، آتوسا رستمی (نفر دوم)

مشخصات پژوهش