عنوان
|
بررسی عملکرد الگوریتم های یادگیری ماشین در تشخیص نویسه های اعداد فارسی
|
نوع پژوهش
|
مقاله ارائهشده
|
کلیدواژهها
|
رگرسیون لجستیک چند جمله ای، ماشین بردارپشتیبان ، الگوریتم جنگل تصادفی، OCR
|
چکیده
|
در این مقاله پردازش تصاویر نویسه های اعداد فارسی با هدف تشخیص نوری نویسه ها (OCR) با سه الگوریتم یادگیری ماشین شامل رگرسیون لجستیک چندجمله ای، ماشین بردار پشتیبان، و جنگل تصادفی صورت گرفته است. هدف اصلی یافتن مدل بهینه از نظر دقت و زمان پردازش و نیز بررسی اثر کاهش بُعد و انتخاب ویژگی بر عملکرد الگوریتم های مورد استفاده است. در این مقاله دو روش کاهش بُعد تحلیل مولفه های اصلی و تحلیل تناظر چندمتغیره با تعداد مولفه های متفاوت و یک الگوی انتخاب ویژگی و جمعا 30 مدل مختلف مورد بررسی قرار گرفته و مدل ها بر حسب دقت پیش بینی روی مجموعه داده های آزمایش و زمان مورد نیاز برای پیش بینی ارزیابی شده اند. با بررسی بعمل آمده برترین عملکرد مربوط به الگوریتم ماشین بردارپشتیبان با انتخاب ویژگی و کاهش بُعد تحلیل مولفه های اصلی است.
|
پژوهشگران
|
سید جمال میرکمالی (نفر سوم)، محراب عتیقی (نفر اول)، آتوسا رستمی (نفر دوم)
|