1403/02/31
علی ریحانیان

علی ریحانیان

مرتبه علمی: استادیار
ارکید: https://orcid.org/0000-0001-6668-3535
تحصیلات: دکترای تخصصی
اسکاپوس: 57188693204
دانشکده: دانشکده فنی مهندسی
نشانی: دانشگاه اراک - دانشکده فنی و مهندسی - گروه مهندسی کامپیوتر
تلفن: 086-32625436

مشخصات پژوهش

عنوان
ارائه ی یک جداساز کلمات با استفاده از عبارات باقاعده
نوع پژوهش
مقاله ارائه‌شده
کلیدواژه‌ها
جداساز، پیکره، عبارات باقاعده، جایگزینی، پردازش زبان طبیعی
سال 1396
پژوهشگران علی ریحانیان ، محمد رضا فیضی درخشی ، علیرضا فیضی درخشی ، میرعرفان غیبی

چکیده

این مقاله، به ارائه و تجزیه و تحلیل یک جداساز کلمات می پردازد. این جداساز با استفاده از عبارات باقاعده به جداسازی کلمات موجود در مجموعه ای از نوشته جات می پردازد. در واقع، بنیان این جداساز بر استفاده از قابلیت جایگزینی در عبارات باقاعده بنا نهاده شده است. جداساز پیشنهادی این مقاله، می تواند کلمات فارسی، انگلیسی، علائم و ... را تشخیص داده و به خوبی از عهده ی جداسازی آن ها برآید. در فرایند پردازش یک متن، برخورد با عباراتی که متفاوت از حالت معمول باشند، امری اجتناب ناپذیر است. در فرایند پیاده سازی این جداساز، سعی شد که حتی الامکان، کلمات به خوبی جداسازی شده و تعداد تکرار آنها مشخص شوند. خروجی که این جداساز به یک کاربر خواهد داد، شامل متن مورد پردازش، کلمات موجود در متن به صورت جدا شده و با تکرار (Words)، تعداد کلمات موجود در متن، کلمات موجود در متن بدون تکرار (Vocabulary)، تعداد کلمات بدون تکرار و در نهایت لیستی شامل هر لغت به همراه تعداد تکرار آن در متن مورد نظر خواهد بود. این لیست، یکبار بر روی لغات و بار دیگر بر روی تعداد تکرار مرتب خواهد بود.