1403/02/24
مریم مومنی

مریم مومنی

مرتبه علمی: استادیار
ارکید: https://orcid.org/0000-0002-2548-1619
تحصیلات: دکترای تخصصی
اسکاپوس: 55959639000
دانشکده: دانشکده فنی مهندسی
نشانی: دانشگاه اراک- دانشکده فنی و مهندسی- گروه مهندسی برق
تلفن:

مشخصات پژوهش

عنوان
تشخیص احساس سیگنال گفتار با استفاده از ویژگیهای فرکانسی-زمانیو الگوریتمهای یادگیری عمیق
نوع پژوهش
پایان نامه های تقاضا محور و غیر تقاضا محور
کلیدواژه‌ها
تشخیص احساس،یادگیری عمیق، کتابخانه کراس، کتابخانه تنسرفلو، شبکه عصبی عمیق
سال 1400
پژوهشگران رسول مومنی زاده(دانشجو)، مریم مومنی(استاد راهنما)

چکیده

تشخیص احساسات گفتاری یکی ازچالش برانگیزترین کارهادرحوزه تجزیه وتحلیل سیگنال گفتار است،این یک چالش حوزه تحقیقاتی است که سعی میکنداحساسات را ازسیگنالهای گفتاری استنباط کند. دقت در تشخیص احساساتی اعم از شادی، غم، ترس، عصبانیت و آرامش بین زنان و مردان بویژه درزمانیکه سیگنالهای صدا دارای سر و صدا و نویز پس زمینه است و یا احساسات در گفتار بدرستی و باشفافیت منعکس نمیشود،کارپیچیده ای میباشد. یک شبکه عصبی پیچیده (کانولوشنال) تحت نظارت عمیق برای طبقه بندی هر احساس در صداهای جمع آوری شده آموزش دیده است.با بهره گیری از کتابخانه لیبروسا برای پیش پردازش و کتابخانه تنسرفلو و کراس لایه های متعدد در محیط Google Colab برای مدل شکل گرفته است. مجموعه با تعداد 2Actor متشکل از صداهای زنان و مردان با احساسات مختلف جمعآوری شده ازبانک PESD مورد آزمایش قرار میگیرد. در آخر بخش مهم اجرای مدل شبکه عصبی پیچیده (کانولوشنال) و تست مدل است که با اندازه گیری متریک دقت و استفاده از نوآوری پشته سازی می توان به میزان دقت در مدل واقف شد.