تشخیص احساسات گفتاری یکی ازچالش برانگیزترین کارهادرحوزه تجزیه وتحلیل سیگنال گفتار است،این یک چالش حوزه تحقیقاتی است که سعی میکنداحساسات را ازسیگنالهای گفتاری استنباط کند. دقت در تشخیص احساساتی اعم از شادی، غم، ترس، عصبانیت و آرامش بین زنان و مردان بویژه درزمانیکه سیگنالهای صدا دارای سر و صدا و نویز پس زمینه است و یا احساسات در گفتار بدرستی و باشفافیت منعکس نمیشود،کارپیچیده ای میباشد. یک شبکه عصبی پیچیده (کانولوشنال) تحت نظارت عمیق برای طبقه بندی هر احساس در صداهای جمع آوری شده آموزش دیده است.با بهره گیری از کتابخانه لیبروسا برای پیش پردازش و کتابخانه تنسرفلو و کراس لایه های متعدد در محیط Google Colab برای مدل شکل گرفته است. مجموعه با تعداد 2Actor متشکل از صداهای زنان و مردان با احساسات مختلف جمعآوری شده ازبانک PESD مورد آزمایش قرار میگیرد. در آخر بخش مهم اجرای مدل شبکه عصبی پیچیده (کانولوشنال) و تست مدل است که با اندازه گیری متریک دقت و استفاده از نوآوری پشته سازی می توان به میزان دقت در مدل واقف شد.