سامانه پژوهشی دانشگاه اراک | کاربرد الگوریتم یادگیری تقویتی در بهینه سازی کنترل کننده فعال سازه

عنوان	کاربرد الگوریتم یادگیری تقویتی در بهینه سازی کنترل کننده فعال سازه
نوع پژوهش	پایان نامه های تقاضا محور و غیر تقاضا محور
کلیدواژه‌ها	الگوریتم یادگیری تقویتی، تخمین کیو، کنترل فازی
چکیده	در این پایان نامه برای اولین بار از الگوریتم سارسا به جهت انتخاب قوانین یک کنترل کننده فازی تناسبی مشتق گیر با حضور یک زلزله نماینده در کنترل سازه استفاده شده است. در سیستم میراگر جرمی فعال طراحی شده، کنترلر ناظر فازی نقش تنظیم ضرایب کنترلر تناسبی مشتق گیر را بر عهده دارد. در این پایان نامه از دو روش جدید به طور هم زمان در بهبود سرعت همگرایی الگوریتم یادگیری تقویتی استفاده شده است در روش اول الگوریتم به یادگیری تغییرات ماتریس کیو بر اساس حالت ها و عمل ها و اغتشاش می پردازد و ماتریس کیو را از مقادیر جدید پیش رو آگاه می کند و در روش دوم از یک رابطه بازگشتی در جهت تخمین ماتریس کیو استفاده شده و با هر بار تخمین ماتریس کیو از مقدار خطا تخمین می کاهد. علاوه بر موارد فوق در روش پیشنهادی برای اولین بار اغتشاش در کنار حالت و عمل ها به عنوان یک عامل مؤثر مدنظر قرارگرفته است. همچنین برای اولین بار به جهت افزایش کارآمدی کنترلر آموزش دیده، ورودی اغتشاش به عنوان ورودی سوم در کنار خطا و تغییرات خطا استفاده شد تا کنترلر در رفع اغتشاش پیش رو موفق باشد. نتایج نشان دهنده کارآمدی روش های پیشنهادی در مرحله یادگیری از جهت سرعت همگرایی و بهبود پاسخ هستند. در انتها کنترلر طراحی شده بر روی سازه ی آزمایشگاهی که بر اساس مدل آن آموزش دیده است، پیاده سازی شد و درستی نتایج به دست آمده تأیید شد.
پژوهشگران	مهدی سلیمانی (استاد راهنما)، آرش خلعتبری (دانشجو)

مشخصات پژوهش