خوشه بندی اسناد متنی با استفاده از الگوریتم های تکاملی

مشخصات پژوهش

عنوان	خوشه بندی اسناد متنی با استفاده از الگوریتم های تکاملی
نوع پژوهش	پایان نامه های تقاضا محور و غیر تقاضا محور
کلیدواژه‌ها	محاسبات تکاملی، روش های خوشه بندی، خوشه بندی متن، جبهه ی پارتو، بهینه سازی چند هدفه
سال	1402
پژوهشگران	مریم امیری(استاد راهنما)، محمد نادری(دانشجو)

چکیده

در عصر دیجیتال، میلیون ها کاربر اینترنت حجم عظیمی از داده های متنی بدون ساختار را تولید می کنند. امروزه سازماندهی این داده ها به دلیل دانش و اطلاعات موجود در آنها، یک کار ضروری محسوب می شود. خوشه بندی در داده کاوی یکی از ابزارهای قدرتمند است که می توان برای این منظور مهم از آن استفاده کرد. اکثر الگوریتم های خوشه بندی متن تنها از یک معیار برای بهینه سازی استفاده می کنند، که اغلب در یافتن راه حل های خوشه بندی خوب برای طیف گسترده ای از مجموعه داده ها با معیار های خوشه بندی متفاوت، با مشکل مواجه می شوند و نمی توانند خوشه های با کیفیت را تولید کنند. در رویکرد های اخیر، روش های فراابتکاری چند هدفه برای خوشه بندی بهینه با به حداکثر رساندن )یا حداقل کردن( بیش از یک تابع هدف، استفاده می شوند و خوشه هایی با کیفیت بالاتر را تولید می کنند. بنابراین با تبدیل مسئله خوشه بندی به یک مسئله بهینه سازی چند هدفه به جای یک هدف، می توانیم راه حل هایی با دقت بالاتر نسبت به بهینه سازی یک هدفه داشته باشیم. در این پایان نامه یک الگوریتم بهینه سازی چند هدفه الهام گرفته شده از طبیعت، برای حل مسئله خوشه بندی متن و کاهش چالش های این نوع از خوشه بندی، Multi-objective Firefly Differential evolution Jaya Optimization (MFDJ) با نام ارائه می شود. روش پیشنهادی از ترکیب چند الگوریتم مهم تشکیل شده است، الگوریتم NSGA-IIکه در بسیاری از الگوریتم های چند هدفه به عنوان الگوریتم پایه شناخته شده، الگوریتم هوش ازدحامی بنام ،Fireflyکه سازگاری و انعطاف پذیری بالایی در مقابل انواع مسائل بهینه سازی خصوصا مسائل بهینه سازی چند هدفه دارد، الگوریتم Differential Evolutionکه قدرتمند ترین استراتژی های جهش را دارد و الگوریتم Jayaکه برخلاف بسیاری از الگوریتم ها اولاً با بهره گیری از بدترین افراد جمعیت مسئله بهینه سازی را پوشش می دهد، ثانیاً هیچ وابستگی خاصی به پارامتر های کنترلی ندارد. ترکیب این الگوریتم ها با یکدیگر در کنار کنترل سرعتِ تغییرات در تکرار های بالا و همچنین استفاده از الگوریتم NSGA-IIبه عنوان یک الگوریتم پایه در روش پیشنهادی موجب شد که MFDJدر حل مسئله خوشه بندی متن، سرعت همگرایی و دقت بالاتری را ارائه دهد. ارزیابی ها روی ۸مجموعه داده معروف از داد ه های LABICنشان می دهند که روش پیشنهاد

مریم امیری

مشخصات پژوهش

چکیده