|
عنوان
|
پردازش کلان داده با استفاده از خوشه بندی DBSCAN مبتنی بر جستجوی بهینه پارامترها در نظریه بازیها
|
|
نوع پژوهش
|
پایان نامه های تقاضا محور و غیر تقاضا محور
|
|
کلیدواژهها
|
الگوریتمDBSCAN، پردازش کلان داده، خوشه بندی، جستجو بهینه، نظریهبازیها.
|
|
چکیده
|
در دنیای امروز، دادهها در حوزههایی مانند کسبوکار، علوم، صنعت و کنترل ترافیک نقشی حیاتی دارند. حجم عظیم و سرعت بالای تولید دادهها منجر به شکلگیری مفهوم کلانداده شده است که بهعنوان یک منبع ارزشمند برای سازمانهای مختلف شناخته میشود. این دادهها به دلیل حجم بالا، سرعت تولید زیاد و تنوع گسترده نیازمند پردازشهایی متفاوت از دادههای سنتی هستند. با توجه به اینکه بسیاری از روشهای پردازش سنتی بر پایه معماریهای متمرکز طراحی شدهاند، برای تحلیل کلان دادهها کارآمد نیستند و ممکن است موجب افزایش هزینهها، کاهش کیفیت پردازش و کاهش کارایی سیستمها شوند. از اینرو، توسعه الگوریتمهای بهینه برای پردازش کلان دادهها به یکی از چالشهای اساسی در سیستمهای مدرن تبدیل شده است. خوشهبندی یکی از روشهای کلیدی برای تحلیل و پردازش دادهها است که در استخراج دانش و بهبود درک از دادهها نقش مؤثری ایفا میکند. بهویژه، خوشهبندی مبتنی بر چگالی به دلیل توانایی در شناسایی خوشههایی با اشکال و اندازههای مختلف، مقاومت در برابر نویز و سادگی اجرا برای پردازش کلان دادهها مورد توجه قرار گرفته است. الگوریتم DBSCAN بهعنوان یک روش پایه در این حوزه، قابلیت بالایی در کشف خوشههای دادهای دارد، اما با چالشهایی نظیر وابستگی به تنظیمات دستی پارامترها (EPS و MinPts)، مدیریت خوشههایی با تراکم متغیر و کاهش کارایی در کلان داده مواجه است. روشهای سنتی تنظیم پارامتر، مانند آزمون و خطا، زمانبر و پرهزینه هستند و در دادههای پیچیده و متراکم نتایج مطلوبی ارائه نمیدهند. در این رساله، بهمنظور حل این چالشها، رویکردهایی مبتنی بر نظریه بازیها برای تنظیم بهینه پارامترهای خوشهبندی ارائه شدهاند. با مدلسازی تعامل بین الگوریتم و دادهها بهعنوان یک بازی ریاضی، تنظیمات پارامتری بهصورت سیستماتیک و هدفمند بهینهسازی شدهاند. این فرآیند موجب دستیابی به تعادلی مشابه تعادل نش شده و منجر به بهبود کیفیت خوشهبندی، افزایش سرعت پردازش و ارتقای کارایی الگوریتم شده است. روشهای پیشنهادی نهتنها مقیاسپذیر هستند، بلکه امکان دستیابی به نتایج دقیقتر و معنادارتر را در تحلیل کلان دادهها فراهم میکنند. نتایج آزمایشات نشان میدهند که رویکردهای پیشنهادی، در مقایسه با روشهای سنتی تنظیم پارامتر، عملکرد بهتری در پردازش کلان دادهها دارند. انعطافپذیری تنظیمات ورودی موجب افزایش دقت در شناسایی خوشهها و کاهش تأثیر نویز شده است. همچنین، این روشها می توانند سرعت پردازش دادههای حجیم و متراکم را بهبود دهند. در مقایسه با سایر الگوریتمهای خوشهبندی، نتایج نشاندهنده برتری رویکردهای پیشنهادی و پتانسیل قابل توجه آن در کاربردهای علمی و صنعتی است. این دستاوردها گامی مهم در راستای توسعه روشهای پیشرفته پردازش کلان دادهها محسوب میشوند.
|
|
پژوهشگران
|
سیف اله سلیمانی (استاد راهنما)، اورانوس کاظمی (دانشجو)
|