1404/09/14
سیف اله سلیمانی

سیف اله سلیمانی

مرتبه علمی: دانشیار
ارکید: https://orcid.org/0000-0002-5541-8768
تحصیلات: دکترای تخصصی
شاخص H:
دانشکده: دانشکده فنی مهندسی
اسکولار:
پست الکترونیکی: s-soleimani [at] araku.ac.ir
اسکاپوس: مشاهده
تلفن:
ریسرچ گیت:

مشخصات پژوهش

عنوان
پردازش کلان داده با استفاده از خوشه بندی DBSCAN مبتنی بر جستجوی بهینه پارامترها در نظریه بازی‌ها
نوع پژوهش
پایان نامه های تقاضا محور و غیر تقاضا محور
کلیدواژه‌ها
الگوریتمDBSCAN، پردازش کلان داده، خوشه بندی، جستجو بهینه، نظریه‌بازی‌ها.
سال 1404
پژوهشگران سیف اله سلیمانی(استاد راهنما)، اورانوس کاظمی(دانشجو)

چکیده

در دنیای امروز، داده‌ها در حوزه‌هایی مانند کسب‌وکار، علوم، صنعت و کنترل ترافیک نقشی حیاتی دارند. حجم عظیم و سرعت بالای تولید داده‌ها منجر به شکل‌گیری مفهوم کلان‌داده شده است که به‌عنوان یک منبع ارزشمند برای سازمان‌های مختلف شناخته می‌شود. این داده‌ها به دلیل حجم بالا، سرعت تولید زیاد و تنوع گسترده نیازمند پردازش‌هایی متفاوت از داده‌های سنتی هستند. با توجه به اینکه بسیاری از روش‌های پردازش سنتی بر پایه معماری‌های متمرکز طراحی شده‌اند، برای تحلیل کلان داده‌ها کارآمد نیستند و ممکن است موجب افزایش هزینه‌ها، کاهش کیفیت پردازش و کاهش کارایی سیستم‌ها شوند. از این‌رو، توسعه الگوریتم‌های بهینه برای پردازش کلان داده‌ها به یکی از چالش‌های اساسی در سیستم‌های مدرن تبدیل شده است. خوشه‌بندی یکی از روش‌های کلیدی برای تحلیل و پردازش داده‌ها است که در استخراج دانش و بهبود درک از داده‌ها نقش مؤثری ایفا می‌کند. به‌ویژه، خوشه‌بندی مبتنی بر چگالی به دلیل توانایی در شناسایی خوشه‌هایی با اشکال و اندازه‌های مختلف، مقاومت در برابر نویز و سادگی اجرا برای پردازش کلان داده‌ها مورد توجه قرار گرفته است. الگوریتم DBSCAN به‌عنوان یک روش پایه در این حوزه، قابلیت بالایی در کشف خوشه‌های داده‌ای دارد، اما با چالش‌هایی نظیر وابستگی به تنظیمات دستی پارامترها (EPS و MinPts)، مدیریت خوشه‌هایی با تراکم متغیر و کاهش کارایی در کلان داده مواجه است. روش‌های سنتی تنظیم پارامتر، مانند آزمون و خطا، زمان‌بر و پرهزینه هستند و در داده‌های پیچیده و متراکم نتایج مطلوبی ارائه نمی‌دهند. در این رساله، به‌منظور حل این چالش‌ها، رویکردهایی مبتنی بر نظریه بازی‌ها برای تنظیم بهینه پارامترهای خوشه‌بندی ارائه شده‌اند. با مدل‌سازی تعامل بین الگوریتم و داده‌ها به‌عنوان یک بازی ریاضی، تنظیمات پارامتری به‌صورت سیستماتیک و هدفمند بهینه‌سازی شده‌اند. این فرآیند موجب دستیابی به تعادلی مشابه تعادل نش شده و منجر به بهبود کیفیت خوشه‌بندی، افزایش سرعت پردازش و ارتقای کارایی الگوریتم شده است. روشهای پیشنهادی نه‌تنها مقیاس‌پذیر هستند، بلکه امکان دستیابی به نتایج دقیق‌تر و معنادارتر را در تحلیل کلان داده‌ها فراهم می‌کنند. نتایج آزمایشات نشان می‌دهند که رویکردهای پیشنهادی، در مقایسه با روش‌های سنتی تنظیم پارامتر، عملکرد بهتری در پردازش کلان داده‌ها دارند. انعطاف‌پذیری تنظیمات ورودی موجب افزایش دقت در شناسایی خوشه‌ها و کاهش تأثیر نویز شده است. همچنین، این روش‌ها می توانند سرعت پردازش داده‌های حجیم و متراکم را بهبود دهند. در مقایسه با سایر الگوریتم‌های خوشه‌بندی، نتایج نشان‌دهنده برتری رویکردهای پیشنهادی و پتانسیل قابل توجه آن در کاربردهای علمی و صنعتی است. این دستاوردها گامی مهم در راستای توسعه روش‌های پیشرفته پردازش کلان داده‌ها محسوب می‌شوند.