|
عنوان
|
استفاده از الگوریتم شباهت رشته جهت اجتناب از تله در خزنده های وب
|
|
نوع پژوهش
|
پایان نامه های تقاضا محور و غیر تقاضا محور
|
|
کلیدواژهها
|
تشخیص اسناد تقریباً یکسان، وب معنایی، خزنده وب، الگوریتم شباهت رشته
|
|
چکیده
|
خزنده های وب جزئ جدایی ناپذیر دنیای اینترنت بوده و به صورت مداوم در حال خزش بین سایتهای اینترنتی و جمع آوری اطلاعات موجود در آنها می باشند. از طرف دیگر، بخش قابل توجهی از صفحات وبرا محتوای تکراری تشکیل داده است. تشخیص اسناد و صفحات تقریبا یکسان یکی از الگوریتم های پرکاربرد در زمینه خزنده های وب می باشد.
|
|
پژوهشگران
|
احسان منصوری (استاد راهنما)، احمد بادکوبه ای (دانشجو)
|