در دنیای امروز اینترنت، لاگ فایلها به سرعت با نرخ یک تا ده مگابایت بر ثانیه تولید میشوند، تنها یک مرکز داده میتواند دهها ترابایت از لاگ فایل را در طول یک روز تولید کند؛ بنابراین در سالهای اخیر کلان داده که اصطلاحی برای توصیف حجم زیاده دادهی تولیدشده توسط منابع دیجیتال و اینترنتی است، ظهور کرد. امروزه بهمنظور بهبود کسبوکار آنلاین، تبلیغات و فروش، تحلیل لاگ فایل، به یک اقدام ضروری برای پیشبینی رفتار مشتری تبدیلشده است. برای هر سازمانی، کاوش و تحلیل کلان داده، بینش غنی و عمیقتر الگوها و روند کسبوکار را به ارمغان میآورد. در این پایاننامه یک تحلیلگر رفتار مشتری در کسبوکار آنلاین با استفاده از تحلیل کلان داده ارائه میشود. این تحلیلگر با استفاده از یک الگوریتم پیشپردازش جامع برای استخراج اطلاعات پنهان در لاگ فایل توسعه مییابد. بهمنظور تحلیل، پیشبینی و کشف دانش، کاربرد کاوی وب و ابزار تحلیلی هدوپ مورداستفاده قرار میگیرد . در آخر یک مطالعهی موردی با استفاده از این تحلیلگر به ردیابی و تحلیل فعالیتهای کاربران پرداخته و در به دست آوردن بینش بهتر، درک و تصمیمگیری سریع، به صاحبان کسبوکار کمک مینماید.