وب‌کاوی برای پیش‌بینی رفتار پیمایشی كاربر

در سال های اخیر مسئله مدل كردن و پیش بینی رفتار پیمایشی كاربر بر روی سایت های اینترنتی به دلیل رشد سریع وب جهانی توجه بسیاری از محققان را بخود جلب كرده است. مدل های ماركوف بصورت گسترده ای برای بررسی فرایندهای تصادفی مورد استفاده قرار گرفته اند و در زمینه مدل كردن و پیش بینی رفتار پیمایشی كاربر در سایت های اینترنتی كاربردهای فراوانی دارند. مدل های ماركوف با مرتبه پایین تر عموماً دقت كمتری برای پیش بینی رفتار پیمایشی كاربر دارند و بدین دلیل بیشتر از مدل های ماركوف با مرتبه بالاتر استفاده می شود. اما مدل های ماركوف مرتبه بالاتر محدویت هایی نیز دارند از جمله پیچیدگی بالا(تعداد حالت های زیاد)، پوشش كمتر و حتی گاهی دقت پیش بینی پایین تر. یك روش ساده برای غلبه بر برخی از این مشكلات بكارگیری مرتبه های مختلف مدل ماركوف و استفاده از همه آنها در فاز پیش بینی است. اما این روش پیچیدگی را افزایش می دهد. برای حل این مشكل در این مقاله تكنیكی ارائه میشود كه مدلهای ماركوف با مرتبه های متفاوت را به گونه ای با هم تركیب كرده كه از پیچیدگی پایین تری برخوردار است و در عین حال پوشش و دقت پیش بینی ای كه با استفاده از همه مرتبه های مدل ماركوف بدست می آمد را حفظ می كند. در واقع در این تكنیك بسیاری از حالت های متعلق به مرتبه های متفاوت مدل ماركوف بدون تاثیر بر كارایی كلی حذف می شوند. برای هرس كردن حالت ها از همه مرتبه های مدل ماركوف از خطای مربوط به هر حالت استفاده شده است. برای تخمین زدن خطای مربوط به هر حالت از یك مجموعه اعتبار سنجی استفاده كرده ایم و یك حالت از مرتبه بالاتر در صورتی هرس می شود كه میزان خطای مربوط به آن در مقایسه با میزان خطای حالت های مشابه از مرتبه های پایین تر بیشتر باشد.