وب کاوی (Web Mining) کاربرد تکنیک های داده کاوی برای شناسایی الگوها در وب است. وب کاوی با زمینه های مختلف تحقیقاتی علوم کامپیوتر همچون داده کاوی، پایگاه داده، بازیابی اطلاعات، هوش مصنوعی، یادگیری ماشین، پردازش زبان طبیعی، استخراج اطلاعات، انبار داده ها ، طراحی واسط کاربر و … در ارتباط تنگاتنگ است.

وب کاری شامل چهار مرحله است:

  • پیدا کردن منبع: این مرحله شامل بازیابی اسناد وب مورد نظر است.
  • انتخاب اطلاعات و پیش پردازش: در این مرحله به صورت خودکار اطلاعات خاصی از اسناد بازیابی شده، انتخاب و پیش پردازش می شوند
  • تعمیم : در این مرحله به صورت خودکار الگوهای عام در یک یا چندین سایت وب کشف می شود.
  • تحلیل: در این مرحله الگوهای به دست آمده در مرحله قبل اعتبار سنجی و تفسیر میشوند.