وبکاوی اشاره به کلیه فعالیتهای دادهکاوی و فنون وابسته دارد که برای کشف خودکار و استخراج دانش از اسناد و خدمات وب بهکار میروند. در پس منابع عظیم اطلاعتی وب گاهها اطلاعات ساختاری و داده های موجود در وب و سرورهای آن دانشی نهفته است که دسترسی به آن در حالت عادی کاری دشوار است ضمن آنکه دانش برای کاربران، مدیران و ادارهکنندگان محیط وب بسیار مفید است. وبکاوی و فنون وابسته به آن امکان کشف و شناسایی این دانش پنهان را میسر ساخته اند. بر حسب انواع کارکردها، وبکاوی شامل سه روش است که عبارتند از: کاوش محتوای وب، کاوش ساختار وب، کاوش کاربرد وب.