تحلیل داده به مجموعه فرآیندهایی جهت:
- ارزیابی
- صحت سنجی
- انتقال داده ها
- پاکسازی
- یکپارچه سازی
- تجمیع و تلفیق داده ها
- مدلسازی دادهها
جهت کشف دانش و بینش ارزشمند، برای تصمیمگیری در کسبوکار اطلاق می شود.هدف از تحلیل دادهها، استخراج اطلاعات مفید از دادهها، و بهبود فرآیندهای تصمیمگیری و خلق ارزش های جدید، می باشد. تصمیمگیریهای گذشته نگر و آینده نگر، توصیفی و تجویزی، نمونه هایی دیگر از تحلیل دادهها هستند.
امروزه با گسترش استفاده از زبان پایتون، شاهد افزایش رویکردهای تحلیلی در سطح سازمانی هستیم. اکثر سازمانهای داده محور از انواع مختلف الگوریتم های:
- داده کاوی
- یادگیری ماشین
- یادگیری عمیق
- تحلیل کلان داده
در تصمیم گیری ها، ایجاد دانش های جدید و ایجاد مزیت های رقابتی جدید، بهره می برند. این نتایج را می توان در پیش بینی آینده و ترندها، تخمین ها، توصیه گری های عملیاتی و محاسبات داینامیک در کسب و کار استفاده کرد.
اغلب برای تحلیل داده ها، نیاز به استقرار انبار داده، دریاچه داده، پلتفرم ذخیر سازی داده، پلتفرم های یکپارچه رویکردهای تحلیلی(Analytics) می باشد. تیم داده سازمان، با توجه به پتانسیل های داده ای سازمان، بودجه ها و امکانات، با برون سپاری یا درون سپاری، نظام داده محوری در سازمان را توسعه می دهند. البته مسئولیت تیم داده سازمان، افزایش سواد داده ای کارکنان، افزایش فرهنگ استفاده از داده ها، و مدیریت تکنولوژی در حوزه داده نیز خواهد بود. همچنین توسعه تصمیم سازی داده محور، هوشمندسازی فرآیندهای عملیاتی نیز در دستور کار، تیم داده خواهد بود.
هوش تجاری و تحلیل داده ها:
امروزه سامانه های هوش تجاری با هدف تجمیع و تحلیل داده ها بسیار مورد توجه قرار گرفته اند. هرچند سامانه های BI بیشتر گذشته نگر می باشند، ولی در رهیافت های جدید از پلتفرم های تحلیلی و پیش گویانه هم در کنار آنها استفاده می شود. در اغلب موارد سامانه های هوشمندی کسب و کار، با سامانه های پردازش کلان داده و پردازش جریانی داده ها، نیز در ارتباط هستند. همچنین حوزه فعالیت سامان های BI، از داده های سازمانی فراتر رفته و تحلیل داده های شبکه های اجتماعی و مالتی مدیا را نیز در برگرفته است. تا آنجا که مفاهیمی همچون Social-BI نیز صنعت نرم افزار جایگاه پیدا نموده اند.
تحلیل های آماری:
تحلیل آماری، به مطالعه، جمع آوری، تجزیه و تحلیل، تفسیر، ارائه و سازماندهی داده ها می پردازد. از آمارهای توصیفی و آمارهای استنباطی، جهت تحلیلگری و تولید دانش بسیار استفاده می شود. تا جایی که Statistical Learning یکی از مراحل مهم در تحلیل داده ها شناخته می شود. در پایتون می توان از انواع کتابخانه ها، برای اینگونه تحلیل ها استفاده کرد.
داده کاوی:
داده کاوی، روش تحلیل داده برای کشف الگوهای موجود در مجموعه های بزرگ داده با استفاده از روش های آماری، هوش مصنوعی، یادگیری ماشینی و پایگاه های داده است. هدف از این کار تبدیل داده های خام به اطلاعات تجاری قابل فهم است که ممکن است شامل شناسایی گروه های رکورد داده (تحلیل خوشه ای) یا شناسایی ناهنجاری ها و وابستگی های بین گروه های داده باشد. مواردی ار قبیل، شناسایی ناهنجاری ها، یادگیری عادت های متداول، خوشه بندی، طبقه بندی و … را می توان بعنوان پروژه های اصلی در حوزه داده کاوی دانست.
داشبوردهای مدیریتی و تعاملی:
نتایج تحلیل داده ها از روش های مختلف، اغلب بعنوان سامانه های داشبوردهای مدیریتی تعاملی، در دسترس مدسران و کارشناسان سازمانها قرار می گیرد. این داشبوردها، بر اساس KPI ها، گزارشات مهم و لحظه ای در سه سطح استراتژیک, تاکتیکی و عملیاتی ایجاد می شوند. در داشبورد ها، هدف پایش عملکردها، مانیتورینک سلامت عملکردی و پایداری خدمات می باشد.