دادهکاوی از کجا آمد و به کجا میرود ؟
هنگامی که میخواهیم برای یک نجاری در یک روستا، شروع به گردآوری داده بکنیم، شاید برای یک ماه عددی بیشتر از ۲۰ مشتری نباشد که تحلیل این مقدار از داده برای کسی که شغل دادهکاوی انجام میدهد، دشوار نیست. اما حجم دادهی شما که برای دادهکاوی مناسب است، بسیار بیشتر از این اعداد است. یک سایت فروشگاهی را در نظر بگیرید که در ماه چه مقدار داده برای ذخیره کردن دارد که از هرکدام میتوان بسیار اطلاعات و رویکرد جدید بدست آورد و ارزیابی و تحلیل کرد.
به طور کل اگر بخواهیم تعریف درستی از دادهکاوی (Data Mining) را در اختیار شما بگذاریم باید گفته شود که دادهکاوی : به مجموعهای از مراحل قابل انجام بر اساس دادههای پیچیده و کلان، با هدف کشف الگوهایی که با چشم مسلح دیده نمیشوند و نیازمند تحلیل میباشند، گفته میشود.
دادهکاوی بسیار به شناخت مشتری شما کمک میکند و در نهایت منتج به سود سازمان میشود. از آن طرف این عملیات که تماما محاسبه میباشد، هزینه زیادی دارند. هرچقدر که شناخت ما از مشتری و دادههای موجود بیشتر بشود، پیشرفت در همان حوزه روند صعودیتری را پیش میگیرند. پس باید این علم را جدی گرفت. در موارد ذیل ۲ دلیل اهمیت این دانش را بررسی میکنیم.
- رشد صعودی روزافزون دادهها در بسیاری از زمینهها
همانطور که میدانید، دادهها بسیار ارزشمند میباشند و باید به صورت جدی از آنها نگهداری کرد. هر سازمانی بعد از مدتی، تمام داراییاش، دادههایش میباشد. هرچقدر که تعداد دادهها افزایش یابد، فضایی که در آن نگهداری میشوند که به همان مقدار باید بالا برود.امروزه ذخیرهسازی با هزینهی کمتری نسبت به گذشته انجام میشود مانند فضاهای ذخیرهسازی ابری یا نامحدود.
- سرعت و قدرت پردازشگرهای رایانهای در حال افزایش میباشند
تاریخچه دادهکاوی
تا به امروز مفاهیم و کلمات زیادی برای علم دادهکاوی گذاشته شدهاست که هرکدام منظور اینکار را تا حدودی یدک میکشیدند اما به اندازه این کلمه جامع و دربرگیرنده همهچیز نبودند. کارشناسان آمار ابتدا در سال ۱۹۶۰ که هنوز اسم مرسومی وجود نداشت، اصطلاح “صید داده یا Data Fishing ” و “لایروبی داده یا Data Dredging” را برای این دانش و فرآیند در نظر گرفته بودند. تقریبا در سال ۱۹۹۰ بود که کلمهی “دادهکاوی” در بین اساتید و کارکنان این علم جا باز کرد و خیلی زود به محبوبیت رسید. هنوز هم کلمات دیگری استفاده میشود که میتواند همین منظور را تا حدودی برساند مانند : یادگیری آماری، تحلیل داده و علم داده.
چرا دادهکاوی؟
با توجه به توضیحاتی که تا کنون دادهایم، این موضوع باید فهمیده شده باشد که دادهکاوی بسیار مهم و کاربردی میباشد. پس در نتیجه باید به چشم فعالیت آیندهدار به آن نگاه کرد. دیر یا زود هر کسبوکار و سازمانی متوجه میشود که باید دادهکاوی را وارد سیستم خود کند و مقدار دادهای که استفاده چندانی از آن نمیشود، تبدیل به اطلاعات مفید شود. بعضی مواقع تنها برای اینکه سود بیشتری داشته باشیم، نیاز به دادهکاوی در سازمان حس نمیشود. کلاهبرداریهایی که ممکن است در سیستم فروش شما اتفاق بیافتد، از طریق علم داده مشخص میشود.
دادهکاوی در بسیاری از حوزهها ورود دارد. یعنی میشود گفت برای تمام کسبوکارهایی که دادههای کلانی دارند، بسیار کاربرد دارد. حوزههایی از قبیل:
- آموزش
- بازاریابی
- پزشکی
- بانکداری
- بیمه
- و ….
۲ کاربرد مهم دادهکاوی
در علم داده و کسی که دانش این موضوع را دارد، میتواند کمک بسیاری به سازمانها بکند. همانطور که گفتیم این دانش بسیار کاربردی میباشد. ۲ نمونه از دلایل اهمیت آن از قرار زیر میباشد.
- پیشبینی خودکار رفتارها و گرایشات
از علم داده برای پیشبینی کردن و انجام خودکار عملیات در پایگاه دادههای بزرگ استفاده میشود. هنگامی که در سیستم، برای پاسخگویی نیاز به تحلیل دقیق دارید، دادهکاوی راهحل کار شما میباشد. ایمیلهایی که برای تبلیغ به مشتری ارسال میشود، از همین طریق انجام میشود. شاید برای شما جالب باشد اما این علم به دلیل وسعت کارایی خود، پیشبینی ورشکستگی را در خود جای دادهاست.
- کشف خودکار الگوهای پیشتر ناشناخته
در علم داده، میتوانید الگوهای از پیش ناشناخته سیستم خود را شناسایی و تحلیل کنید. به طور مثال، تحلیل دادههای فروش خردهفروشی. بدین صورت میباشد که شناسایی در این روند، روی محصولاتی است که با یکدیگر مرتبط نیستند. در تراکنشهای کلاهبرداری در کارتهای اعتباری هم بسیار راحت میشود سرقت اطلاعات کارت مورد نظر را پیگیری کرد. این نوع تراکنشها الگوهای داده ناشناخته و جدید است.
داده های مشتری گنجی پنهان است که از طلا نیز با ارزشتر است و یکی از متداولترین ابزارهای استخراج گنج پنهان اطلاعات مشتریان، داده کاوی است.