سمینار آشنایی با نرم افزار Rapid Miner و زبان R در علم داده

سمینار آشنایی با نرم افزار Rapid Miner و زبان R در علم داده

مرکز دانش مدیریت ارتباط با مشتری (مدام) با تدریس دکتر فرشید عبدی و دکتر شقایق مکارم برگزار شد.؛

سمینار آشنایی با نرم افزار RapidMiner و زبان R در علم داده


به همت مرکز دانش مدیریت ارتباط با مشتری (مُدام) و با حضور علاقمندان و متخصصان علم داده و تحلیل داده ها، سمینار آشنایی با نرم افزاررپیدماینر (rapidminer)  و زبان R در علم داده با تدریس دکتر فرشید عبدی و دکتر شقایق مکارم  برگزار شد.

در این سمینار که در روز یکشنبه ششم مرداد ماه برگزار شد، دکتر فرشید عبدی، موسس و مدیر مرکز دانش مدیریت ارتباط با مشتری (مُدام) و عضو هیات علمی دانشگاه به موضوع افزایش حجم داده های در دسترس از مشتریان در بسیاری از سازمان و حوزه ها همانند بانک ها، بیمه ها، حوزه های مالی و بورس، شبکه های خدمات درمانی، استارت آپ ها و …. اشاره کرد و گفت: سوال بسیاری از کسب و کارها این است که از داده های جمع آوری شده از مشتریان به چه نحوی می توان استفاده کرد؟

فرشید عبدی به موضوع مدیریت ارتباط با مشتری عملیاتی پرداخت و افزود: در بخش عملیاتی از CRM اطلاعات مشتریان ثبت و فرآیندها مورد بررسی قرار می گیرند و در بخش تحلیلی از مدیریت ارتباط با مشتری با استفاده از هوش کسب و کار و داده کاوی به استخراج اطلاعات، انجام پیش بینی، استخراج الکوها و روندها و ارائه توصیه های سفارشی پرداخته می شود و بر اساس بینش استخراج شده از تحلیل داده ها به تصمیم گیری پرداخته می شود.

وی در ادامه گفت: علم داده یک زمینه بین‌رشته‌ای است که از روش‌ها و فرآیندهای علمی برای استخراج بینش از داده‌ها استفاده می‌کند و داده کاوی به خلاصه کردن روابط موجود در مجموعه داده‏ها و قابل استفاده برای  صاحبان داده اشاره دارد و داده کاوی را می توان زیرمجموعه ای از علم داده دانست که خروجی آن به صورت استخراج الگو و مدل های پیش بینی رفتار است و اغلب با داده های ساختار یافته سرو کار دارد اما علم داده با داده های پیچیده تر و ساختار یافته و بدون ساختار سروکار دارد.

در ادامه این سمینار دکتر شقایق مکارم به روش CRISP-DM به عنوان یک استاندارد برای اجرای پروژه های بزرگ داده کاوی اشاره کرد و با تشریح مراحل شش گانه اجرای پروژه های داده کاوی بر طبق فرایند کریسپ گفت: در مرحله درک فضای کسب و کار، اهداف کسب و کار مشخص می شوند، به ارزیابی وضعیت کسب و کار پرداخته می شود، اهداف داده کاوی تعیین می شوند و در نهایت برنامه اجرای پروژه تدوین می شود. در مرحله دوم از کریسپ باید به درک داده ها پرداخته شود و این مرحله با جمع آوری داده ها آغاز می شود و از این رو حضور یک متخصص پایگاه داده در تیم اجرای پروژه مورد نیاز می باشد. مرحله آماده سازی از مهم ترین مراحل اجرای پروژه های داده کاوی است که زمان زیادی را در پروژه های داده کاوی به خود اختصاص می دهد. در مرحله مدلسازی می توان از تکنیک های مختلفی اعم از تکنیک های با نظارت، بدون نظارت و کشف قوانین انجمنی بهره برد.

این سمینار با معرفی ابزارها و زبان های تحلیل داده ها مانند  Phython، R، Oracle data mining، Kinme، Orange، SAS، IBM Modeler و RapidMiner ادامه یافت و از این بین نرم افزار رپیدماینر (rapidminer)  و زبان R مورد بررسی بیشتر قرار گرفتند و قابلیت ها و ویژگی های این دو ابزار برای اجرای پروژه های داده کاوی مورد اشاره قرار گرفت و مزایا و معایبشان مورد بحث و بررسی قرار گرفت و گفته شد: نرم افزار رپیدماینر (rapidminer) برای انجام پردازش های سریع و مسائل کابردی کسب و کارها یک نرم افزار فوق العاده است. رابط کاربری گرافیکی و کاربر پسند این نرم افزار از دیگر نقاط قوت آن محسوب می شود و یادگیری این نرم افزار زمان زیادی را لازم ندارد. از دیگر نقاط قوت این نرم افزار وجود مجموعه ی کاملی از اپراتورها برای اجرای مراحل مختلف پروژه داده کاوی از جمله درک داده ها، مصورسازی داده ها، پاکسازی داده ها، پیش پردازش داده ها و مدلسازی از نوع رده بندی، پیش بینی، خوشه بندی و کشف قوانین انجمنی است.

همچنین قابلیت  انجام تبدیلات مختلف بر روی داده ها، یکپارچه سازی داده ها و فیلترینگ داده ها بدون نیاز به برنامه نویسی و قابلیت متن کاوی و وب کاوی بدون نیاز به برنامه نویسی و با استفاده از اپراتورها از دیگر نقاط قوت این نرم افزار محسوب می شود. همچنین از معایب نرم افزار رپیدماینر، محدودیت رکورد در نسخه رایگان آن است و توانایی تغییر در الگوریتم ها در این نرم افزار وجود ندارد و تعداد روش های آماری در این نرم افزار در مقایسه با زبان R بسیار محدودتر است. زبان R برای انجام محاسبات آماری و تجزیه و تحلیل های آماری ابزاری فوق العاده است.

در ادامه نیز دو مثال کاربردی کوتاه از مدل های رده بندی با درخت تصمیم و خوشه بندی در نرم افزار رپیدماینر (rapidminer) و زبان R و بکارگیری این مدل ها ارائه و مورد تحلیل قرار گفت.

در پایان این سمینار به سوالات شرکت کنندگان پاسخ داده شد.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

Time limit exceeded. Please complete the captcha once again.

سوالی دارید؟ با ما صحبت کنید!
مکالمه را شروع کنید
سلام! برای چت در WhatsApp پرسنل پشتیبانی که میخواهید با او صحبت کنید را انتخاب کنید