استفاده از اطلاعات جهت تصمیم گیری[۲۴] موثر و بهبود مستمر
در نتیجه می توان گفت که برای تصمیم گیری موثر و صحیح در جنبه های مختلف سازمان از جمله شرکت پخش و توزیع ارومیه، چاره ای جز بهره گیری موثر از داده ها و اطلاعات حاصل از آنها نمی باشد. [۱۱]
یکی از رویکردهای آنالیز و تحلیل داده ها، رویکرد داده کاوی می باشد که به کشف دانش می پردازد. برای داده کاوی الگوریتم ها و رویه های مختلفی توسعه داده شده است. یکی از این الگوریتم ها که به خوبی می تواند تحلیل گران را در استخراج دانش از داده ها یاری رساند، الگوریتم استاندارد CRISP‐DM می باشد. از آنجایی که متدولوژی مذکور مستقل از نوع داده ها بوده و به خوبی می تواند جهت آنالیز داده ها به صورت عام مورد استفاده قرار گیرد، در این پژوهش از آن به عنوان مبنا برای آنالیز داده ها در سازمان استفاده می شود. این الگوریتم در شش مرحله قابل بیان می باشد که در ادامه به تشریح مراحل آن و فعالیت های مرتبط با آنالیز داده ها در هر مرحله پرداخته می شود. [۳۱] نمای کلی مراحل متدولوژی Crisp-DM در شکل ۱٫۲٫۳ نشان داده شده است .
شکل شماره ۱٫۲٫۳٫ نمای کلی مراحل متدولوژی Crisp – DM
۱٫۲٫۳ . درک فضای کسب و کار[۲۵]
اولین مسئله در استخراج داده ها، فهم و درک درست از مسئله و مشخص کردن هدف است. در این راه کسب اطلاعات پایه ای در مورد مسئله که باعث بهبود تاثیرات و کارایی داده کاوی می شوند اهمیت دارد. در واقع با تعریف مسئله، سوالات بحرانی و یا موضوعات مرتبط با بهبود قابلیت تصمیم سازی مشخص می شود.
این مرحله در حکم شالوده و اساس آنالیز داده ها می باشد. در این مرحله اهداف کسب و کار در زمینه آنالیز داده مشخص شده و مورد بحث و بررسی قرار می گیرند. این فاز شامل فعالیت های زیر می باشد: (شکل ۱٫۱٫۲٫۳)
تعیین اهداف تجاری
اولین هدف از آنالیز داده ها، فهم کامل از نیاز مشتری و شناسایی اهداف تجاری او می باشد. توجه به این نکته که مشتری دقیقا از انجام عملیات داده کاوی چه هدفی را دنبال می نماید اهمیت ویژه ای دارد. گاهی مشتری نیازهای عدیده ای را با شرایط متفاوت عنوان می نماید که در بسیاری از موقعیت ها نیاز به برقراری تعادل در آنهامی باشد. هدف اصلی این مرحله، در واقع شناسایی فاکتورهای ارزشمندی است که تاثیر عمیقی بر خروجی پروژه خواهد داشت.
خروجی این فاز :
پیش زمینه[۲۶] : اطلاعاتی حاصل از بررسی نوع سازمان و موقعیت استراتژیک آن در ابتدای پروژه.
اهداف سازمان[۲۷]: تعریف اهداف سازمان از دیدگاه تجاری، پرسش های مرتبط با موضوع که نشان دهنده نیاز های اولیه سازمان برای شروع پروژه می باشد.
معیار های موفقیت سازمان[۲۸]: تعریف و شناسایی معیار های موفقیت پروژه از دیدگاه تجاری.
ارزیابی موقعیت
در این مرحله از فهم فضای کسب و کار، اطلاعات جزئی تری از حقایق[۲۹] موجود، فرض های مطرح شده، منابع موجود و سایر حقایقی که در رسیدن به اهداف تجاری و برنامه ریزی پروژه موثر است، بدست می آید. در بخش قبل در واقع تعریف کلی از اهداف صورت می پذیرد و در این بخش به تشریح آنها پرداخته می شود.
خروجی این فاز :
موجودی منابع[۳۰]: تشریح منابع موجود در این پروژه که شامل افراد، داده ها، منابع سخت افزاری و نرم افزاری می باشد.
ریسک و احتمالات[۳۱]: مجموعه ریسک ها و احتمالاتی که ممکن است زمان بندی پروژه را به تعویق بیاندازد و حتی باعث شکست پروژه گردد و در کنار آن نقشه های احتمالی و پیش بینی راه حل های مقابله در صورت بروز ریسک های پر خطر.
مجموعه اصطلاحات[۳۲]: مجوعه واژگانی که در پروژه مورد استفاده قرار گرفته است، این واژگان می تواند شامل واژگان تجاری و یا داده کاوی باشد.
هزینه ها و منافع[۳۳]: پیش بینی هزینه و سود پروژه.
تعیین اهداف آنالیز داده ها:
بررسی اهداف تجاری در مراحل قبل در حیطه مفاهیم تجاری می باشد. در این مرحله به بیان اهداف پروژه از دیدگاه داده کاوی پرداخته می شود.
خروجی این فاز :
اهداف داده کاوی[۳۴]: شرح خروجی پروژه مورد نظر که امکان دستیابی به اهداف تجاری را مسیر می نماید.
تهیه برنامه و رویه های مربوط به آنالیز داده ها:
در این مرحله به تشریح برنامه زمان بندی پروژه برای دستیابی به اهداف داده کاوی پرداخته می شود. در این برنامه گام های انجام پروژه شرح داده می شود.
خروجی این فاز :
برنامه پروژه[۳۵]: شامل لیستی از گام های پروژه، منابع مورد نیاز، ورودی ها/خروجی ها و وابستگی های آن ها به یکدیگر. [۳۱]
مراحل و خروجی هر فاز در بخش درک فضای کسب و کار در شکل شماره ۱٫۱٫۲٫۳ نشان داده شده است.
شکل شماره ۱٫۱٫۲٫۳٫ مرحله فهم و درک فضای کسب و کار
۲٫۲٫۳ . شناسایی داده ها
داده ها در واقع مواد خام برای آنالیز به حساب می آیند. در این فاز به شناسایی منابع داده ها و مشخصات آنها پرداخته می شود. این مرحله با جمع آوری داده های اولیه آغاز می شود و این مسئله کمک می کند تا با فضای داده های مورد نیاز پروژه آشنایی بیشتری صورت پذیرد. این مرحله شامل فعالیت های زیر می باشد:
جمع آوری داده های اولیه
در این مرحله به داده های مرتبط به پروژه موجود در منابع سازمان دسترسی پیدا می شود. در صورتی که منابع داده ای متعددی در پروژه مورد استفاده قرار می گیرد، مجتمع سازی آنها با یکدیگر در این مرحله صورت می پذیرد.
خروجی این فاز:
گزارش جمع آوری داده های اولیه[۳۶]: در این گزارش لیست پایگاه داده های در دسترس، محل قرارگیری و موقعیت آنها و سایر نکات مرتبط با آنها بیان می شود.
تشریح و توصیف داده ها
در این مرحله به بررسی جزئی و دقیقتر داده های به دست آمده از مرحله قبل پرداخته می شود.
خروجی این فاز:
گزارش توصیف داده ها[۳۷]: در این گزارش لیست مشخصات داده های در دسترس مورد بررسی قرار می گیرد. این اطلاعات شامل مواردی مثل: فرمت داده های موجود، کمیت داده ها (برای مثال: تعداد رکورد و تعداد فیلد های موجود در هر جدول)، معرفی فیلد های جدول به صورت کامل و بررسی این که آیا این داده ها می تواند نیاز ها و اهداف پروژه را برآورده نماید.
کاوش داده ها
در این مرحله با طرح سوالات (Query)، تصویر سازی و تکنیک های گزارشگیری پیش نیاز عملیات داده کاوی انجام می شود. این سوالات شامل مواردی مثل بررسی توزیع متغیر های کلیدی، ارتباط بین متغیر های بنیادی، تجمیع سازی داده ها و تحلیل های آماری سطح بالا می باشد.
خروجی این فاز:
گزارش کاوش داده ها[۳۸]: این گزارش شامل نتایج به دست آمده در این مرحله را به صورت کامل نشان می دهد. در صورتی که نیاز باشد در این مرحله می توان با بهره گرفتن از نمودار های مختلف مشخصات داده ها را نشان داد.
اعتبارسنجی کیفیت داده ها
در این مرحله کیفیت داده های به دست آمده از مراحل پیش بررسی می شود. علاوه بر این در این مرحله بررسی می شود که آیا داده های به دست آمده تمامی نیاز های مورد نظر پروژه را برآورده می کند. آیا داده ها دارای خطا می باشد و در صورت وجود خطا، راه حل مقابله با آنها چیست. آیا در داده ها ، مقادیر ناقص وجود[۳۹] دارد.
خروجی این فاز:
گزارش کیفیت داده ها[۴۰]: در این گزارش به سوالات مطرح شده در روند این مرحله پاسخ داده می شود. [۳۱]
مراحل و خروجی هر فاز در بخش شناسایی داده ها در شکل شماره ۱٫۲٫۲٫۳ نشان داده شده است.
شکل شماره ۱٫۲٫۲٫۳٫ مرحله شناسایی داده ها
طراحی و پیاده سازی سیستم خبره برای پیش بینی الگوی ماندگاری ...