داده کاوی

تعریف های متفاوتی از داده کاوی وجود دارد ولی تعریفی که در اکثر مراجع به اشتراک ذکر شده عبارت است از “استخراج اطلاعات و دانش و کشف الگوهای پنهان از یک پایگاه داده های بسیار بزرگ و پیچیده”.

هدف داده کاوی این است که ارتباطات و الگوهای معتبر، جدید، قابل استفاده، و قابل درک را از میان داده ها استخراج کند.

فرآیند داده کاوی به دو قسمت تقسیم می شود : 1- داده کاوی توصیفی 2- داده کاوی پیش گویانه

داده کاوی توصیفی به توصیف روابط الگوها و مدل های پنهان در حجم زیادی از داده میپردازد. در صورتی که داده کاوی پیش گویی کننده به کشف الگوها و روابط ناشناخته در میان انبوه داده ها اشاره دارد. فرآیند داده کاوی دارای ابزارهایی است که می توان آنها را در این دو قسمت قرار داد. بدین ترتیب که فعالیت های طبقه بندی، رگرسیون، تحلیل سری های زمانی و تخمین در حوزه    داده کاوی پیش گویی کننده هستند و فعالیت های خوشه بندی، خلاصه سازی، کشف توالی و قوانین وابستگی در بخش داده کاوی توصیفی قرار دارند.

1-15-4: ماشین بردارپشتیبان

متد دیگری که در سالهای گذشته در زمینه ارزیابی وضعیت اعتبار مشتریان بسیار مورد توجه محققان بوده است، ماشین بردارپشتیبان است. این متد یک متد ریاضی قوی در دسته بندی است. متدی شبیه به شبکه های عصبی که به جای خط جدا کننده بدنبال بهترین خط جدا کننده است که دارای حداکثر حاشیه باشد. یعنی بهترین خط جدا کننده ای که با نزدیکترین نقطه کمترین فاصله را داشته باشد. در ماشین بردارپشتیبان انتخاب بهینه ویژگی ها در دقت مدل تأثیر بسزایی دارد از این رو در سالهای گذشته بسیاری از تحقیقات بر روی ماشین بردارپشتیبان، بر روی انتخاب بهینه پارامترها متمرکز می باشند.

تکنیک های یادگیری ماشینی بخشی از علم هوش مصنوعی به شمار می آیند. هوش مصنوعی به طور مؤثر و موفقی در گستره وسیعی از شاخه های تجاری همچون بازاریابی، حسابداری، سیستمهای اطلاعاتی مدیریت و مدیریت تولید بکار گرفته می شود. در اکثر تحقیقات از روشهای یادگیری ماشینی برای پیش بینی تغییرات آتی سهام، بحران های مالی، ورشکستگی، شناسایی کلاهبرداری کارت های اعتباری بکار گرفته می شود.

لینک جزییات بیشتر و دانلود این پایان نامه:

اعتبارسنجی واحدهای تجاری دریافت کننده تسهیلات مالی مبتنی بر صورتهای مالی