داده کاوی توصیفی به توصیف روابط الگوها و مدل های پنهان در حجم زیادی از داده میپردازد. در صورتی که داده کاوی پیش گویی کننده به کشف الگوها و روابط ناشناخته در میان انبوه داده ها اشاره دارد. فرایند داده کاوی دارای ابزارهایی است که می توان آن ها را در این دو قسمت قرار داد. بدین ترتیب که فعالیت های طبقه بندی، رگرسیون، تحلیل سری های زمانی و تخمین در حوزه داده کاوی پیش گویی کننده هستند و فعالیت های خوشه بندی، خلاصه سازی، کشف توالی و قوانین وابستگی در بخش داده کاوی توصیفی قرار دارند.
۱-۱۵-۴: ماشین بردارپشتیبان
متد دیگری که در سالهای گذشته در زمینه ارزیابی وضعیت اعتبار مشتریان بسیار مورد توجه محققان بوده است، ماشین بردارپشتیبان است. این متد یک متد ریاضی قوی در دسته بندی است. متدی شبیه به شبکه های عصبی که به جای خط جدا کننده به دنبال بهترین خط جدا کننده است که دارای حداکثر حاشیه باشد. یعنی بهترین خط جدا کننده ای که با نزدیکترین نقطه کمترین فاصله را داشته باشد. در ماشین بردارپشتیبان انتخاب بهینه ویژگی ها در دقت مدل تأثیر بسزایی دارد از این رو در سالهای گذشته بسیاری از تحقیقات بر روی ماشین بردارپشتیبان، بر روی انتخاب بهینه پارامترها متمرکز میباشند.
تکنیک های یادگیری ماشینی بخشی از علم هوش مصنوعی به شمار میآیند. هوش مصنوعی به طور مؤثر و موفقی در گستره وسیعی از شاخه های تجاری همچون بازاریابی، حسابداری، سیستمهای اطلاعاتی مدیریت و مدیریت تولید به کار گرفته می شود. در اکثر تحقیقات از روش های یادگیری ماشینی برای پیشبینی تغییرات آتی سهام، بحران های مالی، ورشکستگی، شناسایی کلاهبرداری کارت های اعتباری به کار گرفته می شود.
۱-۱۵-۵: درخت تصمیم
درخت تصمیم یکی از ابزارهای قوی و متداول برای دسته بندی و پیشبینی میباشد. درخت- تصمیم گیری بر خلاف شبکه های عصبی به تولید قانون می پردازد. یعنی درخت تصمیم گیری پیشبینی خود را در قالب یک سری قوانین توضیح میدهد در حالی که در شبکه های عصبی تنها پیشبینی نهایی بیان می شود و چگونگی آن در خود شبکه پنهان باقی می ماند.
درختان تصمیم گیری تنها مقادیر ویژگی های گسسته را توسط متغیر هدف (ویژگی کلاس یا ویژگی وابسته) پیش گویی میکند. این پیش گویی توسط متغیر کلاس که ویژگی هدف یا ویژگی وابسته نیز نامیده می شود، صورت میگیرد. مقادیر ویزگی هدف، وابسته به مقادیر متغیرهای (ویژگیهای) مستقل (توصیف کننده) و وجود آن ها در ساختار درخت تصمیم گیری است.
۱-۱۵-۶: شبکه های عصبی
این شبکه ها ابزارهایی هستند که در موارد پیشبینی ، خوشه بندی و تخمین کاربرد دارند. جذابیت شبکه های عصبی در این است که آن ها به وسیله مدلسازی ارتباطات عصبی مغز انسان در کامپیوترهای دیجیتالی پلی برای فاصله موجود ایجاد میکنند.
برای شناخت الگوهایی که در داده ها وجود دارند بسیار مفید هستند، خصوصاًً در مواقعی که نوع رابطه بین هدف (به عنوان مثال ارزیابی وضعیت اعتباری) و متغیرهای ورودی (مثلا ویژگی های جمعیتی) نامشخص و یا پیچیده باشد.
شبکه های عصبی روش محاسبه ای متفاوت با روش های متداول میباشند. محاسباتی که با روش های معمولی انجام می شود از نوع برنامه ریزی شده است و در آن ها الگوریتم ها و مجموعه هایی از قواعد به کار میروند تا مسأله را حل کنند. در این روشها اگر الگوریتمی در دست نباشد یا الگوریتم پیچیده باشد، راه حلی برای مسأله وجود نخواهد داشت. اما در محاسباتی که شبکه عصبی اجرا میکند به الگوریتم و مجموعه قواعد نیاز نیست.
فصل دوم
ادبیات تحقیق
مقدمه
در سیستم بانکی ایران، تجهیز منابع و تخصیص آن در قالب تسهیلات مالی کماکان اصلی ترین وظیفه بانک های تجاری را تشکیل میدهد. در بخش تخصیص منابع، توجه به این نکته حائز اهمیت است که نرخ سود تسهیلات اعطایی فراتر از سیاست های پولی به عنوان ابزاری جهت اعمال سیاستهای اقتصادی در بخش های مختلف اقتصادی مورد استفاده قرار میگیرد و این امکان که ریسک عدم بازپرداخت تسهیلات از طریق نوسانات نرخ سود جبران شود تا حد زیادی از بانکهای اعطا کننده تسهیلات سلب شده است. لذا هنگام تصمیم گیری نسبت به اعطای تسهیلات، بررسی همه جانبه درخواست تسهیلات به منظور به حداقل رساندن ریسک عدم بازپرداخت از اهمیت خاصی برخوردار است. (حسینی پور عزآبادی،۱۰،۱۳۸۲)
بانک ها به عنوان بخش اصلی نظام مالی همواره با ریسک های متفاوتی روبرو هستند که یکی از عمده ترین آن ها ریسک اعتباری است. حجم قابل ملاحظه ای از تسهیلات اعطایی سوخت شده یا معوقه بانک ها، گویای فقدان مدل های مناسب اندازه گیری اعتباری و سیستم های مدیریت ریسک در شبکه بانکی است. (اخباری،۱۳۸۷، ۱۰)
یکی از ابزارهایی که بانک ها میتوانند جهت مدیریت و کنترل ریسک اعتباری از آن ها بهره گیری نمایند، “سیستم اعتبارسنجی مبتنی بر صورت های مالی مشتریان” است. بخش قابل توجهی از منابع سیستم بانکی، جهت تأمین نیازهای مالی شرکت ها تخصیص مییابد که عمدتاًً در قالب شرکتهای تجاری، متقاضی استفاده از تسهیلات بانکی هستند.
در تحقیق حاضر بررسی خواهیم نمود که آیا تکنیکهای داده کاوی جهت اعتبارسنجی صورتهای مالی واحدهای تجاری در اعطای تسهیلات کارآ میباشد یا خیر؟ ، زیرا بر اساس شواهد موجود از جمله حجم تسهیلات سوخت شده و معوقه می توان ادعا نمود بانک ها در اعطای وام به ریسک مربوطه توجه نمی کنند و بر اساس سیستم وثیقه محوری و قضاوتی وام به مشتریان میدهند.
در این فصل از تحقیق سعی شده است ضمن بیان تاریخچه داده کاوی و ریسک اعتباری ، مبانی نظری و علمی رتبه بندی اعتبار و امتیاز بندی اعتباری و کاربرد داده کاوی در حوزه اعتبارسنجی به صورت تفصیلی ذکر گردد.
-
- چارچوب نظری تحقیق
همان طوری که گفته شد، داده کاوی در بسیاری از شاخهها همچون بازاریابی، امور مالی، بانکداری، تولید، پزشکی، مدیریت ارتباط با مشتری، ردیابی، پیشبینی خرابی ها، آموزش سازمانی و… کاربرد دارد. که در این میان کاربرد داده کاوی در صنعت بانکداری از اهمیت بالایی برخوردار است که میتوان به موارد زیر اشاره کرد :
۱- پایگاه داده عظیم و بسیاری وجود دارند. ۲- اطلاعات تجاری ارزشمندی میتواند از این پایگاه داده استخراج شوند. ۳- استفاده از روش های سنتی گذشته برای پشتیبانی تصمیم و تحلیلها اجرا شدنی نیست. ۴- تحلیلهای انسانی تحت تأثیر ابعاد و حجم داده ها قرار میگیرد. ۵- متدهای آماری سنتی رتبه قادر به رتبه بندی نیستند و نیاز به کارشناسان و تحلیلگران مهم و قابل توجه دارد.
یکی از مباحث مهم در صنعت بانکداری تشخیص توانایی یا ارزیابی قدرت شرکت ها در بازپرداخت بدهی، جهت کاهش خسارت های ناشی از ناتوانی آنان در بازگرداندن تسهیلات دریافتی است. که برخی از مزایای آن عبارت است از: ۱- کاهش هزینه تحلیل ۲- تصمیم گیری سریع۳- تضمین تسهیلات و حذف ریسک های احتمالی. ۴- تعیین اولویت در مجموعه اعطاء تسهیلات
در نتیجه ما میتوانیم از مدل های مختلفی جهت ارزیابی وضعیت مالی مشتریان استفاده کنیم که این مدل ها به دو گروه اصلی تقسیم میشوند که عبارتند از :
گروه اول: مدلهای پارامتریک: شامل ۱- مدل احتمال خطی ۲- مدل لاجیت و پروبیت ۳- مدلهای تحلیل متمایز کننده