امروزه نقش مشتریان از حالت پیروی از تولید کننده ،به هدایت سرمایه گذاران ، تولید کنند گان و حتی پژوهش گران و نوآوران مبدل گشته است ،به همین دلیل سازمان ها نیاز دارند مشتریان خود را بشناسند و برای آنان برنامه ریزی کنند .تاکنون از برخی روش های آماری و یادگیری ماشینی برای این منظور استفاده شده است که البته این روش ها به تنهایی دارای محدودیت هایی هستند که در این پژوهش سعی شده است تا با بهره گیری از روش های مختلف داده کاوی تا حد ممکن این محدودیت ها از بین برده و بر طبق آن ،چارچوبی برای شناسایی مشتریان بیمه بدنه اتومبیل ارایه شود . در واقع هدف این است تا مشتریانی را که بیشتر به یکدیگر شبیه هستند دسته بندی و با استفاده از این دسته ها و ویژگی های آن ،میزان خطر پذیری هر دسته را پیش بینی کرد . حال با استفاده از این معیار (میزان خطر پذیری هر دسته) و نوع بیمه نامه مشتری می توان میزان خسارت او را پیش بینی کرد که این معیار می تواند کمک شایانی برای شناسایی مشتریان و سیاست گذاری های تعرفه بیمه نامه باشد . برای این منظور، از روش داده کاوی ،درخت تصمیم برای ایجاد مدل پیش بینی خطر پذیری مشتریان در صنعت بیمه استفاده شده است .فن درخت تصمیم برای این منظور نتایج بهتری را به دست اورده است.
فهرست مطالب
چکیده1
1-1- مقدمه. 2
1-2- تاریخچه داده کاوی.. 2
1-3- روشهای پیشین و فعالیت های مرتبط با پژوهش... 4
1-4- مدیریت ذخیره سازی و دستیابی اطلاعات.. 5
1-5- ساختار بانک اطلاعاتی سازمان :7
1-6- داده کاوی :((Data Mining. 7
1-6-1- داده کاوی چیست؟. 7
1-6-2- مفاهیم پایه در داده کاوی.. 8
1-6-3- تعریف داده کاوی.. 8
1-6-4- برخی از این تعاریف عبارتند از :8
1-6-4-1- مراحل فرایند کشف دانش از پایگاه داده ها9
1-7- تفسیر نتیجه. 9
1-8- انبارش داده ها9
1-9- انتخاب داده ها10
1-10- تبدیل داده ها10
1-11- عملیات های داده کاوی.. 10
1-11-1- مدل سازی پیشگویی کننده11
1-11-2- تقطیع پایگاه داده ها12
1-11-3- تحلیل پیوند. 12
1-11-4- تشخیص انحراف.. 12
1-12- الگوریتم های داده کاوی.. 13
1-12-1- دسته بندی.. 14
1-12-2-رگرسیون. 15
1-12-3- سریهای زمانی.. 16
1-12-4- پیش بینی.. 16
1-12-5- تکنیک های روش توصیفی.. 16
1-12-6- قوانین انجمنی.. 16
1-12-7- خلاصه سازی (تلخیص)17
1-12-8- مدلسازی وابستگی (تحلیل لینک)17
1-12-9- خوشه بندی.. 18
1-12-9-1- معیارهای ارزیابی الگوریتمهای خوشه بندی.. 18
1-12-9-2- طبقه بندی روشهای خوشه بندی.. 19
1-12-10- الگوریتم Apriori19
1-12-11- الگوریتم K-Means20
1-12-11- 1-گام های الگوریتم k-means20
1-12-11-2- ویژگیهای الگوریتم k-means20
1-12-11-3- رفع اشکالات الگوریتم k-means:21
1-12-12- شبکه های عصبی.. 21
1-12-13- درخت تصمیم. 22
1-13- روش پیشنهادی.. 23
1-14- جامع آماری و نمونه آماری.. 23
1-15- مراحل پژوهش... 23
1-16-پیش پردازشداده ها25
1-17- معرفی مشخصه ها26
1-18- مشخصه هدف.. 27
1-19- انتخاب مشخصه. 27
1-20- نرم افزارهای داده کاوی.. 27
1-21- پیاده سازی مدل های داده کاوی.. 30
1-21-1- درخت تصمیم. 30
1-21-2- تحلیل درخت تصمیم. 30
منابع 34
شکل 1-1- دسته بندی پژوهش ها در زمینه ی داده کاوی.. 4
شکل 1-2- نمودار پردازش اطلاعات.. 6
شکل1-3- مدیریت داده ها6
شکل 1-4- ساختار بانک اطلاعاتی.. 7
شکل 1-5- تجزیه و تحلیل KDD. 8
شکل 1-6- یک شبکه عصبی با یک لایه پنهان. 22
شکل 1-7- مراحل پژوهش... 25
شکل 1-8- درخت تصمیم. 31
شکل 1-9- درخت تصمیم. 32
شکل 1-10- درخت تصمیم 33
پاورپوینت بررسی داده کاوی (Data Mining)
مقدمه
از هنگامی که رایانه در تحلیل و ذخیره سازی داده ها بکار رفت (1950) پس از حدود 20 سال، حجم داده ها در پایگاه داده ها دو برابر شد. ولی پس از گذشت دو دهه و همزمان با پیشرفت فن آوری اطلاعات(IT) هر دو سال یکبار حجم داده ها، دو برابر شد. همچنین تعداد پایگاه داده ها با سرعت بیشتری رشد نمود. این در حالی است که تعداد متخصصین تحلیل داده ها و آمارشناسان با این سرعت رشد نکرد. حتی اگر چنین امری اتفاق می افتاد، بسیاری از پایگاه داده ها چنان گسترش یافته اند که شامل چندصد میلیون یا چندصد میلیارد رکورد ثبت شده هستند و امکان تحلیل و استخراج اطلاعات با روش های معمول آماری از دل انبوه داده ها مستلزم چند روز کار با رایانه های موجود است. حال با وجود سیستم های یکپارچه اطلاعاتی، سیستم های یکپارچه بانکی و تجارت الکترونیک، لحظه به لحظه به حجم داده ها در پایگاه داده های مربوط اضافه شده و باعث به وجود آمدن انبارهای عظیمی از داده ها شده است به طوری که ضرورت کشف و استخراج سریع و دقیق دانش از این پایگاه داده ها را بیش از پیش نمایان کرده است .
چنان که در عصر حاضر گفته می شود « اطلاعات طلاست»
سابقه داده کاوی
داده کاوی و کشف دانش در پایگاه داده ها از جمله موضوع هایی هستند که همزمان با ایجاد و استفاده از پایگاه داده ها در اوایل دهه 80 برای جستجوی دانش در داده ها شکل گرفت.
شاید بتوان لوول (1983) را اولین شخصی دانست که گزارشی در مورد داده کاوی تحت عنوان « شبیه سازی فعالیت داده کاوی » ارائه نمود. همزمان با او پژوهشگران و متخصصان علوم رایانه، آمار، هوش مصنوعی، یادگیری ماشین و . . . نیز به پژوهش در این زمینه و زمینه های مرتبط با آن پرداخته اند.
فهرست مطالب
مقدمه
سابقه داده کاوی
بخش اول – مفهوم داده کاوی
1-1 – فرآیند داده کاوی
1-2 – ابزارهای داده کاوی
1-2-1 – هم پیوندی
1-2-2 – طبقه بندی
1-2-3 – الگوهای ترتیبی
1-2-4 – خوشه بندی
1-3 – کاربردهای داده کاوی
1-3-1 – کاربردهای تجاری
1-3-2 – کاربردهای علمی
1-3-3 – کاربردهای امنیتی
بخش دوم – داده کاوی توزیع شده
بخش سوم – عامل ها ، سِستمهای چند عامله و داده کاوی توزیع شده
3-1 – عامل
3-2 – سیستمهای چند عامله
بخش چهارم – پروسه ی کشف دانش از پایگاه داده
4-1 – ویژگی های KDD
4-1-1 – استخراج داده ها
4-1-2 – آماده کردن داده ها
4-1-3 – مهندسی داده ها
4-1-4 – مهندسی الگوریتم و تعیین استراتژی های کاوش
4-1-5- اجرای الگوریتم کاوش و ارزیابی نتایج