پویا فایل

پویا فایل

پویا فایل

پویا فایل

داده کاوی

داده کاوی

توجه :

شما می توانید با خرید این محصول فایل " قلق های پایان نامه نویسی (از عنوان تا دفاع)" را به عنوان هدیه دریافت نمایید.

چکیده:

در دو دهه قبل توانایی­های فنی بشر برای تولید و جمع­آوری داده‌ها به سرعت افزایش یافته است. عواملی نظیر استفاده گسترده از بارکد برای تولیدات تجاری، به خدمت گرفتن کامپیوتر در کسب­و­کار، علوم، خدمات­ دولتی و پیشرفت در وسائل جمع­آوری داده، از اسکن کردن متون و تصاویر تا سیستمهای سنجش از دور ماهواره­ای، در این تغییرات نقش مهمی دارند.

بطور کلی استفاده همگانی از وب و اینترنت به عنوان یک سیستم اطلاع رسانی جهانی ما را مواجه با حجم زیادی از داده و اطلاعات می‌کند. این رشد انفجاری در داده‌های ذخیره شده، نیاز مبرم وجود تکنولوژی­های جدید و ابزارهای خودکاری را ایجاد کرده که به صورت هوشمند به انسان یاری رسانند تا این حجم زیاد داده را به اطلاعات و دانش تبدیل کند. داده­کاوی به عنوان یک راه حل برای این مسائل مطرح می باشد. در یک تعریف غیر رسمی داده­کاوی فرآیندی است، خودکار برای استخراج الگوهایی که دانش را بازنمایی می­کنند، که این دانش به صورت ضمنی در پایگاه داده­های عظیم، انباره­داده و دیگر مخازن بزرگ اطلاعات، ذخیره شده است.

به لحاظ اینکه در چند سال اخیر مبحث داده­کاوی و اکتشاف دانش موضوع بسیاری از مقالات و کنفرانسها قرار گرفته و نرم­افزار­های آن در بازار به شدت مورد توجه قرار گرفته، از اینرو در مقاله سعی بر آن شده تا گذری بر آن داشته باشیم.

در این مقاله درفصل مروری بر داده­کاوی خواهیم داشت . که به طور عمده به تاریخچه ، تعاریف، کاربردها وارتباط آن با انبار داده و OLAP خواهیم پرداخت. در پایان فصل مراحل فرایند کشف دانش از پایگاه داده­ها را ذکر کردیم که داده­کاوی یکی از مراحل آن است.

در فصل 2 یکی از شیوه­های داده­کاوی که از سبد خرید گرفته شده­ است توضیح داده شده است . در این فصل به شرح قوانین ارتباطی خواهیم پرداخت که در آن بعد از دسته­بندی الگوریتمها ، الگوریتم Apriori ( که یک الگوریتم پایه در این زمینه است ) و الگوریتم FP-Growth ( یک الگوریتم جدید میباشد) را با شرح یک مثال توضیح می­دهیم و در آخر آن دو را با هم مقایسه می­کنیم .

در فصل 3 مباحث وب­کاوی و متن­کاوی را که در بسیاری از مراجع جزء کاربردهای داده­کاوی به حساب می­آید شرح داده خواهد شد.

فهرست مطالب

فهرست اشکال ...............................................................................................................................................

فهرست جداول ..............................................................................................................................................

فصل1: مقدمه­ای بر داده­کاوی ............................................................................

1-1 تعریف داده­کاوی ...................................................................................................................................

2-1 تاریخچه داده­کاوی ................................................................................................................................

3-1 چه چیزی سبب پیدایش داده­کاوی شده است؟ ........................................................................................

4-1 اجزای سیستم داده­کاوی .........................................................................................................................

5-1 جایگاه داده­کاوی در میان علوم مختلف ..................................................................................................

6-1 قابلیتهای داده­کاوی .................................................................................................................................

7-1 چرا به داده­کاوی نیاز داریم؟ ...................................................................................................................

8-1 داده­کاوی چه کارهایی نمی­تواند انجام دهد؟ ..........................................................................................

9-1 کاربردهای داده­کاوی .............................................................................................................................

1-9-1 کاربردهای پیش­بینی­کننده ...................................................................................................

2-9-1 کاربردهای توصیف­کننده ....................................................................................................

10-1 ابزارهای تجاری داده­کاوی ...................................................................................................................

11-1 داده­کاوی و انبار­داده­ها .........................................................................................................................

1-11-1 تعاریف انبار­داده ................................................................................................................

2-11-1 چهار خصوصیت اصلی انبار­داده .........................................................................................

3-11-1 موارد تفاوت انبار­داده و پایگاه­ داده ....................................................................................

12-1 داده­کاوی و OLAP ...........................................................................................................................

1-12-1 OLAP ...........................................................................................................................

2-12-1 انواع OLAP ...................................................................................................................

13-1 مراحل فرایند کشف دانش از پایگاه داده­ها ...........................................................................................

1-13-1 انبارش داده­ها ....................................................................................................................

2-13-1 انتخاب داده­ها ....................................................................................................................

3-13-1 پاکسازی- پیش­پردازش- آماده­سازی ................................................................................

4-13-1 تبدیل داده­ها ......................................................................................................................

5-13-1 کاوش در داده­ها (Data Mining) .................................................................................

6-13-1 تفسیر نتیجه ........................................................................................................................

فصل 2: قوانین ارتباطی ...........................................................................

1-2 قوانین ارتباطی ........................................................................................................................................

2-2 اصول پایه ...............................................................................................................................................

1-2-2 شرح مشکل جدی ...............................................................................................................

2-2-2 پیمایش فضای جستجو .........................................................................................................

3-2-2 مشخص کردن درجه حمایت مجموعه اقلام .........................................................................

3-2 الگوریتمهای عمومی ..............................................................................................................................

1-3-2 دسته­بندی ............................................................................................................................

2-3-2 BFS و شمارش رویداد­ها ...................................................................................................

3-3-2 BFS و دونیم­سازی TID-list ...........................................................................................

4-3-2 DFS و شمارش رویداد ......................................................................................................

5-3-2 DFS و دو نیم­سازی TID-list ..........................................................................................

4-2 الگوریتم Apriori ................................................................................................................................

1-4-2 مفاهیم کلیدی .....................................................................................................................

2-4-2 پیاده­سازی الگوریتم Apriori ............................................................................................

3-4-2 معایب Apriori و رفع آنها .................................................................................................

5-2 الگوریتم رشد الگوی تکرارشونده ..........................................................................................................

1-5-2 چرا رشد الگوی تکرار سریع است؟ .....................................................................................

6-2 مقایسه دو الگوریتم Apriori و FP-growth ......................................................................................

7-2 تحلیل ارتباطات ......................................................................................................................................

فصل 3: وب­کاوی و متن­کاوی .................................................................

1-3 وب­کاوی ...............................................................................................................................................

1-1-3 الگوریتمهای هیتس و لاگسام ...............................................................................................

2-1-3 کاوش الگوهای پیمایش مسیر ..............................................................................................

2-3 متن­کاوی ...............................................................................................................................................

1-2-3 کاربردهای متن­کاوی ...........................................................................................................

1-1-2-3 جستجو و بازیابی ..............................................................................................

2-1-2-3 گروه­بندی و طبقه­بندی ......................................................................................

3-1-2-3 خلاصه­سازی ....................................................................................................

4-1-2-3 روابط میان مفاهیم .............................................................................................

5-1-2-3 یافتن و تحلیل گرایشات ....................................................................................

6-1-2-3 برچسب زدن نحوی (pos) ...............................................................................

7-1-2-3 ایجاد Thesaurus و آنتولوژی به صورت اتوماتیک .........................................

2-2-3 فرایند متن­کاوی ...................................................................................................................

3-2-3 روشهای متن­کاوی ...............................................................................................................

مراجع .....................................................................................................

فهرست اشکال

1-1 مراحل فرایند کشف دانش ......................................................................................................................

2-1 سیر تکاملی صنعت پایگاه داده ................................................................................................................

3-1 معماری یک نمونه سیستم داده­کاوی .......................................................................................................

4-1 نرخ رشد اطلاعات .................................................................................................................................

5-1 کاربرد پیش­بینی کننده ............................................................................................................................

6-1 داده­ها از انبار­داده­ها استخراج می­گردند ..................................................................................................

7-1 داده­ها از از چند پایگاه داده­ استخراج می­گردند ......................................................................................

1-2 شبکه‌ای برای .................................................................................................................

2-2 درخت ..........................................................................................................................

3-2 دسته­بندی الگوریتمها ..............................................................................................................................

4-2 پایان الگوریتم Apriori ........................................................................................................................

5-2 درخت الگوی تکرار ..............................................................................................................................

6-2 اندازه­گیری کارکرد درجه حمایت برای پایگاه داده D1 40K ..............................................................

7-2 اندازه­گیری Apriori با درجه حمایت/تراکنش .....................................................................................

8-2 اندازه­گیری FP-growth با درجه حمایت/تراکنش ..............................................................................

1-3 مقداردهی اولیه الگوریتم HITS ............................................................................................................

2-3 مثالی از الگوهای پیمایش .......................................................................................................................

3-3 فرایند متن­کاوی .....................................................................................................................................

4-3 مثال یافتن روابط .....................................................................................................................................

فهرست جداول

1-2 کاوش FP-tree با ایجاد پایگاه­های الگوشرطی .....................................................................................

2-2 پارامترها .................................................................................................................................................

3-2 نتایج برای فاکتور درجه حمایت 5% ........................................................................................................

4-2 نتایج برای D1 150K با درجه حمایت .................................................................................................

1-3 تراکنش­های توصیف شده توسط مجموعه­ای از URLها .......................................................................

2-3 نمایش URLها به عنوان بردارهایی از فعالیت گروه تراکنش ..................................................................

3-3 یک SOM مرسوم که توسط توصیف URLها تولید شده است ............................................................



خرید فایل



لینک منبع :داده کاوی

داده‌کاوی - ویکی‌پدیا، دانشنامهٔ آزاد https://fa.wikipedia.org/wiki/داده‌کاوی‎Cached Similarداده‌کاوی (به انگلیسی: Data Mining) به مفهوم استخراج اطلاعات نهان و یا الگوها وروابط مشخص در حجم زیادی از داده‌ها در یک یا چند بانک اطلاعاتی بزرگ است. بسیاری از مردم ... ‎۱ مقدمه - ‎۲ ویژگی‌ها - ‎۳ چیستی - ‎۴ محدودیت‌های داده کاویداده کاوی - نظم آران nazmaran.com/Content.aspx?...data%20mining&name=داده%20کاوی‎Cachedیکی از ابزار های مورد استفاده در این فناوری ها، داده کاوی می باشد. داده کاوی شامل استفاده از ابزار های پیشرفته تحلیل داده به منظور کشف الگوهای معتبر و روابط در مجموعه ... داده کاوی چیست؟ - داده کاوی dmrg.kntu.ac.ir/ShowPage.aspx?...1...datamining‎Cached Similarداده‌ کاوی چیست؟ چرا داده کاوی نیاز است؟ امروزه در اکثر سازمانها، داده‌ها به سرعت در حال جمع آوری و ذخیره شدن می باشند. اما می توان ادعا کرد که علیرغم این حجم انبوه‌داده‌ها، امروزه ... فایلهای درس داده کاوی - دانشگاه صنعتی خواجه نصیرالدین طوسی www.kntu.ac.ir/ShowPage.aspx?page...lang...datamining‎Cached Similarداده کاوی data mining. ... مفاهیم داده کاوی. چرا داده‌کاوی نیاز است؟ داده کاوی چیست؟ چه موقع و کجا داده کاوی نیاز است؟ چگونه داده کاوی را به کار گیریم؟ مفاهیم ۱ · مفاهیم ۲. داده کاوی چیست؟ - گروه داده کاوی دایکه www.dayche.com/about/datamining/‎Cached Similarداده کاوی یعنی استخراج اطلاعات گرانبها از حجم عظیم معادن داده ها. داده کاوی دو راهکار مشخص ارائه می کند: ارائه گزارشات مستند برای حل مشکلات کسب و کار شما؛ ارائه ... هرآنچه درباره داده کاوی لازم است بدانید! - گروه داده کاوی دایکه www.dayche.com/articles/everything-about-datamining/‎Cached Similarدر این مقاله تلاش شده تا نشان داده شود که داده کاوی چگونه کار می کند و چرا شما باید در مقابل آن محتاط باشید. زیرا وقتی ما به نحوه استفاده از داده ها فکر می کنیم، این ... گروه داده کاوی ایران www.irdatamining.com/‎Cached Similarدر این دوره‌ی آموزشی، شرکت کنندگان ضمن‌ آشنایی با داده کاوی، پیش پردازش و درک داده ها، الگوریتم های داده کاوی، رده بندی، خوشه بندی، قواعد انجمنی و کشف نقاط دور ... موسسه پژوهشی داده کاوی گیتا-Gita Data Mining Research Institution www.irandatamining.ir/‎Cachedموسسه پژوهشی داده کاوی گیتا ( دبیرخانه دائمی کنفرانس های داده کاوی ایران) با مدیریت ارشد آقای دکتر جمال شهرابی جهت تکمیل کادر خود از کلیه متخصصان و علاقه مندان ... موسسه پژوهشی داده کاوی گیتا-Gita Data Mining Research Institution www.irandatamining.com/‎Cached Similarموسسه پژوهشی داده کاوی گیتا ( دبیرخانه دائمی کنفرانس های داده کاوی ایران) با مدیریت ارشد آقای دکتر جمال شهرابی جهت تکمیل کادر خود از کلیه متخصصان و علاقه مندان ... مقالات ISI داده کاوی : 264 مقاله انگلیسی + ترجمه فارسی isiarticles.com/topic/511‎Cached Similarداده کاوی، پایگاه‌ها و مجموعه‌های حجیم داده‌ها را در پی کشف واستخراج دانش، مورد تحلیل و کند و کاوهای ماشینی (و نیمه‌ماشینی) قرار می‌دهد. این گونه مطالعات و کاوش‌ها را به واقع ...