جزوه پایگاه داده مخصوص دانشجویان رشته کامپیوتر مقطع کاردانی و کارشناسی
شامل : سیستم های بانک اطلاعاتی
عملیات جبر رابطه ای
دارای نکات و مثال های متعدد برای یادگیری هر چه بهتر دانشجویان
عناوین :
۱- عناصر اصلی سیستم های بانک اطلاعاتی
۲- معماری سیستم بانک اطلاعاتی
۳- نمودار ER
۴-نمودار EER
۵- مزایای سیستم بانک اطلاعاتی
۶- ساختار های داده ای
۷- دستورات SQL
۸- انواع جداول
۹- جامعیت بانک اطلاعاتی
۱۰- قانون جامعیت ارجاعی
۱۱- تراکنش
۱۲- نرمال سازی
۱۳- جبر رابطه ای
داده های گمشده
قسمتی از متن:
معمولاً در پیمایش ها مواردی پیش میآید که برخی از پاسخگویان به برخی از سوالات پاسخ ندهند. پس از وارد کردن دادهها به نرم افزارهای آماری موارد بدون پاسخ به صورت خودکار، گمشده تعریف میشوند. مشکل دادههای گمشده را میتوان به دو حالت کلی تقسیم کرد. حالت اول زمانی است که دادهها به صورتی تصادفی گم شده باشند. مثلاً پاسخگویان برخی سوالات را ندیده باشند و یا پرسشگران یک یا چند سوال را از قلم انداخته باشند. حالت دوم وقتی پیش میآید که پاسخگو با قصد و نیت از پاسخ دادن به سوال یا سوالاتی خودداری ورزیده باشد.
شرایطی که تعمدی در بی پاسخ گذاشتن سوالات وجود داشته باشد، بدترین حالت برای پژوهشگر است. در این حالت هرگونه برخوردی با دادههای گمشده نتایج پیمایش را به سمت اریبی می کشاند. ممکن است پژوهشگری در این حالت ترجیح دهد که پرسشنامههایی را که شامل دادههای گمشده باشند به کلی حذف کند. باید بگویم که این بدترین کاری است که یک پژوهشگر میتواند با این مشکل انجام دهد، زیرا با این کار فقط میزان اریبی را افزایش خواهد داد. مثلاً در یک پیمایش ممکن است افراد طبقه بالای جامعه از گفتن میزان درآمدشان خودداری کرده باشند.
فهرست مطالب
داده های گمشده. 4
شیوه های متفاوت در برخورد با مشکل دادههای گمشده. 4
بی پاسخی و داده های گمشده در آمارگیریهای نمونه ای.. 6
اثر بی پاسخی بر درستی برآوردها 7
آمارگیریهای پستی همراه با مصاحبه با بی پاسخها 9
مثال تشریحی.. 9
تعیین کسر بهینۀ بی پاسخهای آغازین برای زیرنمونه در تلاشهای متمرکز. 12
سازوکارهایی که مقادیر گمشده از آنها ناشی می شود. 13
گمشده کاملاً تصادفی: 14
گمشده تصادفی: 14
مقادیر گمشده غیرقابل چشم پوشی: 14
انواع روشها برای تحلیل داده ها با وجود مقادیر گمشده. 18
روشهای مربوط به مورد کامل : 18
روشهای مبتنی بر جانهی : 19
روشهای تجدید وزن دهی: 19
انواع روش های جانهی.. 20
جانشین کردن میانگین: 20
روش بی درنگ: 21
مثال تشریحی: 22
مدل رگرسیون لوجستیک با وجود مقادیر گمشده تصادفی در متغیر کمکی.. 24
زمینه و هدف: 24
مواد و روش کار: 24
منابع و مآخذ. 30
پاورپوینت بررسی داده کاوی (Data Mining)
مقدمه
از هنگامی که رایانه در تحلیل و ذخیره سازی داده ها بکار رفت (1950) پس از حدود 20 سال، حجم داده ها در پایگاه داده ها دو برابر شد. ولی پس از گذشت دو دهه و همزمان با پیشرفت فن آوری اطلاعات(IT) هر دو سال یکبار حجم داده ها، دو برابر شد. همچنین تعداد پایگاه داده ها با سرعت بیشتری رشد نمود. این در حالی است که تعداد متخصصین تحلیل داده ها و آمارشناسان با این سرعت رشد نکرد. حتی اگر چنین امری اتفاق می افتاد، بسیاری از پایگاه داده ها چنان گسترش یافته اند که شامل چندصد میلیون یا چندصد میلیارد رکورد ثبت شده هستند و امکان تحلیل و استخراج اطلاعات با روش های معمول آماری از دل انبوه داده ها مستلزم چند روز کار با رایانه های موجود است. حال با وجود سیستم های یکپارچه اطلاعاتی، سیستم های یکپارچه بانکی و تجارت الکترونیک، لحظه به لحظه به حجم داده ها در پایگاه داده های مربوط اضافه شده و باعث به وجود آمدن انبارهای عظیمی از داده ها شده است به طوری که ضرورت کشف و استخراج سریع و دقیق دانش از این پایگاه داده ها را بیش از پیش نمایان کرده است .
چنان که در عصر حاضر گفته می شود « اطلاعات طلاست»
سابقه داده کاوی
داده کاوی و کشف دانش در پایگاه داده ها از جمله موضوع هایی هستند که همزمان با ایجاد و استفاده از پایگاه داده ها در اوایل دهه 80 برای جستجوی دانش در داده ها شکل گرفت.
شاید بتوان لوول (1983) را اولین شخصی دانست که گزارشی در مورد داده کاوی تحت عنوان « شبیه سازی فعالیت داده کاوی » ارائه نمود. همزمان با او پژوهشگران و متخصصان علوم رایانه، آمار، هوش مصنوعی، یادگیری ماشین و . . . نیز به پژوهش در این زمینه و زمینه های مرتبط با آن پرداخته اند.
فهرست مطالب
مقدمه
سابقه داده کاوی
بخش اول – مفهوم داده کاوی
1-1 – فرآیند داده کاوی
1-2 – ابزارهای داده کاوی
1-2-1 – هم پیوندی
1-2-2 – طبقه بندی
1-2-3 – الگوهای ترتیبی
1-2-4 – خوشه بندی
1-3 – کاربردهای داده کاوی
1-3-1 – کاربردهای تجاری
1-3-2 – کاربردهای علمی
1-3-3 – کاربردهای امنیتی
بخش دوم – داده کاوی توزیع شده
بخش سوم – عامل ها ، سِستمهای چند عامله و داده کاوی توزیع شده
3-1 – عامل
3-2 – سیستمهای چند عامله
بخش چهارم – پروسه ی کشف دانش از پایگاه داده
4-1 – ویژگی های KDD
4-1-1 – استخراج داده ها
4-1-2 – آماده کردن داده ها
4-1-3 – مهندسی داده ها
4-1-4 – مهندسی الگوریتم و تعیین استراتژی های کاوش
4-1-5- اجرای الگوریتم کاوش و ارزیابی نتایج
پاورپوینت بررسی ساختار سیستم اخذ داده
تعریف سیستم اخذ داده
هدف انجام پروژه: