فهرست و منابع پروژه Data Mining ( داده کاوی )
فهرست:
فهرست اشکال ...............................................................................................................................................
10
فهرست جداول ..............................................................................................................................................
11
فصل1: مقدمهای بر دادهکاوی ............................................................................
13
1-1 تعریف دادهکاوی ...................................................................................................................................
15
2-1 تاریخچه دادهکاوی ................................................................................................................................
16
3-1 چه چیزی سبب پیدایش دادهکاوی شده است؟ ........................................................................................
17
4-1 اجزای سیستم دادهکاوی .........................................................................................................................
19
5-1 جایگاه دادهکاوی در میان علوم مختلف ..................................................................................................
21
6-1 قابلیتهای دادهکاوی .................................................................................................................................
22
7-1 چرا به دادهکاوی نیاز داریم؟ ...................................................................................................................
23
8-1 دادهکاوی چه کارهایی نمیتواند انجام دهد؟ ..........................................................................................
25
9-1 کاربردهای دادهکاوی .............................................................................................................................
25
1-9-1 کاربردهای پیشبینیکننده ...................................................................................................
27
2-9-1 کاربردهای توصیفکننده ....................................................................................................
27
10-1 ابزارهای تجاری دادهکاوی ...................................................................................................................
28
11-1 دادهکاوی و انباردادهها .........................................................................................................................
29
1-11-1 تعاریف انبارداده ................................................................................................................
29
2-11-1 چهار خصوصیت اصلی انبارداده .........................................................................................
30
3-11-1 موارد تفاوت انبارداده و پایگاه داده ....................................................................................
31
12-1 دادهکاوی و OLAP ...........................................................................................................................
33
1-12-1 OLAP ...........................................................................................................................
33
2-12-1 انواع OLAP ...................................................................................................................
34
13-1 مراحل فرایند کشف دانش از پایگاه دادهها ...........................................................................................
34
1-13-1 انبارش دادهها ....................................................................................................................
35
2-13-1 انتخاب دادهها ....................................................................................................................
36
3-13-1 پاکسازی- پیشپردازش- آمادهسازی ................................................................................
36
4-13-1 تبدیل دادهها ......................................................................................................................
36
5-13-1 کاوش در دادهها (Data Mining) .................................................................................
37
6-13-1 تفسیر نتیجه ........................................................................................................................
38
فصل 2: قوانین ارتباطی ...........................................................................
39
1-2 قوانین ارتباطی ........................................................................................................................................
40
2-2 اصول پایه ...............................................................................................................................................
41
1-2-2 شرح مشکل جدی ...............................................................................................................
41
2-2-2 پیمایش فضای جستجو .........................................................................................................
43
3-2-2 مشخص کردن درجه حمایت مجموعه اقلام .........................................................................
45
3-2 الگوریتمهای عمومی ..............................................................................................................................
45
1-3-2 دستهبندی ............................................................................................................................
45
2-3-2 BFS و شمارش رویدادها ...................................................................................................
46
3-3-2 BFS و دونیمسازی TID-list ...........................................................................................
47
4-3-2 DFS و شمارش رویداد ......................................................................................................
47
5-3-2 DFS و دو نیمسازی TID-list ..........................................................................................
48
4-2 الگوریتم Apriori ................................................................................................................................
48
1-4-2 مفاهیم کلیدی .....................................................................................................................
48
2-4-2 پیادهسازی الگوریتم Apriori ............................................................................................
49
3-4-2 معایب Apriori و رفع آنها .................................................................................................
54
5-2 الگوریتم رشد الگوی تکرارشونده ..........................................................................................................
55
1-5-2 چرا رشد الگوی تکرار سریع است؟ .....................................................................................
58
6-2 مقایسه دو الگوریتم Apriori و FP-growth ......................................................................................
59
7-2 تحلیل ارتباطات ......................................................................................................................................
63
فصل 3: وبکاوی و متنکاوی .................................................................
65
1-3 وبکاوی ...............................................................................................................................................
66
1-1-3 الگوریتمهای هیتس و لاگسام ...............................................................................................
69
2-1-3 کاوش الگوهای پیمایش مسیر ..............................................................................................
76
2-3 متنکاوی ...............................................................................................................................................
80
1-2-3 کاربردهای متنکاوی ...........................................................................................................
82
1-1-2-3 جستجو و بازیابی ..............................................................................................
83
2-1-2-3 گروهبندی و طبقهبندی ......................................................................................
83
3-1-2-3 خلاصهسازی ....................................................................................................
84
4-1-2-3 روابط میان مفاهیم .............................................................................................
84
5-1-2-3 یافتن و تحلیل گرایشات ....................................................................................
84
6-1-2-3 برچسب زدن نحوی (pos) ...............................................................................
85
7-1-2-3 ایجاد Thesaurus و آنتولوژی به صورت اتوماتیک .........................................
85
2-2-3 فرایند متنکاوی ...................................................................................................................
86
3-2-3 روشهای متنکاوی ...............................................................................................................
87
مراجع .....................................................................................................
89
منبع:
] دادهکاوی (Data Mining)، تالیف مهمد کانتاردزیک، ترجمه امیر علیخانزاده، 1385، ویرایش اول
[2] Introduction to Data Mining and Knowledge Discovery، Two Crows Corporation، 1999
[3] Data Mining: Concepts and Techniques، M.Kamber and J.Han، 2001
[4] مقاله Algorithms for Association Rule Mining – A General Survey and comparison نوشته Jochen Hipp و Gholamreza Nakhaeizadeh ، در کنفرانس ACM SIGKDD July 2000
[5] مقاله Comparative Study of Association Rules Mining Algorithms نوشته Stefan Holban (http://www.bmf.hu/conferences/saci04/Gyorodi.pdf)
[6]
http://ece.ut.ac.ir/DBRG/seminars/Keykhah/Data Mining/Data mining.doc
http://ece.ut.ac.ir/DBRG/seminars/Ghadimi-Abbasi-Pashaei/Document/datamining_Introduction.doc