فهرست و منابع پایان نامه استخراج اتوماتیک اطلاعات بر اساس آنتالوژی
فهرست:
فهرست لیست ها............................................................................................................................... و ۱- مقدمه ..........................................................................................................................................١
۱-۱- وب معنایی......................................................................................................................................
۱-۲- بازیابی و استخراج اطلاعات............................................................................................................
۱-۳- محدوده بحث و دستاورد تحقیق ..................................................................................................... ٥
۱-۴- طرح کلی بحث ............................................................................................................................... ٧
۲- مفاهیم و کلیات ...........................................................................................................................٩
۲-۱- معرفی آنتالوژی............................................................................................................................... ٩
۲–۱–۱– سطوح بازنمایی آنتالوژی.......................................................................................................................١١
۲–۱–۲– زبان های تعریف آنتالوژی.....................................................................................................................١٢
۲-۲- استخراج اطلاعات و وب معنایی...................................................................................................١٤
۲-۳- استخراج اطلاعات از انوع مختلف منابع متنی وب ........................................................................١٦
۲-۴- بازیابی اطلاعات و استخراج اطلاعات...........................................................................................١٧
۲- ۴-۱- "بازیابی داده" در مقابل "بازیابی اطلاعات"...............................................................................................١٩
۲- ۴-۲- "بازیابی اطلاعات برای وب معنایی" در مقابل "بازیابی اطلاعات مبتنی بر آنتالوژی"...................................٢٠
۲-۵- ایجاد آنتالوژی برای وب معنایی....................................................................................................٢٠
۲- ۵-۱- ایجاد دستی آنتالوژی ها..........................................................................................................................٢٠
۲- ۵-۲- ایجاد اتوماتیک آنتالوژی ها.....................................................................................................................٢٢
۲-۶- خلاصه مطالب و نتیجه گیری........................................................................................................٢٤
۳- بررسی سوابق مرتبط با تحقیق .................................................................................................. ٢٥
۳-۱- مقدمه ............................................................................................................................................٢٥
۳-۲- روش های مبتنی بر زبان های پرس و جو .....................................................................................٢٦
۳-۳- روش های مبتنی بر پردازش زبان طبیعی.......................................................................................٢٩
أ
۳-۴- روش های آگاه از HTML............................................................................................................٣٥
۳-۵- روش های استنتاج WRAPPER.....................................................................................................٣٨
۳-۶- روش های مبتنی بر آنتالوژی .........................................................................................................٤٢
۳-۷- خلاصه مطالب و نتیجه گیری........................................................................................................٤٦
٤٨ ............................................................................................ONTOBYONTO معرفی سیستم -۴
۴-۱- مقدمه ............................................................................................................................................٤٨
۴-۲- معماری سیستم ONTOBYONTO.................................................................................................٥٠
٥٢...............................................................................................WRAPPER زبان تعریف :WDML -۳-۴
۴- ۳-۱- معرفی مستندات ورودی.........................................................................................................................٥٣
۴- ۳-۲- معرفی قالب خروجی.............................................................................................................................٥٤
۴- ۳-۳- معرفی الگوی استخراج...........................................................................................................................٥٥
۴-۴- استخراج با استفاده از WDML.....................................................................................................٦٢
۴- ۴-۱- الگوریتم استخراج..................................................................................................................................٦٢
۴- ۴-۲- اجرای یک مثال......................................................................................................................................٦٦
۴-۵- خلاصه مطالب و نتیجه گیری........................................................................................................٦٨
۵- تولید اتوماتیک فایل های WDML........................................................................................... ٧٠
۵-۱- مقدمه ............................................................................................................................................٧٠
۵-۲- آنتالوژی استخراج .........................................................................................................................٧١
۵- ۲-۱- انتخاب زبان...........................................................................................................................................٧٢
۵- ۲-۲- تعریف کلاس ها....................................................................................................................................٧٣
۵- ۲-۳- تعریف خصوصیات................................................................................................................................٧٤
۵- ۲-۴- تعریف الگو ها.......................................................................................................................................٧٧
۵- ۲-۵- تعریف فهرست واژگان آنتالوژی.............................................................................................................٨١
۵- ۲-۵- آنتالوژی استخراج برای یک صفحه وب نمونه.........................................................................................٨٢
۵-۳- الگوریتم ایجاد اتوماتیک WDML................................................................................................٨٤
۵- ۳-۱- تولید WDML........................................................................................................................................٨٥
٨٧.......................................................................................................................................Wapper ایجاد -۲-۳ -۵
۵- ۳-۳- یافتن الگو ها..........................................................................................................................................٨٩
۵- ۳-۴- روتین های اولیه مورد نیاز در پردازش الگو ها........................................................................................٩٣
۵-۴- اجرای الگوریتم در یک صفحه نمونه ..........................................................................................١٠٢
۵-۵- خلاصه مطالب و نتیجه گیری......................................................................................................١٠٦
ب
۶- ارزیابی و جمع بندی مطالب ................................................................................................... ١٠٧
۶-۱- مقدمه ..........................................................................................................................................١٠٧
۶-۲- شاخص های ارزیابی...................................................................................................................١٠٨
۶-۳- روش و نتایج ارزیابی ..................................................................................................................١١٠
۶-۴- نقاط گسترش تحقیق...................................................................................................................١١٢
۷- منابع ....................................................................................................................................... ١١٣
۸- ضمائم .................................................................................................................................... ١١٦
۸-۱- آنتالوژی استخراج نمونه برای گوش های تلفن همراه .................................................................١١٦
منبع:
[ISC06] Internet Software Consortium, Last Visited: 05/05/2007, www.isc.org, Jannuary 2006
[Lee01] Berners-Lee, T, Hendler, J & Lassila, O, 2001. "The semantic web", Scientific American.
[Dac03] Michael C. Daconta, Leo J. Obrst, Kevin T. Smith, 2003. "The Semantic Web: A Guide to the Future of XML, Web Services and Knowledge Management", Wiley publishing.
[Dav03] John Davies, Dieter Fensel, and Frank van Harmelen, editors. "Towards the Semantic Web: Ontology-Driven Knowledge Management". John Wiley & Sons, 2003.
[Bro01] Broekstra, J. and Kampman, A., 2001. "Sesame: A generic Architecture for Storing and Querying RDF and RDF Schema". Deliverable 10, On-To-Knowledge project, October. http://www.ontoknowledge.org/downl/del10.pdf
[Wes05] Wessman, A., Liddle, S.W., Embley, D.W., “A generalized framework for an ontology-based data-extraction system”. In Proc. 4th Int. Conference on Information Systems Technology and its Applications, 239-253, 2005.
[Sha01] Shah, U., T. Finin, J. Mayfield. “Information retrieval on the Semantic Web” In Proceedings of the Eleventh International Conference on Information and Knowledge Management, McLean, Virginia, 4-9 November 2002, pp. 461-468.
[Sim05] Simon, K., and Lausen, G. 2005. "ViPER: augmenting automatic information extraction with visual perceptions". In Proc. CIKM'05, 381--388. ACM.
[Sno02] Snoussi H., Magnin L. and Nie J.-Y, "Toward an Ontology-based Web Data Extraction", The AI-2002 Workshop on Business Agents and the Semantic Web (BASeWEB) held at the AI 2002 Conference (AI-2002), Calgary, Alberta, Canada, May 26, 2002.
[Eng02-6] Robert Engels, 2002. "CORPORUM-OntoExtract: Extraction of structured information from web based resources", OnToKnowledge Project Report, Delivery
6.
[Eng02-7] Robert Engels, 2002. "CORPORUM-OntoWrapper: Extraction of structured information from web based resources", OnToKnowledge Project Report, Delivery
7.
[Onto07] The Onto-Knowledge Toolset, Last Visited: 05/05/2007, http://www.ontoknowledge.org/tools/toolrep.shtml.
[KIM07] KIM Online reference, Last Visited: 05/05/2007, http://www.ontotext.com
[Lae02] Laender, A., Ribeiro-Neto, B., Silva, A. and Teixeira, J. "A Brief Survey of Web Data Extraction Tools", in: SIGMOD Record, Volume 31, Number 2, June 2002.
[Bar05] Bartlett W., "A Comparison of Techniques for Exposing Legacy Data to Semantic Web Technologies", In Proc. 21st Annual Computer Science Conference, 2005.
[SEA07] SESAME Online Open Source, Last Visited: 05/05/2007, http://www.openrdf.org/documentation.jsp.
۱۱۳
[Pop03] B. Popov, A. Kiryakov, D. Ognyanoff, D. Manov, A. Kirilov, M. Goranov, "Towards Semantic Web Information Extraction", Human Language Technologies Workshop at the 2nd International Semantic Web Conference (ISWC2003), Florida, USA, 2003.
[Cun02] Cunningham H., Maynard D., Bontcheva K. and Tablan V., "GATE: A Framework,
Graphical Development Environment for Robust NLP Tools and Applications". In Proc. of the 40th Anniversary Meeting of the Association for Computational Linguistics, 2002.
[Luc07] Lucene - high performance full text search engine, Last Visited: 05/05/2007.
http://jakarta.apache.org/lucene.
[Fro97] Frohn, J., Himmer¨oder, R., Kandzia, P.T., Lausen, G., Schlepphorst, C., "FLORID: A Prototype for F-Logic", In: ICDE’97, IEEE Computer Society (1997) 583.
[FL07] “How to Write F-Logic Programs,” Online. Internet. Last Visited: 05/05/2007, http://ontoprise.de/documents/tutorial_flogic.pdf
[Aro98] Arocena, G., Mendelzon, A., "WebOQL: Restructuring Documents, Databases and Webs", Proceedings of International Conference on Data Eengineering, 1998.
[Sah00] A. Sahuguet and F. Azavant. "Building Intelligent Web Applications Using Lightweight Wrappers". to appear in: Data and Knowledge Engineering, 2000.
[Hmn06] Thomas Hornung, Kai Simon, Georg Lausen, "Information Gathering in a Dynamic World". PPSWR 2006: 237-241, Principles and Practice of Semantic Web Reasoning, 4th International Workshop, PPSWR 2006, Budva, Montenegro, June 1011, 2006, Revised Selected Papers.
[Chr07] Christopher D. Manning, P. Raghavan, H. Schütze."An Introduction to Information to Information Retrieval", Cambridge University Press, 2007.
[Wtn00] Ian H. Witten, Eibe Frank, “Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations”, Morgan Kaufman Publishers, 1-55860552-5, 2000.
[Ksl00] Kosala R., Blockeel H. “Web Mining Research: A Survey”, SIGKDD Explorations, July 2000.
[Baz99] Baeza-Yates, R. & Ribeiro-Neto, B. "Modern Information Retrieval", Addison Wesley, 1999.
[Arp03] Arpirez J. C., Corcho O., Fernandez-Lopez M., and Gomez-Perez A. "Webode in a nutshell". AI Magazine, 24(3):37-47, 2003
[Ksh00] Kushmerick, N. 2000. "Wrapper induction: Efficiency and expressiveness". Artificial Intelligence J. 118(1-2):15-68 (special issue on Intelligent Internet Systems).
[Crs05] M. Cristani, R. Cuel, “A Survey on Ontology Creation Methodologies”,
International Journal on Semantic Web and Information Systems, Vol. 1, No. 2, 49 – 69, 2005
[Emb98] D.W. Embley. "Toward semantic understanding - an approach based on information extraction ontologies". In Proceedings of the the Fifteenth Australasian Database Conference, Dunedin, New Zealand, January 2004.
[Eik99] Line Eikvil. "Information Extraction from World Wide Web - A Survey". Technical Report 945, Norweigan Computing Center, 1999.
۱۱۴
[Hau03] Y. Qi, A. Hauptmann, and T. Liu: “Supervised classification for video shot segmentation” in Proc. IEEE Conf. Multimedia Expo (ICME03) vol. 2, 2003, pp. 689-692.