| 研究生: |
賴昌彥 Lai, Chang-Yen |
|---|---|
| 論文名稱: |
科技政策網站內容分析之研究 |
| 指導教授: | 劉文卿 |
| 學位類別: |
碩士
Master |
| 系所名稱: |
商學院 - 資訊管理學系 Department of Management Information System |
| 論文出版年: | 2000 |
| 畢業學年度: | 88 |
| 語文別: | 中文 |
| 論文頁數: | 66 |
| 中文關鍵詞: | 資訊檢索 、資訊擷取 、元資料 、文字開採 、資源描述架構 、多維度資料庫 |
| 外文關鍵詞: | Information Retrieval, Information Extraction, Metadata, Text Mining, Resource Description Framework, Multi-Dimensional Database |
| 相關次數: | 點閱:67 下載:30 |
| 分享至: |
| 查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報 |
面對全球資訊網(WWW)應用蓬勃發展,網際網路上充斥著各種類型的資訊資源。而如何有效地管理及檢索這些資料,就成為當前資訊管理的重要課題之一。在發掘資訊時,最常用的便是搜尋引擎,透過比對查詢字串與索引表格(index table),找出相關的網頁文件,並回傳結果。但因為網頁描述資訊的不足,導致其回覆大量不相關的查詢結果,浪費使用者許多時間。
為了解決上述問題,就資訊搜尋的角度而言,本研究提出以文字開採技術實際分析網頁內容,並將其轉換成維度資訊來描述,再以多維度資料庫方式儲存的架構。做為改進現行資訊檢索的參考架構。
就資訊描述的角度,本研提出採用RDF(Resource Description Framework)來描述網頁Metadata的做法。透過此通用的資料格式來描述網路資源,做為跨領域使用、表達資訊的標準,便於Web應用程式間的溝通。期有效改善現行網際網路資源描述之缺失,大幅提昇搜尋之品質。
封面頁
證明書
致謝詞
論文摘要
目錄
表目錄
圖目錄
第壹章 緒論
第一節 研究背景
第二節 研究動機
第三節 問題與研究目的
第四節 研究流程架構
第貳章 文獻探討
第一節 資訊檢索與資訊擷取
第二節 網頁METADATA概念
第三節 RDF (RESOURCE DEFINITION FRAMEWORK)
第四節 文字開採(TEXT MINING)概念
第參章 研究方法
第一節 多維度資料庫分析
第二節 研究模型
第三節 研究模型之組成元件
第肆章 雛型系統建置
第一節 網站資訊蒐集
第二節 系統建置工具及環境
第三節 系統實作
第伍章 結論與建議
第一節 研究結論
第二節 研究建議
參考文獻
附錄
附錄一 XSL定義
附錄二 XSL定義2
中文部份:
卜小蝶,「圖書資訊檢索技術」,文華圖書館資訊股份有限公司,民國85年11月。
李淑銘,「多維度資料庫設計方法之研究」,政治大學資訊管理系碩士論文,民國87年5月。
吳政叡,「從元資料看未來資料著錄的發展趨勢」,資訊傳播與圖書館學4卷2期(民國86年12月),頁42-52。
陳昶宏,「運用RDF知識描述機制之網際網路資訊搜尋」,中興大學資訊科學研究所碩士論文,民國87年六月。
陳雪華,「網路資源組織與Metadata之發展」,圖書館學刊12期(民國86年12月),頁19-37。
英文部份:
書藉
Berson, A. and Smith, S. J., Data Warehousing, Data Mining, and OLAP , New York : Computing McGraw-Hill, 1997, pp.16
Chowdhury, G. G., Introduction to modern information retrieval , London : Library Association Publishing, 1999, pp.1
IBM, Intelligent Miner for Text : Getting Started , IBM Corp, 1998
Jones, K. S. and Willet, P., Readings in Information Retrieval , CA : Morgan Kaufmann Publishers, 1997,pp.1-7
Liston , D. M. and Schoene, M. L., A systems approach to the design of information systems , New York : Knowledge Industry, 1978, pp.327-334
Rowley, J., The basics of information systems , London : Library Association Publishing, 1996
期刊論文
Baeza-Yates, R. A., Searching the WWW: Challenges and Possible Solutions. (Invited paper) In IBERAMIA'98, October 1998.
Chakrabarti, S., Dom, B. E., Gibson, D., Kleinberg, J., Kumar, R., Raghavan, P., Rajagopalan, S. and Tomkins, A., Mining the link structure of the World Wide Web. IEEE Computer, February 1999.
Chaudhuri, S. and Dayal, U., An Overview of Data Warehousing and OLAP technology. SIGMOD Record: 65-74 (1997).
Crovella, M. E. and Bestavros, A., Self-Similarity in World Wide Web Traffic: Evidence and Possible Causes. in IEEE/ACM Transactions on Networking, December 1997.
Dempsey, L. and Heery, R., Specification for resource description methods Part 1: A review of metadata: a survey of current resource description formats. March 1997.
Feldman, R., Aumann, Y., Fresko, M., Lipshtat, O., Rosenfeld, B. and Schler, Y., : Text Mining via Information Extraction. PKDD 1999: 165-173.
Florescu, D., Levy, A. Y. and Mendelzon, Alberto O., Database Techniques for the World-Wide Web: A Survey. SIGMOD Record 27(3): 59-74 (1998).
Gaizauskas, Robert and Wilks, Y., Information Extraction: Beyond Document Retrieval. Journal of Documentation, 1997.
Kuny, T., Metadata: An Introduction and Survey of Initiatives. Network Backgrounder, October 1995.
Landau, D., Feldman, R., Aumann, Y., Fresko, M., Lindell, Y., Liphstat, O. and Zamir, O., : TextVis: An Integrated Visual Environment for Text Mining. PKDD 1998: 56-64.
Lassila, O., : Web Metadata: A Matter of Semantics. In: IEEE Internet Computing. July/August 1998. 30-37.
Mecca, G., Mendelzon , A. O. and Merialdo, P., Efficient Queries over Web Views. EDBT: 72-86 (1998).
Mendelzon, A. O., Mihaila, G. A. and Milo, T., Querying the World Wide Web. Int. J. on Digital Libraries 1(1): 54-67 (1997).
Sherman, C., : The Future of Web Search. In: Online, May/June 1999. Special Issue Web Search Engines. 23 (3) 1999, 54-61.
Soderland, S., Learning Information Extraction Rules for Semi-structured and Free Text. Machine Learning , 1999.
Zechner, K., A Literature Survey on Information Extraction and Text Summarization. Term paper, Carnegie Mellon University , 1997.
網站部份
中文
行政院國家科學委員會,中華民國科學技術年鑑,民國86年。
http://www.nsc.gov.tw/pub/ybook97/home.htm
國科會科學技術資料中心科技政策資訊網,國內研究機構網站,民國86年。
http://www.stic.gov.tw/stic/policy/domestic.htm#res
英文
Cambridge Scientific Abstracts, Stopword List.
http://www.csa.com.tw/helpV3/stopword.html
Codd, E. F., Providing OLAP to User-Analysis : An IT Mandate. 1993.
http://www.arborsoft.com/essbase/wht_ppr/coddcl.html
Direct Hit, Popularity Engine Technology.
http://www.directhit.com/
Dublin Core Metadata Initiative,Dublin Core Metadata Element Set. July 1999.
http://purl.org/dc/documents/rec-dces-19990702.htm
Eikvil, L., Information Extraction from World Wide Web - A Survey. July 1999.
http://www.nr.no/research/samba/tm_survey.ps
GVC(Visualization & Usability Center), GVU Survey Results.
http://searchenginewatch.com/reports/gvu.html
internet.com Corp., Search Engine Sizes.
http://www.searchenginewatch.com/reports/sizes.html
Kimball, R., Drilling Down, Up, and Across(Understanding the vocabulary of navigating dimensions). March, 1996.
http://www.dbmsmag.com/9603d05.html
Lassila, O. and Swick R. R., Resource Description Framework (RDF) Model and Syntax Specification. Feb, 1999.
http://www.w3.org/TR/REC-rdf-syntax/
Rappoport, A., Report on the 1999 Search Engines Meeting.
http://www.searchtools.com/info/meetings/searchenginesmtg/index.html
World Wide Web Consortium, Extensible Stylesheet Language (XSL). March, 2000.
http://www.w3.org/TR/xsl/
World Wide Web Consortium, Platform for Internet Content Selection (PICS).
http://www.w3.org/PICS/
World Wide Web Consortium, Resource Description Framework (RDF).
http://www.w3.org/RDF/