範例學習(Learning-from-Example, LFE)技術的發展,在人工智慧發展領域中,已成功地突破關於知識萃取的瓶頸,並廣泛地應用到諸多評估或預測模式以及專家系統的建立。在本研究中,以台灣上市公司歷年來的財務報表資訊,進行企業盈虧的預測,並探討判斷個案申出現資訊遺漏與雜訊時,對範例學習系統在企業盈虧預測所產生之影響。主要的影響分別為預測績效的衰減(attenuating)與干擾(disturbing)兩類。本研究並藉由「資料預先處理轉換」及「修正系統演算法」兩方面著手,來避兔或減少上述現象發生時,對範例學習系統在企業盈虧預測績效所造成之影響。
因此本研究主要以民國七十五年到八十四年期間,共十五項大小產業之股票上市公司財務報表及股價報酬等資料作為研究樣本,整體市場共計有3199筆樣本資料。而研究的進行可分為實驗設計階段以及實証資料測試階段。
實驗設計階段中,將探討當建樹或預測之資料含有資訊遺漏與雜訊時,對企業盈虧預測範例學習系統所造成之衰減與干擾效果。在資訊遺漏之探討下,分就「資料預先處理轉換」及「修正系統演算法」兩方面,評比了「線性內插法」、「迴歸預測法」、「獨立分群法」及「多重線索分割法」等四種之遺漏值解決方案,在區別能力及預測績效上之差異性;在雜訊之探討,則了解到雜訊對範例學習系統究竟會造成多大之干擾效果,並進一步測試雜訊過濾器是否能降低部份之干擾效果。
而接下來的實証資料測試階段,則以實証資料測試上述各種模式及方法,而獲得之結果將和實驗設計階段之結果作一比較對照,以符合實務應用之狀況。而根據研究結果顯示,主要可獲得下列結論:
一、分就:1. 建樹資料含遺漏或雜訊,2. 預測資料含遺漏或雜訊,3. 建樹及預測資料同時含遺漏或雜訊,三種情況考量。則第2種情況下對範例學習系統所造成之衰減或干擾效果相對較大,第3種情況次之,第1種情況較無影響。
二、在資訊遺漏之探討下:
(一)、「迴歸預測法」及「多重線索分割法」最能避免衰減效果之發生,但前提是必需存在高度相關之替代線索。
(二)、最為簡便也最常被使用之「線性內插法」,並無法有效排除遺漏值所造成之衰減效果,而這和財務比率線索不具備單調性(Monotonicity)之原因有關。
(三)、對於遺漏值之處理若是採取整筆刪除之作法,則對系統之預測績效而言(命中率)可能造成較大之衰減效果,因為其可能破壞學習樣本資料之代表性。
(四)、在無高度相關替代線索,或者是系統之例子資料庫含有計質性(Qualitative)線索時,可以「獨立分群法」來降低遺漏值之衰減效果。
三、在雜訊之探討下:
(一)、雜訊對範例學習系統之干擾效果是存在的,因此在蒐集處理樣本資料之過程中,即應小心避免雜訊混入其中。
(二)、雜訊過濾器能否排除影響樣本代表性之極端值,就結果看來並不能獲得一致之結論;或者是對極端值取捨之界限定義應為何?則有待更進一步之研究。
論文摘要-----I
目錄-----III
表目錄-----V
圖目錄-----VI
第一章 緒論-----1
第一節 研究背景與動機-----1
第二節 研究目的-----3
第三節 研究對象及範圍-----4
第四節 本文章節架構-----5
第二章 文獻探討-----7
第一節 財務報表資訊與盈餘預測-----7
第二節 範例學習法-----11
第三節 資訊遺漏與雜訊-----21
第三章 研究設計-----26
第一節 研究樣本及變數-----26
第二節 IDC4範例學習系統-----37
第三節 資訊遺漏與雜訊及衡量指標-----42
第四節 研究程序架構-----45
第五節 研究限制-----59
第四章 研究結果-----60
第一節 資訊遺漏之衰減效果-----62
第二節 雜訊之干擾效果-----72
第三節 實証資料測試-----77
第五章 結論及建議-----84
第一節 結論及建議-----84
第二節 後續研究方向-----88
參考文獻-----90
表2-1 範例學習法在商管應用上之相關文獻-----14
表2-2 TDIDT演算法及其相關文獻-----16
表2-3 屬性、目標值之列表-----18
表2-4 選取分割準則之定義-----19
表2-5 決策樹修剪方法比較-----20
表3-1 選取樣本之產業及年度資料筆數-----27
表3-2 企業營餘預測常用之財務比率-----29
表3-3 企業營餘預測之財務比率操作性定義-----30
表3-4 41個財務比率進行因素分析之結果-----34
表3-5 經範例學習法選取後之輸入變數-----35
表3-6 目標值之定義-----36
表3-7 例子資料庫之結構組成-----38
表4-1 九個輸入變數之替代線索及相關程度-----63
表4-2 建樹資料含遺漏值之衰減效果-資料預先處理轉換-----64
表4-3 建樹資料含遺漏債之衰減效果-修正系統演算法-----65
表4-4 預測資料含遺漏值之衰減效果-資料預先處理轉換-----66
表4-5 預測資料含遺漏值之衰減效果-修正系統演算法-----67
表4-6 建樹及預測資料含遺漏值之衰減效果-資料預先處理轉換-----69
表4-7 建樹及預測資料含遺漏值之衰減效果-修正系統演算法-----70
表4-8 建樹或預測資料含雜訊對範例學習系統之干擾效果-----73
表4-9 利用雜訊過濾器排除極端值之效果-----75
表4-10 原始樣本含線索值遺漏之比例-----78
表4-11 實証資料測試-資料預先處理轉換-----79
表4-12 實証資料測試-修正系統演算法-----80
表4-13 雜訊過濾器結合多重線索分割法之效果-----81
圖3-1 樣本期間示意圖-----27
圖3-2 本研究進行之程序架構-----47
圖3-3 兩線索間之線性迴歸預測線-----50
圖3-4 獨立分群法之示意圖-----51
圖3-5 最大概似預測示意圖-----52
圖3-6 多重線索分割法之例子線索及分割圖-----54
圖3-7 正負相關替代線索之判斷準則示意圖-----55
圖3-8 迴歸預測取代極端值之示意圖-----58
圖4-1 實驗設計階段所採用之樣本期間及筆數-----61
圖4-2 動樣本期間的示意圖-----77
(限達賢圖書館四樓資訊教室A單機使用)