| 研究生: |
張瑾芳 Zhang, Jin-Fang |
|---|---|
| 論文名稱: |
二分類中隨機性的研究 無 |
| 指導教授: |
陳超塵
Chen, Chao-Chen |
| 學位類別: |
碩士
Master |
| 系所名稱: |
商學院 - 統計學系 Department of Statistics |
| 論文出版年: | 1982 |
| 畢業學年度: | 70 |
| 語文別: | 中文 |
| 論文頁數: | 36 |
| 中文關鍵詞: | 分類 、隨和性 、線性分類程序 、機率預測值 、期望值 、二元變數 、統計 |
| 相關次數: | 點閱:83 下載:0 |
| 分享至: |
| 查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報 |
第一章前言
許多二分事件或二分隨機變數的出象(outcome)是取1或0的值,其出現的機率分別為P或1—P,P值可能是0與1之間的任何實數。例如:有一模式預測甲球隊比賽贏的機率P為0.9,因此我們「猜」甲隊將贏,意卽姑且令P=1,結果正好是甲贏,但是真實的P可能為0.1,吾人只是幸運而已;相反地,這裡的P正等於P=0.9,結果甲却輸了,因為這裡存在10%的機會是事件發生的結果與事前的分類相反的情形。上例存在二個問題:第一、該模式所輸出此二分事件發生之機率預測值呈否正確的問題;第二、分類手續是否適當的問題。本文所討論的內容卽有關於分類手續問題的研討。
目前所作的判別分析中(discriminant analysis),大都將二類群體當作具有相同互變數矩陣(Covariance matrices)的二個多變量常態分配來處理,總是藉著估計槪度比(likelihood ratio),導出線型判別函數(linear discriminant function),因著二群體數量相差不大,可產生適當的分類程序(classification procedure)。旣然槪度比是估計的,它和實際必有誤差,Lachenbruch(1975)提出分錯比率的估計機率,Beckwith與Morrison(1977)提出在槪度比已知下,對2×2分類表的分對比率希望數之上下限,並月發現此比率不高;這表示卽使有最好的估計方法得到正確的模式預測出每一個體Yi發生1的真機率,也不大可能提供百分之百的正確分類。本文欲比照有關分對比率C之分配的決定因素來加上假定,以求出可能的C分配,達到吾人可以預先控制C的希望數之目的。
本文第一章略述線性分類程序之槪觀;吾人主要的目的是要把每個個體的行為都預測到或分對了類(因此理論上是當利用被正確分類的個體在整體中所佔的比率C或E(C)來評價把個體二分類之手續的好壞);但是分類還得需要藉著P,所以第二章列出機率預測值與個體值的關係,表示吾人希望實際二分事件的發生結果能被所得知的P解釋出相當大的比重,或者說二分事件真實結果的總變異數中有相當大的比例可被已知的估計式所解釋。第三章述明分類結果中分對例的上下限,以作為本文的背景。第四章挑出前章的假定,加入必要的假定,導出與C相當的分對次數之分配,作為第五章的憑據。第五章結論,提出本文在特例中的發展,對Beckwith與Morrison(1977)的有關結論作進一步的分析,並探討有國C分配的可能決定因素。
目錄
第一章 前言1
第二章 線性分類程序之槪觀3
第三章 機率估計值與個體值的關係7
第四章 分對個體比率的上下限期望值10
第五章 二分變數之機率標準值未知時的處理模型19
第六章 結論29
1.二分變數的機率估計值之分配與其分對比率之分配的關係21
2.分類程序的結果31
參考文獻33
參考文獻
[ 1 ] Abramowitz,M., and Stegun. I. A.. eds. (1964), Handbook of Mathematical Functions , Washington, D.C. : U.S. Department of Commerce , National Bureau of Standards ,Applied Mathematics Series 55.
[ 2 ] Anderson , T.W. (1958) , An Introduction to Multi- variate Analysis ,New York:John Wiley & Sons.
[ 3 ] Beckwith , N.E., and Morrison D.G. (1977) ,“Stochastic Interpretation of 2 X 2 Classification Ta Tables” ., JASA. 72 , 303-8.
[ 4 ] Frank ,R.E. , Massy, W.F. , and Morrison , D.G. (1965). “Bias in Multiple Discriminant Analysis,“ Journal of Marketing Research, 2, 250-8.
[ 5 ] Goldberger ,Arthur S. (1973). “ Correlations Between Binary Outcomes and Probabilistic Predictions,” JASA , 68,84.
[ 6 ] Gupta Somesh Das. (1973), ”“Theories and Methods in Classification : A Review.” In Discriminant Analysis and Applications , pp.77-137. Edited by T. Cacoullos. New York and Londen : Academic Press.
[ 7 ] Han , Chien-Pai (1979) , “Alternative Methods of Estimating the Likelihood Ratio in Classification of Multivariate Normal Observations , “ The American Statistician , 33 , 204-6.
[ 8 ] Johnson, N.L. ,and kotz , Samuel (1969) , Distributions in Statistics : Discrete Distributions , Boston : Houghton Mifflin Company.
[ 9 ]________ . (1970) , Distributions in Statistics : Continuous Univariate Distributions -Ⅱ, Boston : Houghton Mifflin Company.
[10] Massy , William F. (1965), “ Discriminant Analysis of Audience Characteristics , ” Jousnal of Advertising Research , 5 , 39-48.
[11] Morrison , D. G. (1972), “ Upper Bounds for Correlations Between Binary Outcomes and Probabilistic Predictions , “ JASA , 67 , 68-70.
[12]________ . (1969) , “On the Interpretation of Djscriminant Analysis ,“ Journal of Marketing Research , 6 , 156-63.
[13] Murray , Gordon D.(1977) , “ A Note on the Estimation of Probability Density Functions ,“ Biometrika , 64 , 150-2.
[14] Wise , M.E. (1954) , “ A Quickly Convergent Expansion for Cumulative Hypergeometric Probabilities , Direct and Inverse ,“ Biometrika, 41 , 317-29.
(限達賢圖書館四樓資訊教室A單機使用)