| 研究生: |
蘇聖珠 Su, Sheng-Chu |
|---|---|
| 論文名稱: |
具有額外或不足變異的群集類別資料之研究 A Study of Modelling Categorical Data with Overdispersion or Underdispersion |
| 指導教授: | 陳麗霞 |
| 學位類別: |
博士
Doctor |
| 系所名稱: |
商學院 - 統計學系 Department of Statistics |
| 論文出版年: | 2000 |
| 畢業學年度: | 88 |
| 語文別: | 中文 |
| 論文頁數: | 98 |
| 中文關鍵詞: | 群集類別資料 、群內相關性 、額外變異 、不足變異 、Dirichlet-Multinomial模式 、最大概似估計式 、廣義最小平方估計式 |
| 外文關鍵詞: | categorical data, intra-cluster correlation, overdispersion, underdispersion, Dirichlet-Multinomial model, maximum-likelihood estimation, generalized least squares estimation |
| 相關次數: | 點閱:168 下載:46 |
| 分享至: |
| 查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報 |
進行調查時,最後的抽樣單位常是從不同的群集取得的,而同一群集內的樣本對象,因背景類似而對於某些問題常會傾向相同或類似的反應,研究者若忽略這種群內相關性,仍以獨立性樣本進行分析時,因其共變異數矩陣通常會與多項模式的共變異數矩陣相差懸殊,而造成所謂的額外變異或不足變異的現象。本文在不同的情況下,提出了Dirichlet-Multinomial模式(簡稱DM模式)、擴展的DM模式、以及兩種平均數-共變異數矩陣模式,以適當的彙整所有的群集資料。並討論DM與EDM模式中相關之參數及格機率之最大概似估計法,且分別對此兩種平均數-共變異數矩陣模式,提出求導廣義最小平方估計的程序。此外,也針對幾種特殊的二維表及三維表結構,探討對應的參數及格機率之估計方法。並提出計算簡易的Score統計檢定量以判斷群內相關(intra-cluster correlation)之存在性,及判斷資料集具有額外或不足變異,而對於不同母體的群內相關同質性檢定亦提出討論。
This paper presents a modelling method of analyzing categorical data with overdispersion or underdispersion. In many studies, data are collected from differ clusters, and members within the same cluster behave similary. Thus, the responses of members within the same cluster are not independent and the multinomial distribution is not the correct distribution for the observed counts. Therefore, the covariance matrix of the sample proportion vector tends to be much different from that of the multinomial model. We discuss four different models to fit counts data with overdispersion or underdispersion feature, witch include Dirichlet-Multinomial model (DM model), extended DM model (EDM model), and two mean-covariance models. Method of maximum-likelihood estimation is discussed for DM and EDM models. Procedures to derive generalized least squares estimates are proposed for the two mean-covariance models respectively. As to the cell probabilities, we also discuss how to estimate them under several special structures of two-way and three-way tables. More easily evaluated Score test statistics are derived for the DM and EDM models to test the existence of the intra-cluster correlation. And the test of homogeneity of intra-cluster correlation among several populations is also derived.
封面頁
證明書
致謝詞
論文摘要
目錄
第一章 緒論
1.1 研究動機與目的
1.2 文獻回顧
1.3 研究方法
1.4 章節架構
第二章 群集類別資料集與DM及EDM模式
2.1 群集類別資料集與DM分配
2.2 多個母體的DM模式架構
2.3 擴展的DM模式
第三章 群內相關係數之檢定
3.1 群內相關存在性之檢定
3.1.1 單一母體的群內相關存在性之檢定
3.1.2 多個母體的群內相關存在性之檢定
3.2 額外或不足變異之檢定
3.3 群內相關係數之同質性檢定
3.4 實例
第四章 DM及EDM模式下類別機率的估計
4.1 類別機率的最大概似估計式
4.1.1 當群內相關係數為已知時
4.1.2 當群內相關係數為未知時
4.2 特殊型態的列聯表格機率之估計
4.2.1 二維列聯表
4.2.1.1 獨立性結構
4.2.1.2 對稱性結構
4.2.2 三維列聯表
4.2.2.1 相互獨立性結構
4.2.2.2 聯合獨立性結構
4.2.2.3 條件獨立性結構
4.2.2.4 無三階交互作用
4.2.2.5 對稱性結構
4.3 數值分析法
4.4 實例
第五章 額外變異模式下類別機率的估計
5.1 額外變異模式
5.1.1 EW及EMK模式
5.1.2 EW及EMK模式的差異
5.2 EW模式之參數估計
5.2.1 類別機率的估計
5.2.2 變異因子的估計
5.2.3 參數之近似分配及模式之適合度檢定
5.3 EMK模式之參數估計
5.4 特殊型態的列聯表格機率之估計
5.4.1 二維列聯表
5.4.1.1 獨立性結構
5.4.1.2 對稱性結構
5.4.2 三維列聯表
5.4.2.1 相互獨立性結構
5.4.2.2 聯合獨立性結構
5.4.2.3 條件獨立性結構
5.4.2.4 無三階交互作用
5.4.2.5 對稱性結構
5.5 實例
第六章 模擬研究
6.1 利用DM分配產生群集類別資料集
6.2 樣本大小配置對同質性檢定的影響
6.2.1 參數的範圍設定
6.2.2 模擬結果
6.3 模擬比較最大概似估計值與動差估計值
第七章 結論
附錄
附錄一 最大概似法之訊息矩陣
附錄二 求解最陡上升法程式之MATLAB程式
附錄三 模擬群集類別資料之程式
附錄四 卡方同質性檢定下,群集數與群內樣本數的配置模擬
附錄五 最大概似估計值與動差估計值之比較模擬
參考文獻