| 研究生: |
林子涵 Lin, Tzu-Han |
|---|---|
| 論文名稱: |
基於熵模擬探討異質性群體慢性疾病風險 Exploring Chronic Disease Risks in Heterogeneous Populations Based on Entropy Simulation |
| 指導教授: |
周珮婷
謝復興 |
| 口試委員: | 陳怡如 |
| 學位類別: |
碩士
Master |
| 系所名稱: |
商學院 - 統計學系 Department of Statistics |
| 論文出版年: | 2025 |
| 畢業學年度: | 113 |
| 語文別: | 中文 |
| 論文頁數: | 54 |
| 中文關鍵詞: | 探索性類別資料分析 、列聯表 、熵 、條件熵 、熱圖 、路線圖 、Behavioral Risk Factor Surveillance System |
| 外文關鍵詞: | Categorical exploratory data analysis, Contingency table, Entropy, Conditional entropy, Heatmap, Roadmap, Behavioral Risk Factor Surveillance System |
| 相關次數: | 點閱:38 下載:0 |
| 分享至: |
| 查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報 |
本研究基於Kaggle平台提供的2015年BRFSS資料庫,針對不同的身體健康狀況與年齡層劃分子樣本異質性,並設計了一套基於熵模擬的探索性類別資料分析方法,旨在深入探討慢性疾病(心臟病與中風)與其他風險類別之間的關聯性。研究透過列聯表,分別在虛無假設與對立假設下進行熵值模擬,計算型一錯誤與型二錯誤的最小總和,並結合可靠性檢查與演算法,找出 24 組子樣本中1-階與2-階風險類別的交互作用。
我們對1-階疾病主風險類別進行階層分群,並以熱圖方式展示,從不同身體健康狀況與年齡層的雙重視角進行解讀。同時,我們以路線圖呈現二階疾病主風險類別的動態變化,並進一步區分為正向與負向類別進行探討。研究結果顯示,2-階交互效應可分為三種類型:對稱型、方向型與正負切換型,其中負向疾病風險類別的演化軌跡普遍比正向疾病風險類別更為複雜。本研究不僅揭示了疾病風險的動態演變特徵,還提供了一種有效的分析框架,為慢性疾病的預防與風險管理提供了新的視角與數據支持。
This study, based on the 2015 BRFSS dataset provided by the Kaggle platform, focuses on segmenting sample heterogeneity by different health conditions and age groups. It introduces an exploratory categorical data analysis method based on entropy simulation to deeply investigate the relationships between chronic diseases (heart disease and stroke) and other feature categories. Using contingency tables, entropy simulations were conducted under null and alternative hypotheses to calculate the minimal total of Type I and Type II errors. This approach, combined with reliability checks and algorithms, identified the interactions of major 1-featurre and major 2-feature categories across 24 subgroups. We performed hierarchical clustering of first-order major risk categories and visualized them using heatmaps, providing interpretations from the dual perspectives of general health conditions and age groups. Additionally, we used roadmaps to depict the dynamic changes of major 2-feature categories, further distinguishing them into positive and negative categories. The study revealed that second-order interaction effects can be classified into three types: symmetric, directional, and positive-negative switching. Among these, the evolutionary trajectories of negative disease risk categories were generally more complex than those of positive disease risk categories. This research not only highlights the dynamic evolution characteristics of disease risks but also provides an effective analytical framework, offering new perspectives and data support for the prevention and management of chronic diseases.
第一章 緒論 1
第一節 研究動機與目的 1
第二節 資料介紹 1
第三節 CEDA計算範式 3
第二章 文獻探討 4
第一節 劃分異質性 4
第二節 熵與條件熵 4
第三節 MRCI演算法 4
第四節 GenHL=5之子樣本 5
第三章 研究方法 6
第一節 列聯表 6
第二節 隨機性與熵值模擬 7
第三節 熵值之重疊比例 8
第四節 小結 11
第四章 研究結果 13
第一節 各GenHL之一階交互作用 13
第一項 GenHL=3之1-階主風險類別熱圖 13
第二項 GenHL=2之1-階主風險類別熱圖 16
第三項 GenHL=1之1-階主風險類別熱圖 17
第四項 GenHL=4之1-階主風險類別熱圖 19
第五項 GenHL=5之1-階主風險類別熱圖 21
第六項 GenHL之顯著異質性 23
第二節 各Age下之一階交互作用 24
第一項 Age=3之1-階主風險類別熱圖 24
第二項 Age=2之1-階主風險類別熱圖 26
第三項 Age=1之1-階主風險類別熱圖 28
第四項 Age=4之1-階主風險類別熱圖 30
第五項 Age=5之1-階主風險類別熱圖 33
第六項 Age=1至Age=5之1-階主風險類別結論 35
第三節 各Age下之二階交互作用 35
第一項 路線圖的應用 36
第二項 風險類別增強與變號的異質不對稱性 37
第三項 起點和終點之非對稱性 38
第四項 HighBP和HighChol的異質不對稱性 38
第五項 Sex在慢性疾病動態中的角色 39
第六項 家庭年收入組別對慢性疾病風險的方向性影響 39
第七項 小結 40
第五章 結論 41
參考文獻 42
附錄 44
附錄一 BRFSS資料變數介紹 44
附錄二 正向2-階主風險類別路線圖 45
附錄三 負向2-階主風險類別路線圖 50
高宏維(2024)。以基於熵值模擬之演算法探討類別資料中的複雜關聯(碩士論文,國立政治大學)。國立政治大學統計學研究所。
Shannon, C. E. (1948). A mathematical theory of communication. Bell System Technical Journal, 27(3), 379–423.
Wilkinson, L., & Friendly, M. (2009). The history of the cluster heat map. The American Statistician, 63(2), 179–184.
Fushing, H., Chou, E. P., & Chen, T.-L. (2023). Multiscale major factor selections for complex system data with structural dependency and heterogeneity. Physica A: Statistical Mechanics and its Applications, 630, 129227.
Fushing, H., Kao, H.-W., & Chou, E. P.-T. (2024). Topological risk-landscape in metric-free categorical database. IEEE Access. https://doi.org/10.1109/ACCESS.2024.3398416
Centers for Disease Control and Prevention. (2014). About BRFSS. Centers for Disease Control and Prevention.
Kolmogorov, A. N. (1983). On logical foundations of probability theory. Lecture Notes in Mathematics. https://www.cdc.gov/brfss/about/index.htm
Chen, T.-L., Chou, E. P., & Hsieh, F. (2022). Categorical nature of major factor selection via information theoretic measurements. Entropy, 23(12), 1684.
Chen, C., & Fushing, H. (2012). Multi-scale community geometry in network and its application. Physical Review E, 86, 041120.
Fushing, H., & Chen, C. (2014). Data mechanics and coupling geometry on binary bipartite network. PLoS ONE, 9(8), e106154.
全文公開日期 2030/02/03