跳到主要內容

簡易檢索 / 詳目顯示

研究生: 陳俊宇
Chen, Jyun-Yu
論文名稱: 使用貝氏 EMM 分析排序資料
Ranking Data Analysis by Bayesian Extended Mallows Model
指導教授: 翁久幸
Weng, Chiu-Hsing
口試委員: 黃子銘
Huang, Tzee-Ming
陳定立
Chen, Ting-Li
學位類別: 碩士
Master
系所名稱: 商學院 - 統計學系
Department of Statistics
論文出版年: 2024
畢業學年度: 112
語文別: 中文
論文頁數: 42
中文關鍵詞: 排序聚合貝氏估計網路搜尋引擎Extend Mallows ModelMallows Model
相關次數: 點閱:42下載:0
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 排序是常見的資料型態,利用排序聚合方法 (rank aggregation) 集結數個排序,以得到一個更可靠的聚合排序更是重要的課題。本論文建立在Li et al. (2020) 所提出的 Extended Mallows Model (EMM),一種用於分析排序資料的機率模型,EMM 在聚合排序的同時還可以衡量不同排序的差異。本文提出貝氏方法估計 EMM 的參數,發現貝氏估計相對於 Expectation Conditional Maximization (ECM) 演算法 (Meng and Rubin, 1993) 所迭代出的最大概似估計對起始值較不敏感,且可以藉由 MCMC 採樣值推論參數的不確定性。我們也嘗試了不同數量的起始值以觀察 ECM 的表現,發現當起始值數量增加,某些參數的最大概似估計的 MSE 會降低,但估計的排序與真實排序的 Kendall’s tau 距離卻略微上升。在實際資料分析的部分,本文比較不同網路搜尋引擎的差異,並聚合不同的
    搜尋結果。我們也分析 NBA Team Ranking 資料集 (Deng et al., 2014),並與其他方法做比較。


    第一章、緒論 1

    第二章、文獻探討回顧 3
    第 一 節、最佳化方法 3
    第 二 節、加權最佳化方法與交叉熵蒙地卡羅法 4
    第 三 節、BARD 模型 5
    第 四 節、Mallows 模型 5
    第 五 節、Partition-Mallows Model (PAMA) 7
    第 六 節、Extended Mallows Model (EMM) 8

    第三章、研究方法 10
    第 一 節、EMM 的貝式估計方法 10
    第 二 節、EMM 的參數檢定方法 13

    第四章、模擬實驗 14
    第 一 節、實驗 1 設定 14
    第 二 節、實驗 1 結果 16
    第 三 節、實驗 2 設定 20
    第 四 節、實驗 2 結果 21

    第五章、實際資料分析 24
    第 一 節、網路搜尋引擎比較 24
    1 關鍵字:web search engine 24
    2 關鍵字: 台灣地震 29
    第 二 節、NBA Team Ranking 資料集 34
    1 資料集 34
    2 分析結果 36

    第六章、結論 41

    參考文獻 42

    JC de Borda. M’emoire sur les’ elections au scrutin. Histoire de l’Acad’emie Royale des Sci-ences, 1781.
    Ke Deng, Simeng Han, Kate J Li, and Jun S Liu. Bayesian aggregation of order-based rank data. Journal of the American Statistical Association, 109(507):1023–1039, 2014.
    Cynthia Dwork, Ravi Kumar, Moni Naor, and Dandapani Sivakumar. Rank aggregation methods for the web. In Proceedings of the 10th international conference on World Wide Web, pages 613–622, 2001.
    Bradley Efron. Bootstrap methods: another look at the jackknife. In Breakthroughs in Statistics: Methodology and Distribution, pages 569–593. Springer, 1992.
    Michael A Fligner and Joseph S Verducci. Distance based ranking models. Journal of the Royal Statistical Society: Series B (Methodological), 48(3):359–369, 1986. Raivo Kolde, Sven Laur, Priit Adler, and Jaak Vilo. Robust rank aggregation for gene list integration and meta-analysis. Bioinformatics, 28(4):573–580, 2012.
    Han Li, Minxuan Xu, Jun S. Liu, and Xiaodan Fan. ExtMallows: An Extended Mallows Model and Its Hierarchical Version for Ranked Data Aggregation, 2018. URL https://CRAN.
    R-project.org/package=ExtMallows. R package version 0.1.0.
    Han Li, Minxuan Xu, Jun S Liu, and Xiaodan Fan. An extended mallows model for ranked data aggregation. Journal of the American Statistical Association, 115(530):730–746, 2020.
    Colin L Mallows. Non-null ranking models. i. Biometrika, 44(1/2):114–130, 1957.
    Xiao-Li Meng and Donald B Rubin. Maximum likelihood estimation via the ecm algorithm: A general framework. Biometrika, 80(2):267–278, 1993.
    Louis L Thurstone. A law of comparative judgment. Psychological Review, 101(2):266, 1994.
    Wanchuang Zhu. PAMA: Rank Aggregation with Partition Mallows Model, 2021. URL https://CRAN.R-project.org/package=PAMA. R package version 1.2.0.
    Wanchuang Zhu, Yingkai Jiang, Jun S Liu, and Ke Deng. Partition–mallows model and its inference for rank aggregation. Journal of the American Statistical Association, 118(541): 343–359, 2023.

    無法下載圖示 全文公開日期 2029/07/11
    QR CODE
    :::