• 主管部门:
  • 中国科学院
  • 主办单位:
  • 中科院科技战略咨询研究院
  • 出版单位:
  • 世界科学技术杂志社
    科学出版社
  • 主编:
  • 陈凯先
  • 执行主编:
  • 胡镜清 陈士林 叶阳
  • 副主编:
  • (按姓氏笔划排列)王 伟 王 阶 王拥军 王喜军 孔令义 吕文亮 孙晓波 李 萍 李志刚 张卫东 陈立典 果德安 罗国安 赵军宁 徐宏喜 高秀梅 唐旭东 梁繁荣 葛金文
  • 名誉社长:
  • 徐伟宣
  • 社长:
  • 张志华
  • 编辑部主任:
  • 王 瑀
  • 编辑部:
  • 张娜娜 马雅静 方垚 王涵 何岸波 郭嫦娥
  • 责任译审:
  • 王晶
  • 国际刊号:
  • 1876-3553
  • 国内刊号:
  • 11-5699/R
  • 社址:
  • 北京市海淀区中关村东路55号思源楼1203
  • 邮编:
  • 100190
  • 电话:
  • 010-62616352
  • 网址:
  • www.wst.ac.cn
  • E-mail:
  • wst@casipm.ac.cn
  • 海外发行号:
  • M1644
  • 邮刊代号:
  • 2-534

运用Cox模型时打结数据的处理方法探讨
Discussion on Methods for Tied Survival Times in Cox Model
投稿时间:2017-05-18  修订日期:2017-08-23
DOI:
中文关键词:  生存分析 Cox模型 打结数据 部分似然函数
英文关键词:Survival analysis, Cox model, tied data, partial likelihood function
基金项目:中国人民大学2017年度‘中央高校建设世界一流大学(学科)和特色发展引导专项资金’,负责人:易丹辉;和教育部人文社会科学重点研究基地重大项目(16JJD910002):基于大数据的精准医学生物统计分析方法及其应用研究,负责人:易丹辉。
作者单位
张文丽 中国人民大学应用统计科学研究中心 北京 100872中国人民大学统计学院 北京 100872 
张彤 中国中医科学院西苑医院 北京 100091 
易丹辉 中国人民大学应用统计科学研究中心 北京 100872中国人民大学统计学院 北京 100872 
杨宇飞 中国中医科学院西苑医院 北京 100091 
摘要点击次数: 97
全文下载次数: 122
中文摘要:
      Cox回归模型是目前生存分析中最为广泛使用的方法之一,模型的假设之一是失效时间不存在打结情况,即个体之间有着不同的失效时间。在实际应用当中,生存时间数据存在打结是很常见的。目前有四种常见的处理方法:Exact法,discretemodel法,Efron法以及Breslow法。本文研究目的是比较这四种处理方法的优劣。本文采用模拟进行比较,设置了不同的样本量和打结程度,比较四种方法在拟合统计量,计算时间,参数估计精确性等方面的表现,发现Exact法和discretemodel拟合统计量结果最好,但计算耗时最久;Efron法以及Breslow法运算较快但是在参数估计方面存在偏差。另外,样本量和打结程度也影响处理的结果,总的来说,当结点数较小时,四种方法之间差别不大。当数据量较大或打结比例较高时除exact以外的三种近似方法的偏差增加,但运算时间无明显变化,而exact法的运算时间迅速增加。此时如果估计的精确性没有估计时间那么重要,Efron法以及Breslow法是不错的选择,其中,Efron法更为精确而Breslow方法倾向于低估正确的β值。如果时间上没有限制,可以选择Exact法和discretemodel,将得到更为精确的结果。
英文摘要:
      Cox regression model is one of the most widely used methods in the survival analysis. One assumption of this model is that there is no tie in the failure times, that is, individual has different failure times. In practical applications, the existence of ties in time data is very common. In this paper, four common methods of dealing with ties in Cox model, including Exact method, discrete model method, Efron method and Breslow method, were compared with simulation. The results showed that Exact method and discrete model were the best, but they took the longest time. Efron method and Breslow method were faster but there was a greater deviation in parameter estimation. Moreover, the sample amount and ties degree also affect the results. In general, when there are a few ties, the difference between four methods was small; and in the case of large datasets or a large number of ties, the bias of three approximation methods increased except Exact method. However, there was no significant change on computational time. While the computational time of the Exact method increased rapidly. Therefore, if the estimation precision is not as important as the estimation time, Efron method and Breslow method will be good choices. Efron method is more preferably as it is more precise. And Breslow method tends to underestimate the true β. If there is no limit in time, Exact method and discrete model can be chosen to achieve more accurate results.
查看全文  查看/发表评论  下载PDF阅读器
关闭