期刊信息
刊名: 世界科学技术-中医药现代化
主办:  中科院科技政策与管理科学研究所;中国高技术产业发展促进会
周期:  月刊
出版地:北京市
语种:  中文
开本:  大16开
ISSN: 1674-3849
CN:   11-5699/R
邮发代号: 2-534
复合影响因子: 0.786
综合影响因子: 0.473

历史沿革:
现用刊名:世界科学技术-中医药现代化
曾用刊名:世界科学技术-中药现代化;世界科学技术
创刊时间:1999

核心期刊:
中文核心期刊(2017)
当前位置:首页 > 期刊导读 > 2017 > 01 >

面向中医临床现病史文本的命名实体抽取方法研究

作者: 袁玉虎 周雪忠 张润顺 李晓东    北京交通大学计算机与信息技术学院 北京100044 中国中医科学院中医药数据中心 北京100700 中国中医科学院广安门医院 北京100053 湖北省中医院 武汉430061

摘要:目的:中医临床病历作为重要的临床数据,以文本的形式记录了医生和患者交互的整个过程。目前,在大数据的背景下,针对临床病历所涵盖的主体问题信息如现病史的分析利用相关研究仍有所欠缺。因此,本文针对中医临床病历中的现病史部分展开症状术语抽取方法研究,为临床病历的进一步使用奠定基础。方法:首先通过随机挑选与专家审核的方式获得了12 367份现病史数据,按照疾病种类分成了两组实验,其中糖尿病组包含了4 838份数据,脾胃病组7 529份数据,以及合并后的混合组12 367份数据。并整理出了一份涵盖22 996个词的症状术语字典。然后选取滑动窗口特征、词的前后缀特征、词典特征等5种特征模板,使用CRFs模型开展症状术语命名实体抽取实验。结果:在实验结果评价标准(准确率、召回率和F1值)上的表现:在开放测试上的评价结果为(0.83、0.8、0.82)、(0.9、0.9、0.89)和(0.88、0.87、0.87);在十重交叉验证上的评价结果为(0.83、0.82、0.83)、(0.95、0.95、0.95)和(0.93、0.92、0.92)。结论:CRFs模型作为一种优秀的序列标注算法,适用于现病史文本的症状术语命名实体抽取任务。


关键字: 中医临床病历 现病史 条件随机场 特征模板 命名实体抽取


上一篇:真实世界研究在中医药临床研究中的应用
下一篇:本体对齐技术概述及其在中医领域的应用探讨