8.2 分析方法与过程
由于患者在围手术期、围化疗期、围放疗期和内分泌治疗期等各个病程阶段,基本都会出现特定的临床症状,故而可以运用中医截断疗法进行治疗,在辨病的基础上围绕各个病程的特殊证候先证而治。截断扭转的主要观点是强调早期治疗,力图快速控制病情,截断病情邪变深入,扭转阻止疾病恶化[17]。
目前,患者的临床病理信息大部分都记录在纸张上,包含了患者的基本信息、具体患病信息等,很少会将患者的患病信息存放于系统中,因此进行数据分析时会面临数据缺乏的情况。针对这种状况,本章采用问卷调查的方式收集数据;运用数据挖掘技术对收集的数据进行数据探索与预处理,形成建模数据;采用关联规则算法,挖掘各中医证素与乳腺癌TNM分期之间的关系,其中乳腺癌TNM分期是乳腺癌分期基本原则,Ⅰ期较轻,Ⅳ期较严重。探索不同分期阶段的三阴乳腺癌患者的中医证素分布规律,以及采用截断病变发展、先期干预的治疗思路,指导三阴乳腺癌的中医临床治疗。
本次数据挖掘建模的总体流程如图8-1所示。
中医证型关联规则挖掘主要包括以下步骤。
1)以问卷调查的方式对数据进行收集,并将问卷信息整理成原始数据。
2)对原始数据集进行数据预处理,包括数据清洗、属性规约、数据变换。
表8-2 原始数据表
图8-1 中医证型关联规则挖掘模型总体流程图
3)利用步骤2)形成的建模数据,采用关联规则算法,调整模型输入参数,获取各中医证素与乳腺癌TNM分期之间的关系。
4)结合实际业务,对模型结果进行分析,且将模型结果应用到实际业务中,最后输出关联规则结果。
8.2.1 数据获取
本案例采用调查问卷的形式对数据进行搜集,数据获取的具体过程如下。
1)拟定调查问卷表并形成原始指标表。
2)定义纳入标准与排除标准。
3)将收集回来的问卷表整理成原始数据。
首先根据中华中医药学会制定的相关指南与标准,从乳腺癌6种分型的症状(见表8-3)中提取相应证素拟定调查问卷表,见表8-4,并制定三阴乳腺癌中医证素诊断量表(见表8-5),从调查问卷中提炼信息形成原始属性表。然后依据标准定义表(见表8-6),将有效的问卷表整理成原始数据(见表8-2)。问卷调查需要满足两个条件:①问卷信息采集者均要求有中医诊断学基础,能准确识别病人的舌苔脉象,用通俗的语言解释医学术语,并确保患者信息填写准确。②问卷调查对象必须是三阴乳腺癌患者。本章的调查对象是某省中医院以及肿瘤医院等处于各病程阶段的1253位三阴乳腺癌患者。
表8-3 乳腺癌辨证分型
表8-4 三阴乳腺癌中医证素调查问卷
表8-5 三阴乳腺癌中医证素诊断量表
表8-6 标准定义表
8.2.2 数据预处理
本案例中数据预处理过程包括数据清洗、属性规约和数据变换。数据来源于问卷调查,因此在数据预处理开始阶段,需要把纸质的问卷整理成原始数据集。针对原始数据集,经过数据预处理,形成建模数据集。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论