英语原文共 22 页,剩余内容已隐藏,支付完成后下载完整资料
003
团队编号:
问题A
选择的问题:
2018 WHUTMCM摘要表
基于随机森林和动态加权法的诊断预测与评估模型
摘 要
据统计,失眠症的发病率很高,睡眠障碍正逐渐成为现代社会日益严重的问题。因此,迫切需要一种超越睡眠质量的科学,准确的诊断方法。
第一阶段,我们通过相关分析来分析和寻找睡眠质量的强制性指标。由于 确定了性别,我们对样本进行了划分,发现结果显示出明显的性别差异。男性 更容易受到年龄,可靠性,神经质和精神病的影响。但是女性对年龄,可靠性, 神经质及其性格更加敏感。
第二阶段,通过熵方法来确定每种疾病的致病性。绘制权重后分别绘制了 几个潜在指标。我们发现睡眠障碍对药物使用和性别非常敏感,其他指标影响 有限。但与此相反,抑郁症几乎毫无用处。其他疾病的病原体重系数在性别和 医学上均表现出明显的分散性。实际上,疾病的产生和睡眠质量是相互影响的。
值得注意的是,在尝试了神经网络方法和支持向量机之后,我们发现预测结果并不理想。贝叶斯判别分析导致了这个问题,但准确率仅为41.2%。这还远远不够。然后,我们尝试最主流的方法,即随机森林。消除无关指标后,准确度可达56%。基于随机森林,我们对十名潜在患者进行了有价值的诊断。
最后,通过构建非线性综合评价模型,获得每种疾病的严重程度,并发现37种疾病的直方图服从正态分布。而且,三种最常见的疾病严重程度正在逐渐降低。通过对睡眠指标和严重程度的全面分析,我们为每个指标提供了一些健康睡眠建议。
此外,我们选择出现在最后一个问题中的标准区间的中间值进行敏感性分析。难怪我们改变了?,曲线具有基本恒定的趋势。这个结果表明我们的模型是稳定的。
关键词:睡眠质量;随机森林;动态加权法
内容
- 介绍 1
- 一般假设 2
- 记号 2
-
评估睡眠质量 3
- 消除过程 3
- 睡眠质量的相关指标 3
-
寻找病原 4
- 熵法 4
- 诊断与睡眠的关系 5
-
可靠的诊断方法 7
- 设计可靠的分类设备 7
- 对十名潜在患者的合理诊断 8
-
健康的睡眠建议 9
- 构建综合评价模型 9
- 睡眠建议 13
-
进一步讨论 14
- 敏感分析 14
8.2 强度 14
8.3 弱点 15
9 结论 15
参考 16
附录 18
1引言
睡眠对于成年人和青少年的日常工作和生活至关重要。然而,生活在现代社会中,快速的生活节奏使人们越来越焦虑,继而失眠。从生理学角度来看, 短暂的睡眠会导致与肥胖有关的激素增加[1]。从行为的角度来看,短暂的睡眠会导致饮食行为增加和主观饥饿感[2]。一项长达数十年的研究表明,不同年龄的睡眠时间也有所不同,老年人的睡眠时间一般少于年轻人[3]。期望这一点, 人们做不同的工作也有不同的睡眠时间和质量。奥地利针对铁路安全工作者的一项研究表明,他们的睡眠与轮班类型,受抚养人以及是否吸烟,夜班通常比白班需要更多的睡眠有关[4]。另一项研究设计了一种量表,以评估帕金森病患者夜间睡眠与白天嗜睡的关系[5]。此外,在环境和生物因素的影响下,黑猩猩不仅代表人类,而且代表睡眠时间和质量的差异[6]。但是,他们都承认我们的睡眠是一种复杂的行为,需要一些指标来描述和设计客观和主观因素。因此, 迫切需要一种描述和评估睡眠质量和身体健康的可靠方法。
基于流行病学调查方法,我们可以获得有关睡眠质量和外部因素的详细数 据。为了处理和提取它们之间的关系,相关分析和回归分析是两种很好的方法, 已广泛用于研究失眠和其他疾病[7-9]。作为研究青少年睡眠和日常行为的优秀 实践,相关分析表明,睡眠质量差,睡眠不足和嗜睡与学业成绩下降密切相关[10]。同样,针对大学生的一项研究指出,睡眠质量会随着手机成瘾水平的提 高而恶化[11]。美国的一项调查表明,患有失眠症的年轻成年人的平均直接和 间接费用比没有失眠症的患者高大约1,253美元,而对于老年人来说,失眠症患 者的直接费用约1,143美元[12]。此外,使用回归分析控制变量,人们证明了失 眠仍然是酒精依赖和抑郁症复发的有力预测指标[13],而慢性失眠是发展焦虑 和抑郁症的巨大危险因素[14]。他们所有的结果都通过相关性分析启发了我们 分析数据,并通过回归分析来启发了控制变量,从而获得了潜在因素与失眠之 间的关系。
通过先前的工作,我们知道有太多因素会影响睡眠质量并导致失眠。因此, 根据给定的数据,我们选择了五个可量化的指标(年龄,可靠性,精神病,神 经质和性格),并分析了它们与失眠和睡眠质量的关系。此外,作为临床实践, 我们使用相关分析和回归分析来研究哪些指标(包括年龄,性别,睡眠质量, 睡眠潜伏期,睡眠时间,睡眠效率,睡眠障碍,催眠药和白天功能障碍)会增 加患病的风险。病因
临床表现手段。然后,我们获得一般诊断标准。为了获得更准确的结果,我们使用判别分析,神经网络方法[15],支持向量机[16]和随机森林[17]来测试我们的结果。幸运的是,借助MATLAB和SPSS软件包,我们可以实现所有的统计方法。因此,十个有潜在疾病的人可以更好地诊断并给予针对性的治疗。此外, 我们还给出了有效的健康计划,以帮助人们保持健康。这项研究将启发将统计分析和机器学习应用于甚至其他行业的临床诊断中。
2 一般假设
- 指数越小,健康水平越好。由于样品分类的不确定性,这可以弥补缺陷。
- 具有大量诊断结果的37种疾病可以代表整个诊断数据样本。这样可以有效地分析使用大多数人代表总数,同时,这种准备减少了一些难以处理的数据。
- 假设数据量足够大,可以进行有效分析。
- 假设索引是相互影响的,我们可以通过非线性模型对其进行评估。
3 记号 |
||
表1符号和定义 |
||
符号 |
意义 |
|
j |
具体指标 |
|
i |
确定的类型 |
|
xij |
确定类型的每个索引的归一化值 |
|
pi |
评估对象的比重 |
|
e j |
指数的熵 |
j |
g j |
指标差异系数 |
j |
j |
指标j的权重系数 |
|
i |
多元线性回归系数 |
|
i |
标准间隔的中间值 |
评估睡眠质量
-
- 消除过程
可能影响睡眠质量的潜在指标包括五项。可靠的相关分析算法将快速获得 必要的结果。使用SPSS软件包,并认为性别是确定的字符,它属于离散索引, 而其他字符是连续索引。在相关分析中,离散索引将干扰连续索引相关的结果。避免此问题的简单方法是将它们分开。此外,划分两个指标的优势将使我们在 理解指标性别差异时有直观的印象。通过SPSS计算相关系数后,
相关矩阵列表对应于女性。
下面。表2对应于男性和表 3是表2男性的相关矩阵
-
- 睡眠质量的相关指标
相关系数 |
年龄 可靠性 精神病学 |
紧张 |
字符 |
|
皮尔森 相关性 |
0.117** |
-0.061** 0.100** |
0.150** |
-0.021 |
信号(2尾) |
0.000 |
0.005 0.000 |
0.000 |
0.336 |
长矛兵 相关性 |
0.142** |
-0.050* 0.119** |
0.132** |
-0.002 |
信号(2尾) |
0.000 |
0.023 0.000 |
0.000 |
0.922 |
表3女性相关矩阵 |
||||
相关系数 |
年龄 |
可靠性 精神病学 |
紧张 |
字符 |
皮尔森 相关性 |
0.134** |
0.050** 0.030 |
-0.042** |
0.056** |
信号(2尾) |
0.000 |
0.001 0.053 |
0.007 |
0.000 |
长矛兵 相关性 |
0.151** |
0.057** 0.047** |
-0.034* |
0.066** |
信号(2尾) |
0.000 |
0.000 0.002 |
0.026 |
0.000 |
为了提高结果的准确性,我们选择两种相关性
方法:皮尔逊相关系数和斯皮尔曼相关系数。根据统计理论,当相关系数P小于0.05时,可以确定两个变量密切相关。基于此原理,相关变量加“ *”来识别。因此,经过计算,我们发现两种方法虽然在数量上有微小差异,但两者给出的结果相同。
从计算结果来看,我们发现影响睡眠的因素非常广泛,并且存在性别差异。通常,男性和女性的睡眠都会受到年龄,可靠性和神经质的影响。而且它代表 了年龄与睡眠质量之间的显着正相关,这意味着随着人们的年龄增长,他们的 睡眠更有可能受到干扰。但是,男性也会受到精神病的影响,而女性对角色本 身更敏感。这两个因素均与睡眠质量呈正相关。此外,可靠性对女性睡眠的影 响比对男性的影响更大,但神经质则相反。另一个有趣的现象是,可靠性会产 生负面影响,而紧张则会对男性的睡眠质量产生正面影响,而在女性中,这两 个因素会导致完全相反的结果。似乎雌性通常需要安全,稳定的条件,但雄性 要更机敏。这种差异代表在性别上需要更多医学研究和验证。
寻找病原
-
- 熵法
失眠作为一种疾病,最直接的症状体现在睡眠质量上。现代医学认为,许多疾病都与睡眠有关,调查潜在患者的睡眠时间正逐渐成为辅助检查。因此, 我们分析了多达六千例疾病,并研究了典型疾病的原因。但是,这种情况下有290多种
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[235714],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。