有人说21世纪,我们的生活越来越便捷,电子通讯越来越发达,美食越来越多。这一点也不假。但现代生活方式也有不利一面,工作越来越忙,身体锻炼越来越少,体重一天一天增加。有一种疾病叫做糖尿病,你们听说过吗?中国糖尿病患者数量逐年上升,呈现明显上涨态势。近年来糖尿病药物是药企一块大蛋糕。糖尿病相关食品也非常昂贵,很多不懂医学常识的患者付出了巨大代价。

有人说21世纪,我们的生活越来越便捷,电子通讯越来越发达,美食越来越多。这一点也不假。但现代生活方式也有不利一面,工作越来越忙,身体锻炼越来越少,体重一天一天增加。有一种疾病叫做糖尿病,你们听说过吗?

餐饮行业为了增加销售量,会增加食物食盐量。这样可以满足顾客重口味。

饮料厂商为了增加销售量,在饮料里添加不少糖分(碳水化合物)。糖可以刺激大脑,形成正反馈,越喝越想喝,形成对糖依耐性。

996对程序员并不陌生,一天工作太忙,下班后就葛优躺,拿着手机或看电视。体重一天天增加,我想说的是糖尿病离你还远吗?

真相是中国糖尿病数据触目惊心!下图显示2019年估算中国糖尿病患病率排名世界第二,我们不是世界第一,是不是很高兴?

不幸的是,中国人口基数是美国4倍多,因此中国糖尿病患者数量位居世界第一。中国是糖尿病最大药物研发市场。越来越多年轻人也加入糖尿病市场,成为药企摇钱树。

中国糖尿病患者数量逐年上升,呈现明显上涨态势。近年来糖尿病药物是药企一块大蛋糕。糖尿病相关食品也非常昂贵,很多不懂医学常识的患者付出了巨大代价。

糖尿病是一种富贵病,患上后无法彻底根治,只能每日用药控制。且糖尿病相关并发症多。每8秒就有1人死于糖尿病及其并发症。如果未经治疗,糖尿病可能引发许多并发症。急性并发症包括糖尿病酮酸血症与高渗透压高血糖非酮酸性昏迷;严重的长程并发症则包括心血管疾病、中风、慢性肾脏病、糖尿病足、以及视网膜病变等。

医生对于糖尿病患者的建议比较多,少吃含糖高食物,多锻炼,多休息。。。。但哪一条建议特别重要,能否量化分析么?答案是肯定的,你给我数据,我给你答案。

人工智能机器学习可以帮助医药科研人员挖掘更多糖尿病致病因子,建立模型预测患者血糖。博主用python建立糖尿病血糖指标预测模型,根据用户提供的年龄,性别,血压,BMI等指标,可以预测你是否患有糖尿病。建模数据来自美国真实糖尿病临床数据,总计442条。对于模型来说,442条数据量有些偏少,如果能有1000条以上,就比较nice了。

研究此项目的美国团队(Bradley Efron, Trevor Hastie, Iain Johnstone and Robert Tibshirani)模型性能一般,MAE约为41.9,r2为0.477。而博主建立模型MAE为13.82,r2为0.9388,远远高于美国团队,模型性能非常优秀,预测数据误差小,更准确。

博主运用python语言建立糖尿病预测模型部分代码截图,代码量少,效率高快速建模和量化分析致病因子。

程序对变量相关性分析后,自动把结果保存到excel,方便日后查阅数据,我们发现S1和S2血清指标相关性非常高,模型仅选用s1或s2变量,性能下降不会太大。

好消息是绝大多数糖尿病属于二类,是可防可控的。我们只要熟悉致病因子,建立良好生活习惯就可以显著降低糖尿病患病概率。此课程对糖尿病致病因子一一分析,并量化排序,是价值含量非常高课程。

机器学习是一门充满魅力学科,让我们像甘道夫魔法师,可以预知未来。希望我的课程能够帮助到糖尿病患者,相关研发机构,或正在写此题材论文的学生。希望你们分享此课程到朋友圈,让大家重视糖尿病防控,减少政府医药预算开支,让更多人受益。

欢迎各位同学学习

python机器学习-糖尿病数据挖掘
https://edu.51cto.com/sd/5c2fb

作者介绍
Toby,持牌照金融公司担任模型验证专家,国内最大医药数据中心数据挖掘部门负责人!和重庆儿科医院,中科院教授,赛柏蓝保持慢病数据挖掘项目合作!管理过欧美日中印巴西等国外药典数据库,马丁代尔数据库,FDA溶解度数据库,临床试验数据库,WHO药物预警等数据库。

课程概述
python机器学习实战糖尿病数据挖掘,运用多种回归算法在年龄,性别,体重指数BMI,血压, 和六个血清指标中挖掘哪个因子是最重要致病因子。这些变量有何关联。课程建立模型综合表现显著高于互联网其他课程。

适用人群
研究生,博士生毕业论文,NCBI/SCI/Nature论文发布,python爱好者,机器学习,生物信息学,糖尿病医学科研机构

课程特点
平民价格,非纯商业化价格,让贫困学生也学的起国外最先进流行知识。不需要花费几千上万报天价学习班,自学也可成长。

学习计划和方法
1.每天保证1-2个小时学习时间,预计7-14天可以学习完整门课程。
2.每节课的代码实操要保证,建议不要直接复制粘贴代码,自己实操一遍代码对大脑记忆很重要,有利于巩固知识。
3.第二次学习时要总结上一节课内容,必要时做好笔记,加深大脑理解。
4.不懂问题要罗列出来,先自己上网查询,查不到的可以咨询老师。

课程目录
课时1我的所有课程介绍
课时2讲师介绍-二十个医药数据库负责人
课时3糖尿病分类_特征_预防概述
课时4机器学习模型预测糖尿病患者血糖指标
章节2python编程环境搭建
课时5Anaconda快速入门指南
课时6Anaconda下载安装
课时7python第三方包安装(pip和conda install)
章节3糖尿病数据挖掘
课时8建立糖尿病预测线性回归模型(linear regression)
课时9下载糖尿病数据方法(原始数据和清洗后数据)
课时10线性回归和误差
课时11模型验证:均方差和中值绝对误差
课时12多算法比较,模型性能提高2倍
课时13原始数据和处理后数据建模性能对比
课时14糖尿病致病因子量化分析_性别,年龄,血压,BMI指数
课时15变量相关性分析-原来s1和s2血清检测呈现高相关性
课时16长寿之道-这课程是你一生财富
课时17BMI指数python自动化计算脚本
章节4附录
课时18糖尿病中英单词汇总
课时19糖尿病患者更容易感染新冠病毒吗?
课时20最小角度回归预测糖尿病论文LeastAngleRegression

python机器学习生物信息学,博主录制,2k超清
https://edu.51cto.com/sd/3a516