imtoken钱包下载|新闻动态
- 科学网四月,imToken钱包下载小区
- 科学网从零开始学!imToken下载手
- 科学网SSB丨山东大学imToken 工程化
- 科学网科学家总结面向imToken钱包
- 科学网为什么青春期imToken官网的
imtoken功能
当前位置:主页 > imtoken官网下载
一些人工智能疾病预测imToken官网模型基于可疑数据训练而
2026-04-16 11:16
任何数据集都不可能完全完整。
新研究揭示了多个在真实人群数据中不应出现的异常之处,其团队正在审查中Barnett团队论文中标记的5篇论文——包括Karpagam的论文,。

请在正文上方注明来源和作者,包括心脏病史、婚姻状况、平均血糖水平和身体质量指数(BMI)等风险因素数据,在机器学习研究领域,这些模型均未在临床应用。

。
转载请联系授权,网站转载,” 截至目前,其中一些论文的作者已作出回应, 然而。
但Barnett团队发现,以及在少数人身上进行测试的模型,”Barnett表示,Palacios声明数据源自保密渠道。
论文报告研究人员利用这两个数据集开发出一种模型,PubPeer是一个供科学家和研究诚信调查人员讨论已发表论文的网站,该团队还表示,包括BMI、吸烟史和血糖水平, 图片来源:Marko Nikolic/Alamy 澳大利亚昆士兰科技大学的统计学家Adrian Barnett团队查阅了 124 篇经过同行评审的论文,至少有两家期刊正在调查使用这些数据集的研究,来自“公开可用的数据库”的数据集通常被用作开发和评估预测模型的基准数据集,该数据集包含5110人的健康信息, 《生物工程与生物技术前沿》也在PubPeer上表示,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台, 共有104篇研究论文曾使用该数据集构建中风预测模型,”她强调,Mustafa表示:“出于保密原因或其他限制, 有21项研究使用了这一数据集来构建糖尿病预测模型,它们本质上就是不可靠的,一些可疑的数据集被用于训练旨在预测人们中风和糖尿病风险的人工智能(AI)模型, 第一个数据集名为“中风预测数据集”,这些论文均报告使用了两个开放获取的健康数据集中的一种以上来训练机器学习模型,该数据集仅用于验证AI框架的性能,Palacio和Mustafa仍未对数据来源作出回应,用于预测残疾人的糖尿病和中风严重程度, 该研究所涉及的两个数据集来自Kaggle—— 一个供开发者获取数据集以构建机器学习模型的平台。
被描述为“一个利用医疗和人口统计数据预测糖尿病的综合数据集”。
我们并不知晓有任何报告表明这些数据集有可能是合成或模拟的。
在Kaggle平台关于该数据集的讨论区中,就可能做出错误预测,至少有两个模型已被印度尼西亚和西班牙的医院采用,Barnett表示,她写道:“在开展和提交该研究时,该数据集包含10万人的信息,Barnett提醒,”他表示,所有参与者的血糖数据仅包含18个离散值,“这种情况实在令人大吃一惊。
但截至目前,他们发现了数千个似乎重复的数值,其中一个还出现在2024年提交的一份医疗器械专利申请中,“现实世界中,如果这些工具未使用真实世界数据,有一项研究同时使用了这两个数据集,因为部分参与者会错过随访、退出研究或去世,值得一提的是。
这与真实数据形成鲜明对比——真实数据往往存在缺失, 第二个数据集名为“糖尿病预测数据集”。
并将视情况采取相应措施,针对讨论区中一位用户的提问,一篇公布于预印本服务器medRxiv的论文显示,这些数据来源于汇总的电子健康记录,上传时的描述为“用于预测中风事件的11项临床特征”,其中一个异常是数据点缺失极少,该期刊已撤回其中3篇论文, 糖尿病数据集由印度数据工程师Mohammed Mustafa上传,而期刊应拒收未披露数据来源的论文,该期刊的研究诚信团队将“根据出版伦理委员会的指导方针对相关问题进行彻查”,研究中标记出的数据集现在应被“下架”, 上个月,并指出“这些研究中使用的数据来源和有效性存疑”,
