1、MAPLES-DR2024数据集
MAPLES-DR(用于可解释糖尿病视网膜病变筛查的 MESSIDOR 解剖和病理标签),包含糖尿病视网膜病变 (DR) 和黄斑水肿 (ME) 的新诊断,以及与这些病理相关的 10 个视网膜结构的新像素分割图,适用于 MESSIDOR 公共眼底数据集的 198 张图像。任务1:视网膜结构分割。从 2019 年 2 月到 2020 年 2 月,来自蒙特利尔和多伦多(加拿大)的 7 位资深视网膜专家在从公共数据集 MESSIDOR中提取的 198 张眼底图像上与 DR 相关的解剖和病理结构:4 个解剖结构:视盘、视杯、黄斑和血管;3 个明亮病变:渗出物、棉绒斑和视网膜黄斑硬化症;3 个红色病变:微动脉瘤、出血和新生血管。这 10 个生物标志物以单独的 PNG 二进制图像提供,同时提供另外两个分割图:不确定的亮和不确定的红色,其中包含明显病理但确切性质不明的结构(例如,红色病变的微动脉瘤与出血)。任务2:DR 和 ME 等级。MAPLES-DR 的 DR 和 ME 等级遵循为加拿大远程眼科筛查制定的指南。这些指南将 DR 分为七个等级(R0:无,R1:轻度,R2:中度,R3:重度,R4A:增生性,R4S:稳定治疗增生性,R6:图像质量不足)和四个 ME 等级(M0:无,M1:轻度,M2:中度,M6:图像质量不足)。这些等级是根据可见的红色和明亮视网膜病变的数量和位置系统定义的。每个等级都与推荐的治疗方案相关(从两年后对轻度病例重新筛查到立即转诊给眼科医生治疗更严重的病例)。数据下载:https://figshare.com/articles/dataset/_b_MAPLES-DR_b_MESSIDOR_Anatomical_and_Pathological_Labels_for_Explainable_Screening_of_Diabetic_Retinopathy/24328660?file=45795381
2、PathMMU2024数据集
大型多模态模型的出现释放了人工智能的巨大潜力,特别是在病理学方面。然而,缺乏专门的、高质量的基准,阻碍了它们的发展和准确评价。为了解决这个问题,引入了PathMMU,这是大型多模态模型(lmm)中最大、质量最高的专家验证病理基准。它包括33,428个多模式选择题和来自不同来源的24,067张图片,每张图片都附有正确答案的解释。PathMMU的构建利用了GPT-4V的先进功能,利用超过30,000对图像标题来丰富标题并在级联过程中生成相应的问答。值得注意的是,为了最大限度地发挥PathMMU的权威,邀请了七位病理学家在PathMMU的验证和测试集的严格标准下仔细检查每个问题,同时为PathMMU设定了专家级的性能基准。数据下载:https://pathmmu-benchmark.github.io/#/
3、EIT-1M2024数据集
脑电图 (EEG) 信号已被积极地纳入以将大脑活动解码为视觉或文本刺激,并实现多模态 AI 中的物体识别。因此,人们一直致力于从视觉或文本单模态刺激构建基于 EEG 的数据集。然而,这些数据集每个类别提供的 EEG 时期有限,并且呈现给参与者的刺激的复杂语义损害了它们在捕捉精确大脑活动方面的质量和保真度。神经科学研究揭示了 EEG 记录中视觉和文本刺激之间的关系为大脑同时处理和整合多模态信息的能力提供了宝贵的见解。提出了一个新颖的大规模多模态数据集,名为 EIT-1M,拥有超过 100 万个 EEG-图像-文本对。数据集在反映大脑同时处理多模态信息的活动方面具有卓越的能力。还包括常见的语义类别,以引起参与者大脑更好的反应。同时,包括基于响应的刺激时间和跨块和会话的重复,以确保数据多样性。为了验证 EIT-1M 的有效性,对从不同类别和参与者的多模态刺激中捕获的 EEG 数据进行了深入分析,并提供数据质量分数以确保透明度。数据下载:https://eit-1m.github.io/EIT-1M/
4、ISIC2024数据集
皮肤癌若不及早发现,可能会致命,但许多人缺乏专门的皮肤病护理。过去几年,基于皮肤镜的人工智能算法已被证明有助于临床医生诊断黑色素瘤、基底细胞癌和鳞状细胞癌。然而,确定哪些人应该首先去看医生具有巨大的潜在影响。分类应用具有巨大的潜力,可以使服务不足的人群受益,并改善早期皮肤癌检测,这是长期患者结果的关键因素。皮肤镜图像揭示了肉眼看不见的形态特征,但这些图像通常只能在皮肤科诊所拍摄。使初级保健或非临床环境中的人们受益的算法必须善于评估低质量图像。利用 3D TBP 展示了来自三大洲数千名患者的每一个病变的全新数据集,其图像类似于手机照片。与以往的 ISIC 挑战赛不同,ISIC 2024 挑战赛将不会采用皮肤镜照片。为了更好地模仿低质量的非皮肤镜图像,将使用全身摄影中病变的标准化裁剪图像。SLICE-3D(“从 3D TBP 中提取的皮肤病变图像裁剪”)数据集包含来自全球七家皮肤病学中心的 400,000 多张不同的皮肤病变图像,用于训练。测试集包含来自不同患者组的 500,000 张额外图像。去识别图像是从敏感的 3D 全身照片中系统提取的,其光学分辨率与智能手机图像相当。如果在初级保健或非临床环境中部署使用低质量图像训练的算法,这些算法可以改善临床工作流程并更早地发现皮肤癌,在这些环境中,照片由非专业医生或患者拍摄。这样的工具可以促使人们去看专业的皮肤科医生。该数据集规避了先前数据集的许多固有限制,可用于在先前的皮肤成像癌症检测应用的基础上进行扩展。数据下载:https://challenge2024.isic-archive.com/
365建站5、AMD-SD2024数据集
年龄相关性黄斑变性 (AMD) 是 50 岁及以上人群不可逆视力丧失的主要原因之一。在全球范围内,估计有 8.69% 的 45 至 85 岁人口患有 AMD,预计到 2040 年,全球将有约 2.88 亿人患有该病1。AMD 分为干性 AMD(地图状萎缩)和新生血管性 AMD(也称为湿性 AMD),这两种形式都可能导致视力快速丧失。目前,干性 AMD 缺乏有效的治疗方法。相反,湿性 AMD 以脉络膜新生血管 (CNV) 或视网膜新生血管为特征,导致明显的变化,包括视网膜水肿、出血、渗出和瘢痕形成。湿性 AMD 的主要治疗包括玻璃体内注射抗血管内皮生长因子 (VEGF) 药物,这种药物能够减轻或逆转病情进展。湿性 AMD 的视力下降和预后相关的五个关键特征包括 IRF、SRF、PED、SHRM 和 IS/OS 连接中断。利用这些域知识,由经验丰富的眼科医生手动注释了一个包含五种病变标签的高质量 OCT 数据集。数据集为创建各种人工智能驱动的图像分割模型铺平了道路。此举旨在智能地简化湿性 AMD 的评估并促进临床研究的重大进展。 数据集包含 3049 张 OCT B 扫描图像及其相应的病变区域分割蒙版。所有图像的分辨率均为 570 x 380 像素。这些图像来自 138 名患者的 156 只眼睛,其中 61 名女性和 77 名男性。患者平均年龄为 66.7 岁,标准差为 9.1 岁。所有参与者均为亚裔。OCT B 扫描分割蒙版是六色图像,红色像素代表 SRF,粉色像素代表 IS/OS,蓝色像素代表 PED,绿色像素代表 IRF,黄色像素代表 SHRM,黑色像素代表 OCT 的背景。数据下载:
https://springernature.figshare.com/articles/dataset/An_Optical_Coherence_Tomography_Image_Dataset_for_wet_AMD_Lesions_Segmentation/25513435?backTo=/collections/AMD-SD_An_Optical_Coherence_Tomography_Image_Dataset_for_wet_AMD_Lesions_Segmentation/7157554&file=48777037
6、WsiCaption2024数据集
365建站客服QQ:800083652基于全切片图像 (WSI) 的诊断病理学是癌症诊断的基础和金标准。由于 WSI 中存在巨大的规模和大量异构信息,因此通常需要专门的病理学家来读取和解释切片。最近,随着 WSI 计算机辅助方法的进步,计算病理学取得了显著的成功,在深度学习的帮助下,一些计算病理学甚至可以在某些任务上胜过经验丰富的病理学家。这些先进的方法极大地提高了病理读取工作流程的自动化程度,尤其是对于农村地区经验不足的病理学家。尽管这些计算病理学方法具有“临床级”性能,但病理学家仍然需要整理研究结果并为每张幻灯片撰写文本报告。病理科每天需要以文本形式总结数百到数千个 WSI。诊断报告的自动化可以大大减少病理学家的工作量。此外,病理报告的内容通常包括丰富的诊断结果。因此,它激励向前迈进一步,实现病理报告的自动生成。在数据方面,计算病理学在过去几年的巨大进步很大程度上归功于公开可用的病理数据集的出现。一些研究人员求助于书籍、文章和网络来获得大规模的图像-文本对。然而,收集的图像是小块,相应的文本也仅限于块级描述。因此,收集高质量的 WSI-文本对值得探索,可以促进计算病理学中视觉语言模型的发展。数据下载:https://github.com/cpystan/Wsi-Caption?tab=readme-ov-file
7、EAV2024数据集
理解情绪状态对于下一代人机界面的发展至关重要。人类在社会交往中的行为导致了受知觉输入影响的心理生理过程。因此,理解大脑功能和人类行为的努力可能会促进具有类人属性的人工智能模型的发展。在这项研究中,引入了一个多模态情绪数据集,包括来自42名参与者的30通道脑电图(EEG)、音频和视频记录的数据。每个参与者都参与了一个基于线索的对话场景,引出了五种不同的情绪:中性、愤怒、快乐、悲伤和冷静。在整个实验过程中,每个参与者都参与了200次互动,其中包括听和说。这导致了所有参与者之间的累计8400次互动。eeg -视听(EAV)数据集中的情感代表了第一个在会话环境中包含三种主要情感识别模式的公共数据集。预计该数据集将为人类情感过程的建模做出重大贡献,包括基础神经科学和机器学习的观点。数据下载:https://github.com/nubcico/EAV
8、BraTS-SSA2024数据集
脑瘤是最致命的癌症之一。大约80%的胶质瘤患者在确诊后两年内死亡。一般来说,脑肿瘤的诊断具有挑战性,难以治疗,并且对传统疗法具有固有的耐药性。经过多年的广泛研究,胶质瘤的诊断和治疗得到了改善,在过去的30年里,美国的死亡率降低了7%。这些研究创新虽然力度不大,但并未转化为中低收入国家(LMICs)成人和儿童生存率的改善,特别是在非洲人群中,撒哈拉以南非洲的死亡率平均上升了25%,而全球北方的死亡率则下降了30%。脑胶质瘤的长期生存与脑MRI上适当的病理特征的识别和组织病理学的证实有关。自2011年以来,BraTS挑战赛已经评估了最先进的机器学习方法来检测、表征和分类脑胶质瘤。然而,由于撒哈拉以南非洲地区广泛使用质量较低的MRI技术,导致图像对比度和分辨率较差,而且在撒哈拉以南非洲地区,晚期出现疾病较晚的倾向以及胶质瘤的独特特征(即疑似胶质瘤发病率较高),目前尚不清楚最先进的方法能否在撒哈拉以南非洲地区得到广泛应用。 BraTS-Africa挑战赛提供了一个独特的机会,将撒哈拉以南非洲的脑MRI胶质瘤病例纳入全球努力,以开发和评估在资源有限的环境中用于脑肿瘤管理的计算机辅助诊断(CAD)方法,在这些环境中,CAD工具更有可能改变医疗保健。2023年,组织了第一届brat -Africa挑战赛,在非洲核磁共振教育和研究促进联盟(CAMERA)的支持下,由Lacuna健康公平基金提供资金,通过非洲成像中心合作网络收集了成人人群的标记训练、验证和测试数据集。受最先进的方法在改善包括非洲人口在内的数据集中的肿瘤分割方面的表现的鼓舞,正在组织第二届BraTS-Africa挑战赛(BraTS-Africa 2024)。挑战赛参与者将能够获得RSNA-ASNR-MICCAI BraTS 2021挑战赛的训练和验证数据,以及来自Synapse平台的更新的撒哈拉以南数据(BraTS- africa 2024)数据的训练和验证。这些数据集将用于开发、容器化和评估未见验证数据中的参与者算法。
数据下载:
https://www.synapse.org/Synapse:syn59059780
9、BraTS-MET2024数据集
监测转移性脑疾病是费力和耗时的,特别是当管理多个转移和依赖于手工技术。根据RANO-BM指南,通常通过测量其最大单维直径来评估脑转移。然而,准确估计病变和周围水肿的体积对于有效的临床决策和改善治疗结果预测至关重要。脑转移瘤通常很小,使小于10mm的病灶的检测和分割变得复杂。使用机器学习方法自动分割脑转移和病灶周围水肿,提高时间效率,可重复性和对内部变异性的鲁棒性。这一挑战旨在提供可用于当前和治疗后环境的基本算法,可能彻底改变患者的管理和监测。数据下载:
https://www.synapse.org/Synapse:syn59059764
10、AugmentedSkinConditionsImage2024数据集
数据集包含六种不同皮肤病的增强图像。每个类别包含 399 张图像,提供了一个均衡的数据集,非常适合训练机器学习模型,特别是在医学图像分析领域。痤疮:一种常见的皮肤病,当毛囊被油脂和死皮细胞堵塞时,会导致粉刺、黑头或白头。癌症:一种始于基底细胞或鳞状细胞的皮肤癌。此类别中的图像可能显示皮肤癌的不同阶段和形式。湿疹:一种使皮肤发红、发炎、发痒,有时还会导致水泡的疾病。这些图像描绘了湿疹的不同表现。角化病:一种皮肤病,特征是角蛋白过度生长导致皮肤上出现粗糙、鳞状斑块。此类别包括各种类型角化病的图像,例如光化性角化病。粟丘疹:通常出现在面部,尤其是眼睛周围和脸颊上的小白色良性肿块。这些图像显示了这种疾病的不同实例。酒渣鼻:一种导致面部发红和可见血管的慢性皮肤病。此类别包含描绘酒渣鼻典型特征的图像。总图像数:2,394,每个类别的图像数:399,图像格式:JPEG,图像大小:可变。增强技术:使用旋转、翻转、缩放和亮度调整等技术对图像进行了增强,以增强数据集的多样性并提高模型泛化能力。数据下载:https://www.kaggle.com/datasets/syedalinaqvi/augmented-skin-conditions-image-dataset/data
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报。