中国基因网您的位置:首页 >医学 >

新数据集将帮助研究人员更好地了解大脑如何处理图像

神经科学家和计算机视觉科学家说,一个前所未有的新数据集 - 包括四个志愿者的脑部扫描,每个人都观看了5000张图像 - 将帮助研究人员更好地了解大脑如何处理图像。

新数据集将帮助研究人员更好地了解大脑如何处理图像

卡内基梅隆大学和福特汉姆大学的研究人员今天在“科学数据”杂志上报告说,采用这种规模的功能磁共振成像(fMRI)扫描提出了独特的挑战。

每位志愿者参加了20个或更多小时的MRI扫描,挑战了他们的毅力和实验者在扫描会话中协调的能力。在如此多的会话中运行相同个体的极端设计决定对于解开与个体图像相关联的神经反应是必要的。

由此产生的数据集BOLD5000允许认知神经科学家更好地利用极大改进的人工视觉系统的深度学习模型。最初受到人类视觉系统架构的启发,深入学习可以通过追求人类视觉如何工作的新见解以及通过对人类视觉的研究更好地反映现代计算机视觉方法来进一步改进。为此,BOLD5000测量了观察从两个流行的计算机视觉数据集中获取的图像所产生的神经活动:ImageNet和COCO。

“脑科学和计算机科学的交织意味着科学发现可以向两个方向发展,”共同作者Michael J. Tarr说,他是Kavči?认知和脑科学的穆拉教授,也是CMU心理学系的负责人。“未来使用BOLD5000数据集的视力研究应该有助于神经科学家更好地理解人类大脑中的知识组织。随着我们对视觉识别的神经基础的了解越来越多,我们也将更好地为人工视觉的进步做出贡献。 “

主要作者Nadine Chang,博士。CMU机器人研究所专门研究计算机视觉的学生建议,计算机视觉科学家正在寻求神经科学来帮助在快速发展的人工视觉领域进行创新 - 这加强了这项研究的双向性。

“计算机视觉科学家和视觉神经科学家基本上有着相同的最终目标:了解如何处理和解释视觉信息,”Chang说。

从一开始,提高计算机视觉是BOLD5000项目的重要组成部分。高级作者Elissa Aminoff,当时是CMU心理学系的博士后研究员,现在是Fordham的心理学助理教授,他与共同作者,机器人研究所副教授Abhinav Gupta一起发起了这项研究方向。

连接生物和计算机视觉所面临的挑战之一是,大多数人类神经影像学研究包括非常少的刺激图像 - 通常为100或更少 - 这些图像通常被简化为仅针对中性背景描绘单个物体。相比之下,BOLD5000包含5000多个真实世界的复杂场景图像,单个对象和交互对象。

该小组认为BOLD5000只是利用现代计算机视觉模型研究生物视觉的第一步。

“坦率地说,BOLD5000数据集仍然太小,”Tarr说,这表明合理的fMRI数据集需要至少50,000个刺激图像和更多的志愿者才能取得进展,因为深层神经网络已经过去了分析视觉图像在数百万张图像上进行训练。为此,研究团队希望他们能够生成5,000个脑部扫描的数据集,这将为人类视觉和计算机视觉科学家之间的更大合作努力铺平道路。

到目前为止,该领域的反应是积极的。公开的BOLD5000数据集已经下载了2500多次。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。

推荐内容