案例简介
•通过本案NVIDIAA100GPU上海磁共振重点实验室建立了高效的深度学习研究硬件平台,为医学图像处理建立了高效稳定的深度学习平台。
•本案例中NVIDIA上海磁共振重点实验室部署了高效的科研硬件平台。
客户简介及应用背景
上海磁共振重点实验室(ShanghaiKeyLaboratoryofMagneticResonance)它是华东师范大学的省级重点实验室,是中国磁共振研究和人才培训的主要基地之一。多年来,坚持磁共振物理的专业特点,逐步形成应用研究与技术研发、磁共振光谱与磁共振成像并重的局面,建立了“上海磁共振成像技术平台”和“上海核磁共振波谱技术服务平台”两个开放平台进一步加强了实验室的开放服务功能。
目前,该实验室已与上海十多家重点医院开展科研合作,急需高效大数据的医学图像处理。借助这次NVIDIAA100GPU以其庞大的计算能力,为医学图像的各种后处理任务和深度学习相关任务搭建了高效稳定的科研硬件平台。
客户挑战
与二维自然图像不同,医学图像通常有大量的单个数据信息,用于网络传输带宽和GPU显存提出了新的挑战。此外,由于科研、研究内容跨度大、研究人员多等因素。深度学习硬件平台的效率已成为科研工作效率的瓶颈。如何在有限的预算内完成深度学习平台的建设已成为一个新的挑战。
跨节点性能不高,需要优化网络环境。目前,实验室只使用一个GB在大型培训任务中,数据传输率低已成为深度学习任务的瓶颈。
应用方案
上海磁共振重点实验室基于上述挑战,作为解决方案的第一步,采用了上述挑战NVIDIAA100GPU加速器将深度学习训练、推理和分析整合到统一的部署中AI在基础架构中,通过大显存减少IO速率的影响。
实验室目前包含A100计算服务器有7个计算服务器(计算节点),每个服务器有4个NVIDIAGPU加速器用于深度学习,每个服务器共享相同的存储服务器。所有用户通过ActiveDirectory帐户共享计算和存储服务器。
为了进一步整合当前实验室NVIDIAGPU实验室为临床和科研开发了医学图像AI开发开源平台“Strix”。基于这个平台NVIDIA团队的MONAI医学图像AI开发处理库。整合医学图像AI数据准备、数据预处理、各种任务框架、结果可视化等步骤。让医学图像AI开发可以更容易上手。针对不同的架构GPU,Strix也做了有针对性的改进。A100GPU的MIG虚拟GPU我们带来了虚拟技术GPU互动选择,让用户更容易选择目标GPU进行训练。
医学图像面向临床和科研AI开发平台Strix
使用体验
通过NVIDIAA100GPU的MIG技术在小团队的工作环境中有很高的自由度,可以在计算资源短缺的情况下增加可用户的数量。当显存资源短缺时,可以减少用户数量,增加单个显存容量。
更大的显存可以操作更大的显存深度学习任务,使许多以前无法实现的科研课题在新的研究课题中GPU同时,最新的Ampere结构支持半精度计算,搭配NVIDIA自动混合精度(AutomaticMixedPrecision)在节省运行显存成本的同时,技术加快了神经网络训练的速度。网络训练和推理效率更快。
上海磁共振重点实验室表示,“作为一个以医学图像处理为重点的研究小组,通过和NVIDIA我们将更有效地利用前沿的密切合作AI技术和医学图像技术,处理医疗行业的高价值问题,专注于未来更智能、更高效、更安全的医疗新技术。”