Mark III系统解决了独特的生物医学数据挑战

经过 | 6分钟阅读| 2020年9月29日

生物医学研究往往依赖大规模数据收集。研究人员处理基因组和其他生物数据Don’T在千兆字节或Tberabytes方面思考,但在Petabytes(PB)方面。单个PB包含大约5000亿页的标准印刷文本。只需在此规模上传输信息,更不用说存储和处理,是一个巨大的承诺。

该区域的数据卷显示没有减速的迹象。事实上,研究机构正在每天创造更多数据,因为他们的处理能力有所改善。他们需要新的解决方案来存储和分享它,因为他们努力寻找新的治疗方法。自1995年以来,IBM Platinum Business Parts Mark III *,实现了 IBM 2020出色的存储系统解决方案灯塔奖 为其工作帮助一所大学解决这个问题。

商业挑战
Mark III..’客户是一个着名的大学医学中心,具有结合生物医学研究和临床护理的历史。它本身就赋予了将科学驱动的研究推向新的临床治疗能力,这些临床治疗可能会使105,000名住院患者,370,000名急诊室案件和每年三百万门门门诊访问。

支持其研究的数据密集型计算工作有助于挽救生命。这使它能够简化并尽可能加速其研究。

研究涉及研究的研究应用和数据架构是如此要求大学’S常规IT部门无法’跟上。它创建了一个专家生物医学高性能计算(HPC)部门,其中包含了专业专业知识和生物医学研究。它从IT部门进行了数据和基础设施管理的工作。

新部门遗产了一个巨大的问题:碎片遗产系统的混沌混合。研究系统在十几个单独的部门中有机开发,创造了20多个数据筒仓,跨越各种学科,包括基因组学,肿瘤学,放射学,新兴治疗和通用研究。

“他们完全独立,”召回马克III系统总裁的Stan Wysocki。“在某些情况下,他们是坐在人下的工作站’s desks.”

这使得难以在各部门和举措中分享数据,锁定其内在的内在价值。它还在不同的筒仓中留下重复数据。

HPC部门必须培养这些筒仓,配置硬件和软件,以支持与其他人不相容的独立部门标准’s。在其他地方可以更好地度过的那个赛的时间和精力,减慢了关键的研究过程。

“很多研究项目都需要几天,几周甚至几个月来放在一起,”  Wysocki说。“该部门必须提供系统和存储。然后他们会把这些资源转向研究人员。”

这些筒仓已经传播了2PB的数据,随着更多部门招募HPC部门,问题注定要变得更糟’S服务。它必须管理的数据孤岛数量随着对可以管理AI工作负载的支持的系统的需求而越来越多。这威胁要从研究倡议中排出更多资金,因为它努力管理这一基础设施。

“随着资料量增加的信息,通过管理数据来支持额外的研究人员,他们的大挑战是支持额外的研究人员。”Wysocki说。 HPC部门还需要一种方法来分享不同研究学科之间不断增长的数据。

明显的答案是一个可以扩展的数据湖,以满足多个研究部门与自己的HPC集群相当大的需求。作为响应,MARK III系统开发了其标记III系统的高性能计算作为服务(HPCAAS)解决方案。

将数据作为服务
HPAAS使用IBM.’S弹性存储服务器(ESS)和Spectrum Scale数据管理版(DME)产品,将所有不同的数据拉到统一的存储库中。

Mark III..’S存储解决方案是模块化和可扩展的。它开始使用四个卑鄙的可用存储,但扩展到15pb。它支持HPC部门’在2020-2021,他计划达到20pb或更高。

随着原始储存所处理的,Mark III仍然需要促进访问。它使用Red Hat OpenShift集装箱平台和Ansible写了额外的代码,允许不同部门的研究人员使用自己的计算平台在该数据上同时工作。

该公司基于Devops方法的系统,将使研究部门能够在不与HPC部门联系的情况下使用Data Lake快速使用数据湖泊。

保持安全的东西
安全是该Devops方法的另一个重要部分。一些数据是敏感的个人信息和大学 ’S安全团队需要保证它被正确保护。作为响应,Mark III建立了一个名为SecureSS的框架,该框架是持续检查数据湖的安全性和合规性问题。

“他们喜欢这个产品,因为他们通过我们的团队写道的包装器具有可见性,” Wysocki says. “它使他们能够进入谁’s使用数据,他们可以报告它’s secure.”

混合云技术是该解决方案的关键部分。它使用IBM TCT(透明云分层)为研究数据集提供安全的位置无关。

更快,更灵活的研究系统
结果是更流体研究过程,其中研究人员可以建立自己的项目。

“现在,您进入工作区,点击从科学角度来构建的内容,上传您需要上传或链接到数据所需的数据’已经在那里有那里的存储系统,你运行你的工作,” Wysocki explains. “It’s真的是作为服务模式的研究数据。”

这种新的工作方式依赖于表现急剧增加。该大学拥有24GB /秒的高速吞吐量超过其两个站点的Infiniband网络,减少了延迟研究工作。这促使工作时间减少了40%。

统一存储系统还有助于减少数据管理的时间30%,帮助大学降低整体运营成本。

该系统已经提供了现实世界的结果。来自Mark III的数据科学家参加了一个医疗Hackathon。它使用AI Powered Computer Vision来减少儿童在MRI机器中花费的时间在MRI机器中进行心脏手术。这有助于减少麻醉对儿童脑发展的影响,使医生能够处理更多患者。

通过与IBM的合作伙伴建立业务
这是没有IBM的难以完成的那种项目’S技术解释了Wysocki。“来自CSS的想法真的围绕表现和规模。它’很难找到将让您保留那么多数据并能够快速检索和写入它的存储。”

该项目在IBM存储和软件定义的存储收入中开辟了120万美元。 Mark III.’S模块化设计还使项目重复,使其他客户能够配置HPCAAS以满足自己的需求。 HPCAAS框架提供的额外价值为Mark III和IBM提供了纯粹在价格上竞争的竞争对手的优势。这已经开辟了多种机会,从2020年创造了500万美元的HPCAA收入管道。

感谢IBM.’S独特的存储技术,Mark III可以帮助其大学客户不仅应对已经随意的数据泛滥,而且尚未到来。这可以转化为真正的健康结果,可以帮助将来节省无数生命。

了解更多 关于其他灯塔奖获奖者如何通过他们的解决方案改变世界。

 

*Mark III Partners. Accessed 25 September 2020. //www.markiiisys.com/partners/

 

[autopilot_shortcode]