跳到内容

    数据科学在规避

    Evidation 它的使命是让每个人都能参与更好的健康成果吗. 为了实现这一目标,该公司关注患者在医疗设施之外的生活体验. 它与个人合作, 生命科学公司, 以及医疗保健机构更好地了解日常生活中的健康和疾病,并将个人与突破性的研究和健康项目联系起来.

    Evidation平台 使用患者从应用程序和可穿戴技术中共享的患者生成的健康数据(PGHD)持续测量个人的健康状况(在患者的要求和同意下), 例如智能手机, 活动跟踪器, 和smartwatches.

    evidate的用户网络包括400多万个人,他们非常积极地参与研究, 每天共享数百万个数据点. 和这群积极参与的人, 在其平台上进行的临床试验招募合格患者的速度是传统试验的10倍,平均回复率为67%.

    直营平台通过在平台上进行的100多项研究,展示了研究如何激活患者的参与度,比兹·菲利普斯说, evination公司的高级健康数据科学家. “现在直营平台正在使用数据科学将直营平台的工作提升到一个新的水平, 创造一个持续的反馈循环,为个人提供来自这些富人的健康见解, 可变数据和驱动行为改变.”

    eviding最新的心脏健康计划, 与美国心脏病学会共同开发, 就是一个例子. 该项目使有心脏疾病的个人能够持续监测与心血管健康相关的数据, 例如活动和症状信息, 确定恶化的症状, 访问个性化内容, 资源, 以及更好地管理心脏健康的工具.

    为个人带来更快的新见解, evification极大地简化了它的管理方式, 发展, 部署, 并监控新车型. 利用Domino®Enterprise MLOps功能和基于雪花®云的数据平台, 该公司现在可以在最短的时间内将研究转化为生产级模型 八个星期.

    “多米诺骨牌和雪花对直营平台业务的未来至关重要. 它们允许新的用例保持流动, 因此,直营平台可以让个人在成为患者之前更好地管理自己的健康.”

    ——evination公司的高级健康数据科学家Biz Phillips

    挑战

    随着evidate开始扩展它为参与的个人提供的见解和能力, 它需要授权其数据科学团队进行快速创新和规模化. 菲利普斯说:“直营平台意识到,直营平台现有的方法正在成为阻碍.

    直营平台自己开发的数据科学系统维护起来很有挑战性, 直营平台短暂使用的付费平台——一个统一的数据分析平台——过于依赖Apache Spark™,无法提供支持, 安全, 或者直营平台的数据工程师的灵活性, 数据科学家, 需要ML工程师.”

    ——evination公司的高级健康数据科学家Biz Phillips

    该团队着眼于四种关键功能:

    1. 无缝的数据访问 所以团队可以快速迭代和创新.

    2. 开放性和灵活性 因此,数据科学家可以用最新的工具和计算框架进行实验.

    3. 协作和再现性 所以团队可以建立在过去的工作基础上.

    4. 高效获取技术资源. “因为直营平台处理的是非常高频的数据, 有效地扩展资源是一个很大的需求,皮尤莎·加德说, evination公司的健康数据科学家. “有些用户只需要本地机器上的一个小实例, 而其他人可能需要访问GPU资源.”

    解决方案

    Evidation科学的数据, 安全, 和DevOps团队进行了深入的概念验证, 选择Domino和雪花来满足其基础结构和安全性需求.

    “Domino和雪花使直营平台的数据科学团队能够无缝连接到患者生成的健康数据(PGHD),并快速创建原型, 一切都在一个安全的环境中进行. 它们是直营平台工作中不可或缺的一部分,可以创建一个反馈循环,将数据转化为见解,然后这些见解推动行为变化,促进更好的健康结果."  

    ——evination公司的健康数据科学家piyusha Gade

    雪花基于云的数据仓库平台作为evidate的集中式数据仓库和特征库,向客户提供数据并进行分析. 菲利普斯说:“现在直营平台所有的数据源都是集中提供的,很容易访问。. “作为一个结果, 直营平台的数据科学家, 数据工程师, 和QA工程师可以访问连续的, 策划, 和测试数据,并可以跨项目共享相同的数据集."

    然后,团队使用Domino查询存储在雪花上的特性, 选择数据集来训练模型, 并在模型生命周期中简化工作, 包括:

    • 模型管理. Domino自动捕获给定项目的所有工件, 包括数据集, 代码, 工具, 和包, 因此,团队可以轻松地跟踪数据沿袭并在现有工作的基础上进行构建. “直营平台通过工作的质量和结果的可重复性来衡量成功,盖德说. “使用Domino, 直营平台现在可以建立可复制的工作流程,减少启动新项目的时间,并无缝地将直营平台的工作同步到GitHub."

    • 模型开发 与简单, 安全, 基于权限的数据访问和最新工具, 库, 资源, 计算基础设施(包括英伟达 gpu), 分布式计算框架(包括Ray和Dask, evification有兴趣使用哪个). “Domino为直营平台做了很多DevOps的工作, 是什么加快了直营平台的发展速度,菲利普斯说:“.  

    • 部署模型, 简化生产管道的开发. “直营平台可以在Domino上使用一个模型编排工具,它使直营平台能够在较短的时间内将新的和经过重新训练的模型投入生产,这与直营平台使用以前的平台相比是不一样的,盖德说.

    • 模型的监控 一旦模型投入生产,检测数据和模型漂移. Domino提供了一个很好的仪表板,可以方便地可视化和监视数据漂移和建模性能,盖德说. “随着时间的推移,直营平台可以查看不同模型的指标,以确认直营平台共享的机器学习预测没有失去预测的准确性."

    所有这些都由强大的安全性支持. 菲利普斯说:“直营平台非常重视数据的安全性. “Domino和雪花使直营平台能够在安全性高的环境中工作, 通过集中提供数据和资源,并能够维护直营平台网络上的所有项目和数据."

    多米诺效应

    直营平台现在可以把更多的时间花在研究和创新上, 这使直营平台能够服务更多的客户,提供更多的见解."

    ——evination公司的健康数据科学家piyusha Gade

    “规避法”正在逐步扩大其能为个人提供的洞见. 关键技术包括:

    • 实现新功能 在短短八周内. 根据对约340人进行的研究,evidate迅速设计和部署了流行病学监测系统的新模型,在三个流感季节里感染了1万多人. 该系统可以检测到参与者是否患了流感, 通知他们确认患者出现了症状, 并提供一个提示来加入他们所在领域的临床研究.

    • 将入职时间从几周减少到一天以内. “以前训练新团队成员需要数周时间, 但现在,他们可以在上班的第一天就开始工作,并提高工作效率,盖德说.

    • 提高团队生产力,节省几天甚至几周的时间. 团队可以在几秒钟内而不是几天内访问数据,并花更少的时间管理基础设施. 他们可以在不到一天的时间内追踪代码和数据的来源,而不是花费数周的时间来搜索这些信息. 他们可以立即访问领先的英伟达 GPU加速基础设施,而不是等待IT提供系统. “直营平台现在可以把更多的时间花在研究和创新上, 这使直营平台能够服务更多的客户,提供更多的见解,盖德说.

    现在看看Domino Enterprise MLOps平台能为您做些什么