跳到内容

    在几周内交付新的欺诈检测功能,而不是几个月.

    《财富》500强保险公司的数据科学

    如今,保险公司面临着巨大的创新和灵活的压力, 特别是在该行业努力应对全球风险状况变化的情况下, 行为模式, 以及围绕新型冠状病毒的微观和宏观经济不确定性. 买家比以往任何时候都对价格更加敏感,他们认为保险公司是可以互换的. 新的技术驱动的玩家已经出现, 从老牌企业手中赢得市场份额. 以及来自智能家居等物联网设备的实时数据, 汽车传感器, 卫生设备, 无人机已经成为主流, 为那些有能力利用它们的人提供广阔的见解.

    然而,保险公司曾经把数据科学的努力主要集中在风险管理上, 数据科学是当今所有业务领域的基础. 一家《财富》500强保险公司将数据科学工作集中在Domino上, 将模型交付和验证周期缩短到几个月,这样公司就可以提供差异化的客户体验,更好地防止欺诈.

    挑战

    近30年来, 这家《财富》500强保险公司利用先进的分析技术更好地了解客户需求,数据科学计划在公司的核心直营平台线和功能中有机地发展, 数据科学家的数量已经膨胀到数百人.

    其中一个特别关注的领域是欺诈检测. 风险领导者明白,在发现(和阻止)欺诈方面,金融服务机构必须谨慎行事. 做对了, 客户很感激他们的金融机构阻止了欺诈性交易, 账户违反, 或虚假索赔. 如果做错了,当交易和索赔被搁置时,客户就会感到沮丧.

    但随着数据科学家们致力于建立新的欺诈检测模型,并集成新的数据源,使企业能够获得正确的平衡, 他们面临着许多阻碍他们进步的障碍:

    • 数据科学家不能总是访问他们需要的基础设施和工具. 集中式R和Python服务器被超额订阅, 在任何给定的时间, 大量的数据科学家无法完成他们的工作.
    • 不需要等待基础设施和工具, 数据科学家们选择在笔记本电脑上工作. 这 “影子” 情况为组织带来了大量的治理风险.
    •  没有简单的分享方式 知识、数据集、模型和修订. 作为一个结果, 数据科学家经常花时间清理数据,却没有意识到其他数据科学家已经这么做了. 当数据科学家转到另一个团队或离开公司时,项目历史和细节经常会丢失, 很难在过去的工作基础上继续下去.
    • 模型代码和数据经常被“扔过墙”给风险经理 用于部署前的批准,几乎没有文档, 增加治理和法规遵循过程的复杂性. 由于缺乏可审核性,技术领导者也很难确保数据科学项目遵守安全性, 治理, 和合规工作, 特别是周围的数据访问.
    • 将模型操作化并不容易; 数据科学家不得不将Python和R的模型重写为SPSS,以便将它们投入生产.
    解决方案

    该公司对Domino data Lab的数据科学技术进行了为期两周的试验, Dataiku, DataScience.com(被Oracle收购)和IBM. 试验参与者, 谁代表公司的银行业务, 财产保险, 创新, 风险划分等, 一致选择Domino是因为它支持端到端数据科学管理生命周期的独特能力, 加速模型开发, 验证, 和部署.

    该组织采取了分阶段实现Domino的方法, 每周培训大约30名用户. 如今,该平台服务于数据科学和IT领域的400多名用户,包括:

    • 数据科学领袖,他对正在进行的数据科学项目有了全面的了解. (以前,他们必须向每个团队成员单独询问最新情况.集成的数据科学项目管理能力帮助他们为项目设定目标,并跟踪团队完成的工作. 作为一个结果, 他们可以更好地让利益相关者了解进展情况,并更快地识别和解决开发瓶颈.
    • 数据科学家和数据工程师他们可以更快地开发和部署模型. 自助服务环境确保他们能够访问所需的工具和资源,并有一个单独的地方搜索和查找过去的工作. 自动跟踪使他们能够轻松地复制和共享结果,从而更好地与其他数据科学家合作,并简化下游流程,如模型验证. 使用api和web应用程序部署模型的能力消除了数据科学家在不同平台上重新编码模型的需要. 与公司的持续集成/持续部署(CI/CD)系统的集成使团队在准备好时更容易导出和部署模型.
    • IT和平台经理他们现在对数据科学工作有了更好的监督. 他们可以确认对安全的遵守, 治理, 和遵从性, 同时授权数据科学团队独立访问集装箱化研究环境和计算资源. IT团队计划集成Trifacta数据处理软件, 情景应用程序, 以及来自datarrobot和H2O的autoML工具和Domino平台,以扩展数据科学家可用的工具. 随着该公司将数据科学功能迁移到云端, 技术领导者说Domino的kubernetes原生编曲能力将帮助他们更快地完成过渡.
    多米诺效应
    • 改进的欺诈检测. 之前, 团队面临着挖掘越来越多的数据源和较长的周期(长达一年)以将新模型投入生产的耗时过程. 相对, 数据科学家利用了更广泛的数据, 包括客户的见解, 行为趋势, 和消费模式, 并在Domino上部署了一个新的、更复杂的欺诈检测模型,而且只花了一小部分时间. 他们工作的速度和成功, 包括快速部署新模型的能力, 是否帮助欺诈小组有理由扩大数据科学的努力.
    • 挽回约10%的损失时间,并将周期缩短数月. 以前, 在漫长的(长达18个月)模型验证过程中,数据科学团队估计损失了10%的时间来重建过去的工作和环境. 多亏了Domino,这些浪费时间的东西已经被消除了, 使数据科学团队和模型验证人员能够最大化他们的生产力并实现更大的规模经济. 在未来, 该组织计划邀请模型验证者和监管者进入Domino平台, 哪一个可以节省几个月的模型部署时间.
    • 改善风险管理. 金融服务机构被置于显微镜下,以确保数据科学过程, 得到的模型, 遵守监管规则. 现在, 具有自动跟踪和完全可重复性实验, 数据集, 工具, 和环境, 该公司有一个审计跟踪记录,具体记录了哪些工作已经完成,哪些人访问了哪些数据.

    看看Domino Enterprise MLOps平台能为您做些什么