跳到内容

    模型速度:加速模型驱动业务的关键

    2022年1月26日   3分钟阅读

    大多数数据科学家会告诉你,成功在于迭代开发模型, 但是迭代开发本身是不够的. 如果您的模型只部署一次,并且再也不接触它,那么再多的迭代开发也不会驱动持续的业务结果, 这经常发生, 根本没有部署). 您的模型不仅会在投入生产时降级, 但更多的时候不是, 只有当人们使用生产版本时,您才会发现模型的真正业务需求, i.e., 您的模型已被部署. 当你的数据迟早会发生系统性的变化时——e.g., 由于一场大流行——无论开发了多少次迭代,您都需要抛弃您的模型.

    模型速度是必须的模型价值和体积

    驱动变革性影响的关键在于你迭代的能力 整个生命周期 你的模型. 你做这件事的速度和效率是衡量你的能力的标准 模型速度,以及它是如何随时间变化的,这将帮助您跟踪向模型驱动业务发展的过程. 模型速度捕获了您遍历端到端模型开发的能力 而且 快速部署过程, 反复, 而且始终如一——来自数据工程, 工程特性, 算法的选择, hyperparameter调优, 验证, 部署, 监控. 它衡量你实现新模型的能力,就像特性速度帮助开发人员团队衡量他们交付新特性的能力一样.

    生命周期您需要维护和加速您的模型速度,以处理使用新模型驱动业务价值的每一个机会, 但同样重要的是, 保持你的模型是最新的,这样它们就能反映当前的市场状况, 客户偏好, 和更多的. 你需要不断调整你的模型, 用额外的训练数据改进它们,并根据漂移调整它们. 您的模型速度跟踪您在数据科学生命周期中持续迭代的速度. 结合, 您的模型速度决定了您处理新的模型驱动项目的速度, 你能同时维持多少, 以及如何有效地与他们保持成功的结果.

    测量您的模型和模型速度

    每个数据科学团队都在努力衡量自己的效率, 跟踪进展, 和基准测试自己. 测量模型性能- e.g. 精度, 回忆, 或F1分数——或由此产生的商业结果, 虽然极其重要, 对您的能力提供有限的了解. 模型性能的下降很容易掩盖强大的功能,因为如果团队没有部署更新的模型,下降会更大.

    velocity2测量已完成的项目或部署的模型的数量也是有问题的. 人们通常认为越多越好, 但如果你不维护这些模型那么更多的模型就意味着更多的风险, 而且,这也可能表明你的团队过于紧张,无法支持当前的投资组合, 更不用说采取新的举措了.

    测量模型速度可以让您对数据科学能力有一个更全面的了解, 成熟, 还有绩效,因为它衡量的是进入这些模型的活动的成功程度. 因此,它较少受到外部因素(例如业务条件或It系统的更改)的影响,并为您提供更好的视图, 不仅仅是已部署项目的运行状况, 而是对能力的展望, 能力, 时机, 和你需要为未来计划的摩擦.

    加速您的模型驱动业务

    如今,有哪家公司不想更依赖模型驱动呢? 挑战在于如何超越特殊项目和孤立的成功,向可靠的方向发展, 可重复增长的能力, 维护, 并管理跨组织的模型驱动项目. 前进的道路上布满了限制您的模型速度的减速带和坑洞,并可能完全阻碍您的模型驱动的雄心壮志. 过于频繁, 数据科学家最终无法获得足够的数据, 过时的工具, 计算能力不足, 而缓慢, 将模型投入生产并随时间进行维护的手动流程. 加速您的模型速度需要企业级的机制,用支持端到端生命周期的最新工具和基础设施来驱动协作和自动化.

    模型速度为直营平台提供了一种全新的方法来整体度量模型生命周期——捕获人员(角色和技能), 流程(协作), 以及决定成功的技术(集成平台)因素. 模型速度是一个新概念-你需要根据你的需要调整精确的公式, 它也不能取代直营平台今天使用的大多数指标, 但有了它,直营平台现在有了一个加速计,用于模型驱动的旅程.

    免费工具模型速度评估您的数据科学团队如何改进其流程? 通过回顾您的数据科学生命周期,可以在几分钟内找到答案. 把你的分数

    谢尔••

    谢尔·卡尔森报道了人工智能, ML, 在弗雷斯特研究公司(Forrester Research)担任首席分析师多年. 他写了几十份关于人工智能主题的报告,从计算机视觉到人工智能, MLOps, AutoML, 从对话智能到增强智能, 新一代人工智能技术, 以及数据科学最佳实践. 他做过无数次主题演讲, 面板, 和网络研讨会, 并且经常被媒体引用. 最近,他一直担任直营平台执行副总裁 & 以nlu为中心的初创公司的战略, Stratifyd, 领导直营平台团队,重新设计公司战略. 他获得了博士学位.D. 我在哈佛商学院的商业经济学专业毕业.

    你可能感兴趣的其他职位