跳到内容

    超越Spark:作为多节点加速计算框架的Dask和Ray

    过去10多年来,Apache Spark一直是分布式计算框架的主流. 但是Spark的开销和复杂性已经被Dask和Ray这样的新框架所掩盖.

    直营平台将讨论三者的历史, 他们打算用例, 自己的长处, 和他们的弱点. 从个人的权衡, 直营平台提出了如何根据可用的基础设施选择正确的框架的问题, 数据量, 工作负载的复杂性, 等.

    最后, 直营平台将探索它们在gpu加速计算环境下的能力, 提出了一个集成的解决方案,使数据科学家能够轻松地提供Spark/Ray/Dask集群,并通过集成开发环境访问它.

    发言人: Nikolay Manchev - Domino数据实验室EMEA首席数据科学家

    看点播