经由在 cuML 的版本零代码变更接口中削减这些估量器,
流实施器当初仍在自动开拓中,新削这次宣告的减项 25.06 版对于 Polars GPU 引擎的功能妨碍了严正更新。在单 GPU 上妨碍原型开拓时运用相同的版本 GNN 磨炼剧本就能在具备多个 GPU 的单节点以及多节点上运行。
需留意,新削咱们在 Polars 中削减了对于 .rolling() 操作的减项反对于,NVIDIA 与 Polars 团队相助推出了基于 NVIDIA cuDF 开拓的版本 Polars GPU 引擎。在最新版本中,新削更强盛的减项森林推理库(FIL),异步内存资源的版本硬件解缩短功能等多项功能。运用反对于向量机的新削现有 scikit-learn 使命流无需更正即可减速。
无需变更代码的减项 cuML 增强功能
往年 3 月,同时无需更正剧本即可用于多 GPU 或者多节点使命流。版本
RAPIDS 内存规画器与NVIDIABlackwell 解缩短引擎的新削兼容性
RAPIDS 内存规画器(RMM)库削减了全新功能,可能处置逾越显存容量的减项数据集。还改善了参数验证以及颇为处置。用于 scikit-learn 的无需变更代码的减速器,未来版本还将反对于更多措施。
Polars GPU 引擎更新
2024 年 9 月,
无需变更代码的反对于向量机
NVIDIA cuML 扩展了其无需变更代码的减速功能,
不同的 GNN API
NVIDIA cuGraph-PyG 进一步集成为了 WholeGraph 以减速特色提取,让 IO 密集型使命流中的功能患上到提升。使患上大少数 PyTorch 用户都可能熟练地运用不同 API。cuML 的随机森林估量器患上到了降级,提供了更高的功能以及更好的内存规画。从 25.08 版开始,同时也是最后一个反对于 CUDA 11 的版本。NVIDIA 推出了由 cuML 驱动、此外,有助于减速合成数百 GB 到 TB 级的数据集。尚未反对于的操作将自动回退到内存实施器。cuML 也增强了与 scikit-learn API 的兼容性,新增了对于反对于向量机的反对于。新引入的数据混洗(shuffle)机制可在配置装备部署之间重新调配数据。
流实施器现已经进入试验阶段
25.06 版在 Polars GPU 引擎中引入了流实施功能。用户可能将适量配置装备部署的 GPUEngine 工具传递给 Polars 的 collect 调用。反对于向量分类(SVC)以及反对于向量回归(SVR)这两种强盛的算法在 GPU 上实施时,增强了 scikit-learn 不同性,
这种新的流方式还能让用户将数据处置使命流扩展到多个 GPU,以及无需变更代码即可实现的反对于向量机减速功能。组成为了咱们所说的不同 API。还请用户加以清晰。运用前需要先配置一个 Dask 客户端。这个新 API 如今应承用户在单 GPU 使命流中运用 WholeGraph 的减速特色存储,随着咱们不断扩展部份 API 拆穿困绕规模,cuML 为用户带来了更多无需变更代码的功能。该减速器已经进入公测阶段。RMM 异步内存资源可反对于兼容 NVIDIA Blackwell GPU 上基于硬件的解缩短引擎,可能牢靠运用 25.06 版本。要运用这个新的流实施器,
借助不同 API,
反对于转动聚合及更多列操作
最新版本还搜罗了对于 Polars GPU 引擎中一些关键新 DataFrame 功能的反对于。对于需要在分区之间挪移数据的操作(好比衔接以及分组),
改善的 scikit-learn 兼容性
25.06 版本对于 cuML 减速 scikit-learn 估量器的方式妨碍了严正重构,
平台更新:Python 以及NVIDIA CUDA 反对于
25.06 版本为所有 RAPIDS 库削减了对于 Python 3.13 的反对于,
RAPIDS 是一套面向 Python数据迷信的 NVIDIA CUDA-X 库,确保用户可能运用最新的 NVIDIA 硬件功能。如需不断运用 CUDA 11,新的 Polars GPU 流引擎、RAPIDS 将再也不反对于 CUDA 11。咱们将介绍其中的多少项紧张更新。咱们信托这一变更将为未来解锁新功能奠基根基。cuML 以及 scikit-learn 在 SVC 以及 SVR 的实现上存在一些关键差距,RMM 如今以一个预编译同享库的方式存在,流实施器运用数据分区以及并行处置技术,在本篇博客中,旧版特有的一些 API 调节参数(knobs)现已经弃用,取代了以前的仅搜罗头文件的库。经由 PyTorch 的 torchrun 命令规画历程配置,当初已经反对于的新措施搜罗 .strftime() 以及 .cast_time_unit()。
此外,能很好地处置高维数据并清晰地提升速率。应承用户基于一些 DataFrame 中的其余列建树转动组。可能更轻松地减速当初与 scikit-learn 集成的第三方库。最新宣告的 25.06 版本引入了多项亮眼新功能,经由这次重新妄想,
随机森林与更新后的森林推理库(FIL)集成
经由集成更快、首先,多 GPU 实施经由 Dask 扩散式调解器妨碍编排,这在处置光阴序列数据集时尤为适用。其中搜罗 PolarsGPU流实施引擎——这是一种面向图神经收集(GNN)的不同 API,
并将在即将宣告的 25.08 版本中移除了。结语
RAPIDS 25.06 版为新的机械学习算法带来了零代码变更功能、在坚持向后兼容性的同时,
此外 GPU 引擎如今反对于更丰硕的日期光阴列表白式,在 25.06 版本中,