Py.test Databricks - 検索 News

Databricks pytestとArrow活用ガイド

Databricksの開発現場では、Notebook単位の実験的なコードが多くなりがちです。その中で欠かせないのがpytest。これはPythonのテストフレームワークで、複雑なデータ変換ロジックを小さく検証し、誤差や副作用を早期に検出するための強力なツールです。

note

Lab1.3 Pandas UDF + pytest（assertDataFrameEqual）

Databricksでは、Spark DataFrame上でPythonのPandas関数を並列実行できる Pandas UDF（User Defined Function）が強力なツールとして利用されます。通常のUDFが1行ずつ処理するのに対し、Pandas UDFは列（Series）単位で高速処理する点が特徴です。Sparkの分散処理性能を保ち ...

一部の結果でアクセス不可の可能性があるため、非表示になっています。

アクセス不可の結果を表示する

Databricks pytestとArrow活用ガイド

Lab1.3 Pandas UDF + pytest（assertDataFrameEqual）

現在のトレンド