データアナリスト/データサイエンティストのためのカジュアルな勉強会「Data Gateway Talk」。「GBDTアルゴリズム」というテーマで登壇した工学院大学情報学部コンピュータ科学科のYasshieeee氏は、勾配ブースティングの基本、そしてアルゴリズム「XGBoost ...
こちらが超基本のイメージ。 もう少し細かく整理しておきます。 精度が伸び悩むときは:learning_rate を下げて iterations を上げるのが定石。 過学習が疑われるときは:min_child_weight や l2_leaf_reg を上げて抑制。 カテゴリ変数が多いときは:CatBoostが便利(cat ...
前回解説したステップ2までの工程で、ノートブックインスタンスの作成を完了しました。ここからはノートブックを起動して、学習/推論に必要なデータの準備を行っていきます。 ノートブックインスタンスで利用できる2種類のプログラミングツール Amazon ...
昨年9月にリリースされたXGBoost 2.0でマルチターゲット回帰、マルチラベル分類、マルチクラス分類のために追加された新機能です。 以前のバージョンではXGBoostは各ターゲット毎に別々のモデルを構築していましたが、Vector Leafでは全てのターゲットに対して ...
├── dataset/ # Thư mục chứa dữ liệu thô (UMUDGA & Tranco) ├── 1_load.py # Bước 1: Load, làm sạch và cân bằng dữ liệu ├── 2_feature_extration.py # Bước 2: Trích xuất 9 đặc trưng từ tên miền ├── 3_train ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する