Google DeepMindは6月5日、大規模言語モデル「Gemma 4」のメモリ要件を削減しつつ、性能を最大化する「QAT(Quantization-Aware Training)」最適化チェックポイントをリリースした。Hugging ...
AIを実行するには大容量のメモリが必要であり、AIモデル側のメモリ使用量を削減する技術として「量子化」が広く用いられています。新たに、Googleが「学習段階で量子化をシミュレートする」というアプローチを採用した省メモリ版Gemma ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する