AIを実行するには大容量のメモリが必要であり、AIモデル側のメモリ使用量を削減する技術として「量子化」が広く用いられています。新たに、Googleが「学習段階で量子化をシミュレートする」というアプローチを採用した省メモリ版Gemma ...
米Google DeepMindは6月5日(現地時間)、オープンモデル「Gemma 4」ファミリーの「Quantization-Aware ...