テクノエッジ on MSN
Opus 4.8に肉薄するオープンソースモデル「GLM-5.2」、VRAM4.5GBで動く ...
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第149回)は、Opus 4.8に肉薄するオープンソースモデル「GLM-5.2」や、テキストや画像から動き回れるゲーム世界を創るAI「DreamX ...
LLMの推論速度を向上させる「投機的デコーディング」のボトルネックを解消する新手法「DFlash」が発表された。カリフォルニア大学サンディエゴ校の研究チームが開発し、NVIDIAのBlackwell GPU環境において、従来の自己回帰デコーディング比で15倍以上の同時ユーザー負荷を処理できることが実証された。LLMの推論インフラを運用するエンジニアにとって、コード変更なしで劇的な高速化とコスト削減 ...
今回は、Baiduの研究チームが開発した、数十ページのPDFなど長文を一括処理できるエンドツーエンドのOCRモデル「 Unlimited OCR 」を取り上げます。このモデルはMITライセンスで公開されており、商用利用も可能です。
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する