ほとんどのAIベンチマークはAIの出力精度(スキル)を測定するものですが、スキルはAIの知能を表すものではありません。スキルではなくAIの知能を測定するため、AIがスキルを効率的に習得する能力を測定するベンチマークが「ARC-AGI」です。そんなARC-AGIの ...
AI業界には今、中国のスタートアップ企業が開発したAIモデル「DeepSeek-R1」の登場による激震が走っている。OpenAIの1世代前のAIモデル「o1」に匹敵する性能を、はるかに低いコストで開発し、サービスを桁違いに安価に提供したことで、世界中から注目を集めた。
先週、中国発のAI「DeepSeek-R1」の話をしたところ、マイクロソフトから「DeepSeek-R1」の小型蒸留モデルをNPU(Neural Processing Unit)で動かせるようにしたという話が飛び込んできた。 「マイクロソフトはOpenAIと組んでるんじゃないの?」とか「DeepSeekは問題だらけ ...
日本の大手IT企業であるサイバーエージェントが2025年1月27日、AI開発企業のDeepSeekがリリースしたオープンソースの推論モデル「DeepSeek R1」の蒸留モデルをベースに、日本語データで追加学習を行った大規模言語モデルを公開しました。 【モデル公開のお ...
B, a 3-billion-parameter AI model, is challenging OpenAI, Google and DeepSeek on math and coding benchmarks while reigniting ...
Microsoftは29日 (米国時間)、Copilot+ PCに搭載されているNPU上でLLMを活用できるDeepSeek-R1モデルの移植を行なったと発表した。まずは「Visual Studio Code」 (VS Code)の拡張機能「AI Toolkit」を介して「DeepSeek-R1-Distill-Qwen-1.5B」を提供し、7Bおよび14Bもまもなく用意するという。
SambaNovaは、DeepSeek-R1 6710億パラメータモデルの推論を効率的に実行するためのハードウェア要件を40ラック(320基のGPU)から1ラック(SambaNova独自のAIアクセラレータであるRDUが16基)に集約し、最新GPUの3倍の速度、5倍の効率を実現 @カリフォルニア州 ...
サイバーエージェントは2025年1月27日、1月20日に中国のAI企業DeepSeekが公開した推論型LLM 「DeepSeek-R1」 の蒸留モデルに日本語データによる追加学習を行ったLLM 「DeepSeek-R1-Distill-Qwen-14B/ 32B-Japanese」 を公開した。 【モデル公開のお知らせ】 DeepSeek-R1-Distill-Qwen-14B ...
会員(無料)になると、いいね!でマイページに保存できます。 ChatGPTでプログラミングをする「意外な利点」 『#100日チャレンジ 毎日連続100本アプリを作ったら人生が変わった』(大塚あみ著、日経BP、2025年)という書籍が発売され、話題を呼んでいる。