米Googleは12月10日(現地時間)、プレビュー提供中の音声合成モデル「Gemini 2.5 ...
MIXIは、7月に発売した会話AI(人工知能)ロボット「Romi(ロミィ)」の最新機「ラカタンモデル」に、高速応答の機能や視覚情報などに基づいて状況を理解する機能を備える新たな会話モデル「ChatRomi ...
文字起こしで使われる音声認識AIの代表格と言えるのが、ChatGPTで有名なOpenAIが開発した「Whisper」でしょう。音声認識の精度が非常に高く、日本語にも対応しています。本特集ではWhisperを高速化した派生モデル「faster-whis ...