米OpenAIは8月28日(現地時間)、「gpt-realtime」を発表した。同社が提供するなかでもっとも先進的な音声対話(speech-to-speech)モデルで、音声エージェントとして実用段階にあると謳っている。 この新しいモデルは、カスタマーサポートやパーソナル ...
会員(無料)になると、いいね!でマイページに保存できます。 OpenAIが今回発表したモデル群の中核となる「GPT-Realtime-2」は、音声処理において直接的な思考と計画立案を実行する初のモデルである。最大12万8000トークンのコンテキストウィンドウを備え ...
株式会社ホスポート(本社:東京都港区、代表取締役:西原 宗一郎)は、宿泊業界向けAI接客エージェント「Hosport」において、OpenAIが正式発表したRealtime APIとSIP(Session Initiation Protocol)連携を活用した新しいAI電話機能の実装を完了し、提供を開始しました。
OpenAIは、リアルタイム音声エージェント向けの「Realtime API」を正式リリースした。音声対話モデル「gpt-realtime」、外部ツール連携を簡単にする「MCPサーバー」のサポート、画像を音声会話に組み込む「画像入力」、電話網との直接接続が可能な「SIP通話機能 ...
OpenAIがリアルタイム音声対話AI「GPT-Realtime-2」、リアルタイム音声翻訳AI「GPT-Realtime-Translate」、リアルタイム文字起こしAI ...
米OpenAIは5月7日(現地時間)、Realtime API向けの次世代音声機能群を発表した。開発者はAPIを通じて、高度な推論が可能な「GPT-Realtime-2」、多言語の同時通訳を行う「GPT-Realtime-Translate」、即時の文字起こしを実現する「GPT-Realtime-Whisper」を利用できるようになる。
OpenAI explains in more detail what’s new with the GPT-5-class GPT-Realtime-2 voice model with reasoning: GPT‑Realtime‑2 is built for live voice interactions where the model keeps the conversation ...
現在アクセス不可の可能性がある結果が表示されています。
アクセス不可の結果を非表示にする