概要

対話型 AI とは?

対話型 AI は、AI バーチャル アシスタント、デジタル ヒューマン、チャットボットを支え、パーソナライズされた自然な人間と機械の会話を実現する道を拓いています。 しかし、リアルタイムのインタラクションには、高い精度と速度が求められます。 Nemotron Speech オープン モデルと NVIDIA Riva ライブラリにより、開発者は応答性の高い音声および翻訳機能を構築し、エージェント型 AI アプリケーションに自然な音声インターフェイスを追加できます。

NVIDIA Nemotron 音声モデルが ASR リーダーボードで首位に

NVIDIA Canary と Parakeet モデルは、Artificial Analysis および Hugging Face ASR リーダーボードで一貫して上位にランクインしています。

NVIDIA Riva Magpie TTS が今すぐご利用いただけます

エージェント型 AI のニーズに合わせたカスタム音声を作成できます。多言語対応の NVIDIA Riva Magpie Text-to-Speech (TTS) NIM 、または Hugging Face で利用可能なオープンソース モデルを使用することで、テキストを自然な男性および女性の声で音声に変換できます。 Magpie は、ブランド固有の追加音声でカスタマイズでき、NVIDIA NIM™Hugging Face の Nemotron Speech コレクションの両方で提供されている、リーダーボード上位の ASR モデルを補完するソリューションです。

利点

対話型 AI の利点を見る

窓口の効率化

顧客との会話をリアルタイムで書き起こし、分析し、提案することで顧客の問いをすばやく解決し、コンタクト センターの窓口を支援します。

デジタルおよびグローバル アクセシビリティ

聴覚に問題を抱える方がオーディオ コンテンツを利用できるようにし、発話が困難な方が複数の言語で自己表現できるようにします。

24 時間年中無休のサービス

チャットボットと AI 仮想アシスタントを利用することで、窓口の通常営業時間以外でも顧客の問いに答え、価値ある情報を提供することができます。

人を惹きつける体験

ライブ キャプション、表現力豊かな合成音声、顧客の嗜好の理解などの機能で、人を引きつける体験を提供します。

ソフトウェア

NVIDIA の対話型 AI ソフトウェアを見る

NVIDIA Nemotron

  • オープンウェイト、トレーニング データ、レシピを備えたオープン モデルにより、専門的な AI エージェントを構築するための高い効率性と精度を実現します。
  • マルチモーダル Nemotron モデルは、エージェント型システムに音声、インテリジェンス、そして安全性をもたらします。

NVIDIA Riva

  • 完全にカスタマイズ可能な多言語音声を備え、月間数百万件の通話にも対応可能な世界クラスの AI エージェントを構築し、デプロイします。
  • 高精度で表現力豊かな多言語音声を提供します。

NVIDIA NIM

  • パフォーマンスが最適化された生成 AI モデルのデプロイメントを加速します。

  • エンタープライズ グレードのサポートに裏付けられた、安定しているセキュアな API でビジネス アプリケーションを実行できます。

NVIDIA Blueprints

ユース ケース

対話型 AI の使用方法

NVIDIA AI は産業の各種ユース ケースに対応しており、厳選されたサンプルを備えているため、対話型 AI 開発をすぐにでも始められます。

医療エージェント

医療分野では、高精度かつ文脈を理解する AI により、患者とのやりとりが再構築されています。 Nemotron モデルを活用することで、組織は臨床効率と患者体験のギャップを埋めることができます。 

アンビエント音声エージェントは、文脈と意図を理解し、構造化された臨床ドキュメントを自律的に生成します。音声エージェントは、予約や問診など大量の患者対応を担当し、柔軟な推論によって共感的でパーソナライズされたやり取りを実現します。

AI バーチャル アシスタント

企業は、何百万人もの顧客や従業員の問い合わせに 24 時間体制で効率的に対応するために、AI バーチャル アシスタントを導入しています。LLMRAGスピーチ AI などのカスタマイズされた NVIDIA Nemotron モデルにより、これらの AI チームメイトは、背景ノイズや音質の悪さ、多様な方言やアクセントが存在している場合でも、即座に自然な応答を提供します。

エージェント アシスト

利用者は、コンタクト センター担当者が問題を迅速かつ効率的に解決することを期待しています。人間のエージェントが最高の体験を提供できるよう、さまざまな業界の企業は、LLMRAGスピーチ AI 向けの NVIDIA Nemotron モデルを搭載したエージェント アシスト テクノロジーを導入しています。 このテクノロジはリアルタイムの事実と提案を提供し、エージェントがより効果的かつ効率的に応答できるよう支援しています。RAG Blueprint は、迅速な情報検索により生成 AI アプリケーションを強化し、大量のデータから取得した知識を AI エージェントに即座に提供します。

AI 翻訳

グローバル経済では、企業は毎日、無数のオンライン会議を開催し、さまざまな言語背景を持つ顧客にサービスを提供しています。企業はリアルタイムの文字起こしと翻訳を活用することで、正確なライブ字幕を生成し、世界中のアクセントや業界特有の用語にも対応できます。Nemotron モデルを要約やインサイトの生成に活用することで、効果的なコミュニケーションと円滑なグローバル インタラクションを実現できます。

フィジカル AI

サービス ロボットや音声指示で動く機械は、世界中の病院、製造現場、空港、小売店などで広く利用されるようになっています。 飲食店や製造現場で日常的に繰り返される作業を手伝い、店内で品物を探すお客様を手助けし、医師や看護師による患者ケアをサポートすることで、現場スタッフを支援します。 Nemotron 音声モデルをエッジに直接デプロイすることで、これらのロボットはほぼ瞬時の音声インタラクションを提供し、接続が制限された環境でも高い運用信頼性を維持します。

導入事例

対話型 AI でイノベーションを推進する業界のリーダーたちの手法

運転とロボティクス

エッジでのスピーチ AI

顧客: Caterpillar 

テクノロジー: NVIDIA Nemotron、NVIDIA Riva、NVIDIA Jetson Thor™、Qwen3-4B LLM、vLLM、Caterpillar Helios、NVIDIA Omniverse™

Microsoft Teams Customer Story
通信

AI 受付担当者が 24 時間 365 日の通話対応を実現

顧客: Personal AI

テクノロジー: NVIDIA Nemotron、NVIDIA Riva、NVIDIA Dynamo

小売業

音声エージェントによる運用と顧客サービスの拡張

顧客: Yum! ブランド

テクノロジー: NVIDIA Nemotron、NVIDIA NIM、NVIDIA Riva

採用した企業

全産業における主要な採用企業

エンタープライズ規模の要件を満たすことができる主要な音声、翻訳、言語のワークフローをGPUで高速化

GPU で高速化する最新のディープラーニング モデルを、人気の対話型 AI ライブラリで構築します。

関連情報

対話型 AI 最新情報

高精度カスタム ASR 入門

機能をカスタマイズした NVIDIA Riva で GPU 対応の ASR サービスを構築、トレーニング、ファインチューニング、デプロイする方法を学びます。

対話型 AI パイプラインの構築とデプロイ

ASR、NLP、TTS などのエンドツーエンドの対話型 AI パイプラインを構築およびデプロイする方法を学ぶ。

スピーチ AI を解明する

世界クラスの精度を実現し、業界向けにスピーチ AI パイプラインやモデルをカスタマイズする手法を学ぶ。

次のステップ

さっそく始めませんか?

最新の関連資料、チュートリアル、技術ブログなど、対話型 AI アプリケーションの開発を始めるために必要なすべてが見つかります。

お問い合わせ

試作から本番環境への移行については、NVIDIA の製品スペシャリストにご相談ください。NVIDIA AI Enterprise のセキュリティ、API 安定性およびサポートを活用することができます。

NVIDIA AI の最新情報を入手

NVIDIA から最新情報、お知らせなどをお届けします。