音声を瞬時に認識できるオープン音声AIモデル「LLaMA-Omni」の紹介です。 音声指示を1秒未満の超高速で処理し、テキストと音声の両方の応答を同時に生成できます。 ■「LLaMA Omni」のgithubページ https://github.com/ictnlp/LLaMA-Omni ■Arxiv(論文) https://arxiv.org/pdf/2409.06666 ■声の出演 VOICEVOX:四国めたん VOICEVOX:ずんだもん #llama, #AI, #llm, #AI音声, #解説動画, #大規模言語モデル チャンネル: 胡麻トラAI実験室 「LLaMA Omni」音声を瞬時に認識できる音声AIモデル 投稿日:2024.09.25 11:57 視聴時間:7:32 視聴回数:123回 いいね:11件 お気に入り:0件 コメント:0件 |
AIを使ってローカル環境でいろんなことやってます。主に画像や音声・文章などを、生成系AIを使って実験してみます。 総視聴回数:1,022,684回 動画数:18 チャンネル登録者数:1,940人 |