Metaは、OpenAIやGoogleのDeepMindなどの生成型人工知能のリーダーに対して厳しい競争をする準備をしています。Meta AIは最近、OpenAI GPTのAIチャットボットモデルに相当するLLaMAモデルを発表しました。そして、Meta AIはテキストから音楽を生成することができるAudioCraftを発表し、GoogleのMusicLMと競合しています。
これは一般ユーザー向けの生成型AIへのMetaの旅が始まったばかりの黄金時代です。生成型AIの能力は、ユーザーのプロンプトや入力に基づいてテキストベース、画像生成、または転写された音声応答を作成することができるため、ミュージシャンやサウンドエンジニアにとって非常に有用です。これにより、アーティストは自分のアイデアを実験したり、ユーザーはプロジェクトをスタートさせるためのヘッドスタートを得ることができます。
アーティストは著作権の問題を心配する必要はありません。MusicGenはMetaが所有しライセンスされた音楽でトレーニングされており、アーティストは商業利用することができます。MetaはAudioCraftを無料でGitHubで提供しています。今日は、Meta AIのAudioCraftとその使い方を見ていきましょう。それでは、さっそく始めましょう。
Meta AIのAudioCraftとは何ですか?
これはテキストから高品質でリアルな音楽を作成することができるテキスト音楽生成型AIモデルです。Meta AIはMusicGen、AudioGen、EnCodecなどの複数のAIモデルを使用しています。MusicGenとAudioGenは、単一自己回帰言語モデル(LM)を使用してテキストから音楽を生成することができます。一方、EnCodecは特定のオーディオや効果音を追加します。EnCodecはニューラルネットワークを使用してオーディオを圧縮し、入力信号を再構築します。MusicGenはMetaが所有するライセンスされた音楽を使用するために特別にトレーニングされています。
最新のAIモデルであるAudioCraftは、環境音や床のきしむ音、犬の吠え声などの音効を生成することができる、生のオーディオ信号でトレーニングされたAudioGenモデルです。私たちが話し合ってきた3つのモデルはすべてオープンソースなので、誰でも利用することができます。そして、そこから研究者や実践者は自分たちのモデルをトレーニングし、AI生成音声と音楽の分野の進歩に貢献することができます。
今日は、テキストから高品質なオーディオと音楽を簡単に生成できる生成型AIモデルの一族であるAudioCraftについて詳細を共有しています。
— Meta Newsroom (@MetaNewsroom)
Meta AIは、シンセサイザーのような標準的な楽器を提供することを目指しています。ここでは、AudioGenによって生成された音楽とMusicGenの音楽、プロンプトとともに、どのような音がするかを確認することができます。他の生成型人工知能と同様に、MetaはAudioGenを一般の効果音でトレーニングし、テキストのプロンプトから音を生成します。一方、EnCodecデコーダーは、より少ないアーティファクトで高品質な音楽生成を可能にします。
Meta AIのMusic Genの使い方
これはオープンソースプロジェクトなので、誰でもローカルマシンやサーバーにMusicGenを展開して使用することができます。ただし、Webインターフェースについては、Hugging Faceをチェックしてください。
- Hugging FaceでMusicGenを訪れてください。
- 3つのパネルが表示されます。最初のパネルには、プロンプトまたは入力を書くためのテキストボックスがあります。
- オプションで、ファイルをドラッグアンドドロップするか、オーディオをブラウズすることでアップロードするオプションもあります。また、プロンプトを入力するためにマイクを使用することもできます。その場合、音声が転写されます。
- プロンプトを書いた後、「生成」をクリックすると、オーディオが生成され、右上のボックスに「生成された音楽」として表示されます。
- 以上です。
注意:
また、コードをデプロイするには、「スペースの複製」をクリックして、好みに合わせて微調整や調整を行うこともできます。ここで、AudioGenとMusicGenのサンプルオーディオを聴くこともできます。
さらに、Meta AIはOpenAIのChatGPTやGoogle Bardに似たAIチャットボットの開発も進めています。公式のアプリのタイムラインはまだ共有されていませんが、近い将来のローンチが予想されています。また、AppleやSamsung、Xなどの企業からも、より多くの生成AI技術が期待されています。
来月のMetas AIのパーソナリティ
Metaは、生成AIに責任を持つ新しい製品グループを発表しました。TikTokやSnapchatなどの他の競合他社は既にAGIの実装を開始しているため、Metaは次世代のソーシャルメディア統合に焦点を当てています。
開発の最終段階にあり、Meta AIは今後数か月にわたってリリースされるパーソナリティを開発しました。これらはInstagram、Facebook、Messenger、WhatsAppなどのMetaの製品に統合される予定です。報道によると、Instagramは既にストーリーズの画像からオブジェクトを削除したり、コメントを生成したりするためのAI機能をテストしています。
報告によれば、Meta AIは既に人間のような応答を生成するチャットボットを開発しています。テストでは、それはアブラハム・リンカーンのスタイルで応答しました。ユーザーの維持もさらなる進歩となる可能性があります。会社はユーザーの維持に助けが必要です。私たちはLLaMAをテストしましたが、OpenAIのGPTと比較してそのセーフガードは回避が難しいです。つまり、会社がそれをリリースする場合、より良い実装と洗練されたプロンプトの処理が行われるでしょう。
MetaのCEOであるマーク・ザッカーバーグは、7月26日に投資家に対して新しいAIパワードツールの展開について語りました。彼はまた、AI広告製品に焦点を当て、AIがユーザーを維持することの重要性を強調しました。会社は2四半期連続で少なくとも15%の収益成長を達成しています。