Sam Audio是由Metakey推出的一款基於Meta的Segment Anything Audio Model的音頻分離工具。它利用多模態提示(文本描述、視覺提示或時間跨度)從復雜音頻混合物中分離出特定聲音,輸出高質量的目標和殘餘音頻軌道。該產品定位為專業音頻編輯,適用於音樂製作、播客編輯等領域。其主要優點包括AI驅動的音頻分離、支持多種提示方式、統一模型處理多種音頻分離任務、保留原始採樣率等。產品價格為免費。
需求人群:
["音樂創作者: Sam Audio可以幫助他們將樂隊演奏中的各種樂器聲音分離出來,方便進行後期的混音、編曲等工作,同時也能提取純淨的人聲,提升音樂作品的質量。", "播客編輯人員:能夠輕鬆地將播客中的嘉賓語音、背景音樂、音效等進行分離和處理,使播客內容更加清晰、專業。", "影視製作人員:在影視製作過程中,可利用該工具分離出各種聲音元素,如對話、環境音效、背景音樂等,便於進行音頻的後期製作和調整。", "科研人員:對於需要處理音頻數據的科研項目, Sam Audio可以幫助他們提取特定的聲音信息,進行數據分析和研究。"]
使用場景示例:
音樂製作:在製作音樂時,將樂隊現場演奏的音頻導入Sam Audio ,通過文本提示分離出吉他、貝斯、鼓等樂器的聲音,然後對每個樂器的聲音進行單獨調整和混音。
播客編輯:對於戶外錄製的播客,使用時間範圍提示分離出嘉賓的語音部分,同時去除背景中的交通噪音、風聲等乾擾聲音。
影視製作:在影視後期製作中,利用視覺提示從電影音頻中分離出角色對話、環境音效和背景音樂,以便進行音頻的優化和調整。
產品特色:
AI驅動的音頻分離:借助Meta的AI基礎模型,能夠高效且智能地將復雜音頻中的不同元素進行分離,如將樂器聲、人聲等從音頻中精準提取出來。
人聲隔離:可以精確地將音頻中的人聲部分單獨分離出來,為音樂製作、音頻剪輯等工作提供純淨的人聲素材。
樂器分離:能把各種樂器的聲音從混合音頻中分離,方便音樂創作者對不同樂器的聲音進行單獨處理和調整。
語音提取:從音頻中準確提取出語音內容,適用於播客編輯、會議錄音整理等場景。
音效隔離:可將音頻中的各種音效單獨分離出來,滿足影視製作、遊戲開發等對音效單獨處理的需求。
基於文本的提示:用戶可以使用自然語言描述想要分離的聲音,如“鋼琴聲”“狗叫聲”等,系統會根據文本提示進行音頻分離。
視覺提示:通過直觀的視覺方式,如在音頻波形圖上進行標記等,幫助用戶更精準地指定要分離的音頻部分。
基於時間範圍的提示:用戶可以指定具體的時間範圍,如從第3秒到第7秒,系統會對該時間段內的音頻進行分離操作。
使用教程:
1. 打開網站:訪問https://samaudio.audio。
2. 上傳音頻:在網站上選擇要進行分離的音頻文件並上傳。
3. 選擇提示方式:根據需求選擇文本提示、視覺提示或時間範圍提示。
4. 輸入提示內容:如果選擇文本提示,輸入要分離的聲音的描述;如果選擇視覺提示,在音頻波形圖上進行標記;如果選擇時間範圍提示,指定具體的時間範圍。
5. 開始分離:點擊分離按鈕,系統開始進行音頻分離操作。
6. 下載分離結果:分離完成後,下載分離出的目標音頻和殘餘音頻。