【ITBEAR】微軟近日獲得一項新專利,該專利構想了一種利用人工智能模型Copilot來為用戶創作與視頻、文本及PowerPoint等內容相匹配的音樂或背景音樂的方法。這一創新技術被命名為《Artificial intelligence model for composing audio scores》,它探討了如何根據輸入的內容來生成音樂。
專利文檔中詳細描述了技術的實現步驟:首先,系統會收集包含視頻和音頻的大量訓練數據;接著,通過分析這些數據集,提取出如顏色、形狀、運動及場景等不同類型的特征;最后,Copilot將尋找這些特征之間的關聯性,例如特定場景通常伴隨的音樂類型,從而生成與新的視頻或文本內容相匹配的音頻。
這項技術可廣泛應用于多個領域,如電影、電視節目的背景音樂自動生成,為商業廣告創作契合氛圍的音樂,游戲中動態配樂的制作,以及通過音頻增強虛擬現實中的沉浸式體驗等。在日常生活中,它也能為特定場合如求婚等自動匹配合適的音樂,增添氛圍。