您當前的位置:首頁生活正文

喜馬拉雅AIGC開啟全新內容生產模式 全面賦能音頻內容創作

2022-03-08 09:20:32

年來, AIGC(AI-Generated Content,AI生成虛擬內容)橫空出世。技術發展也改變著音頻領域的

內容思維,以TTS技術(Text-to-speech,語音合成)為代表的AIGC新技術產品正在一步步走向成熟,以喜馬拉雅為代表的一批音頻臺已在該領域潛心鉆研多年,助推AIGC從實驗室邁向AI合成音、AI演播、智能新聞播報等更多應用場景,進一步釋放內容創作的無限潛力。

技術革新撬動內容生產升級

隨著音質傳輸的升級、智能交互的深化、終端場景的拓寬,在線音頻內容消費時長伴隨著技術升級正在加速駛入發展快車道。根據易觀分析數據顯示,2021年中國“耳朵經濟”市場的活躍用戶規模已達到8億人次,其中在線音頻細分市場的月活躍人數穩定在3億人次,且呈現出穩步上漲的態勢。

消費需求的增加亟需擴大內容生產規模,提高內容生產質量和效率一直是行業發展的重要問題。上個時代,軟硬件的技術發展推動了UGC成為了內容生產的重要模式。今年將迎來十周年的喜馬拉雅是這個時代跑出來的“內容生態前行者”,其擁有的完善的UGC內容創作者生態,通過給用戶更便捷的音頻創作工具及拓展更多音頻品類(如播客)來激勵普通用戶參與創作、分享音頻,從而增加臺上長尾內容。

UGC模式在技術助力下拓寬對于“內容生產者”的界定,通過抹內容生產和消費的嚴格劃分、釋放內容生產力。但這種技術的應用歸根到底是基于對于人的使用,當內容生產者和消費者的生產潛力都被消耗殆盡,內容消費需求的缺口又能由什么來填補?

答案就是AI。人工智能未來將催生新的內容生產形式,當生產不局限于人的時候,生產力也將迎來空前解放。

喜馬拉雅CTO姜杰表示,我們在技術的創新和應用中很重視觀察人和AI交互協同能產生什么全新的價值增量。音頻內容呈現更智能化的趨勢背后,將是AIGC對于喜馬拉雅原有的UGC+PGC+PUGC的音頻生態的進一步豐富。

l 以AIGC延展PGC,AI合成音精準還原單田芳先生“云遮月”嗓音

相比于機器人來說,人最大的差別就在于個體化之間的不可復制,杰出的音頻內容生產方被消費者選擇也恰恰是因為他的獨特。例如我國著名評書藝術表演大師單田芳先生,善以聲音塑造角色,其標志的“云遮月”嗓音成為了獨一無二的內容符號,在民間有著“凡有井水處,皆聽單田芳”的說法。

如果能將單田芳先生的聲音解碼,再進行重新編碼,就能突破內容創作的局限,實現原音重現,讓人們享受到更多單田芳先生的優秀作品,喜馬拉雅已在2021年實現了這一點。喜馬拉雅智能語音實驗室利用TTS技術,并自主設計了單獨的韻律提取模塊,并將其融入到 HiTTS 技術框架中,讓單老的AI合成音仿佛本尊再現。

目前,喜馬拉雅上已有80多部運用還原自單田芳先生聲音的AI合成音制作的專輯,這些專輯在喜馬拉雅也一直深受用戶喜愛,多張評書專輯長期位列喜馬相聲評書熱播榜前列,例如《臥虎藏龍》《蜀山劍俠傳》等。

不僅如此,喜馬拉雅被ICASSP 2022收錄的自研跨語言語音合成技術,甚至在未來可以讓我們聽到單田芳先生的“聲音”來播講英文內容。也許在不久的將來,“單田芳英文聲音重現”將與此前官方授權的“單田芳評書” 和“單田芳聲音重現”共同構成全新的“單田芳IP”矩陣。

AIGC正在成為人類PGC的延伸,以立體、真實的方式突破助力PGC突破空間、時間的局限,使PGC內容體系化得到了一次質變的提升發展。

l 以AIGC創造PUGC,“AI續寫+AI主播”閉環生產展現廣闊前景

隨著技術的發展,AI不僅是一種技術載體,也逐漸成為了一種人格象征。喜馬拉雅基于自研的TTS框架,并采集頭部主播“喜道公子”的真聲打造了AI主播“喜小道”,而基于大規模語言模型自研的自然語言處理模型的續寫應用“彩云小夢”已經可以實現小說故事的AI創作,只需要給她一個1-1000字的開頭,它就能為你續寫出后面的故事。

借助自己AI智能技術有聲化的優勢,喜馬拉雅的AI主播“喜小道”與彩云小夢續寫AI合作,打造了首個從故事創作到演播均由AI完成的AI電臺。據了解,彩云小夢入駐為喜馬拉雅旗下網文創作臺奇跡文學的寫手,將其作品經AI主播“喜小道”有聲化后,發布在喜馬拉雅臺。

“AI續寫+AI主播”的方式證明了AIGC已經擁有了自己形成完整生產閉環的能力,更誕生了一種全新的以“AIGC”功能為基礎的“PUGC”,展現了AIGC及AI技術賦能創作廣闊前景。

l 當AIGC遇上UGC,想象力與算力碰撞后的指數增長

目前,AIGC由于技術成本和規格限制,更多集中在對于PGC和PUGC的加持上,未來如果AIGC成為每個UGC手中的工具時,AIGC強大的算力思維和UGC的蓬勃的內容創作活力將在提升創作效率的同時,進一步豐富內容的多樣。

相關行業專家表示,在無監督學、深度強化學、遷移學、生成對抗網絡等算法深入研究的基礎上,AI的算力將越發強大,其背后自運算與強適應的特征能夠完美匹配每一個內容生產者,指數級釋放UGC內容創作的活力,帶來多樣且生動的內容創作光譜,有著非常大的想象空間。

當每一個人都擁有一個可以幫你定制化解決問題的“大白”,每一個內容創作者都將可以擁有一座自己的“喜馬拉雅”。

AIGC不僅代表了一種技術價值的想象,其背后更是商業價值的全新拐點。報告顯示,超過七成受訪用戶對AI技術在在線音頻領域的發展前景看好。艾媒咨詢分析師認為,隨著AI智能產品的普及以及用戶需求持續攀升,在線音頻行業的創新內容仍具有較大的潛力和發展空間。喜馬拉雅等頭部企業如何進一步利用AIGC的“智能大腦”助力內容創作,值得期待。

關鍵詞: 喜馬拉雅 AIGC 開啟

“如果發現本網站發布的資訊影響到您的版權,可以聯系本站!同時歡迎來本站投稿!

虛擬

未來