民視 AI 主播敏熙幕後推手揭曉,由微軟與光禾感知結合 AIGC 與 Azure AI 語音服務共同打造

2023.10.16 12:23PM

民視在 2023 年 6 月底於國際氣象導入 AI 新聞主播「敏熙」,強調是全台首家導入 AI 生成的虛擬電視新聞主播,敏熙目前主要在民視無線台晚間「全球看民視」,以及民視新聞台晚間 6 點 12 分左右與午夜新聞播報國際氣象;敏熙幕後推手是由專注於 AI 與雲服務的微軟與專攻影像技術的光禾感知聯手打造,藉由光禾感知的 AIGC (人工智慧生成內容技術)與微軟 Azure AI 語音服務。敏熙後續也將陸續擴大在各時段節目或重點新聞預告播放。

微軟、光禾感知與民視三方合作結合影像、聲音與新聞製播的專業技術,透過光禾感知生成 AI 虛擬主播的影像,輔以微軟 Azure AI 語音合成產生發音自然、流暢的播報人聲,在由民視新聞多年的新聞製播經驗結合,以豐富的新聞播報、訪談節目等高畫質新聞影像資料庫進行人物形象最佳化,建構屬於民視的 AI 主播模型。

▲敏熙在 2023 年 6 月底投入氣象新聞播報,未來也將擴大到更多時段

光禾感知自 2022 年底投入 AI 主播製作,借助大量照片作為訓練素材,並以 Diffusion Model 擴散模型作為基礎,產生能生成動態圖像的模型;而微軟的 Azure AI 語音服務結合 TTS 文字轉語音與 Viseme 技術,使敏熙能夠呈現自然且順暢的人聲,背後的關鍵來自 Azure AI 達 140 種語系、超過 400 個近似真人發音的預建神經語音模型,同時亦支援包括語音方格、速度與語調的自訂參數,使敏熙能夠發出貼近真人主播的情緒與抑揚頓挫的語音。

同時透過微軟的 Viseme 技術,還能提升虛擬主播嘴型與播報文字的精準度,使說話過程自定義臉部、嘴唇、下顎與舌頭的位置,使光禾感知的虛擬主播的臉部、嘴形能更自然與語音相互結合,同時透過 Azure AI 的多國語音,敏熙可綜合播報中文與英文內容。

雖然民視借助敏熙擴大新聞媒體的多樣性,不過民視仍堅守新聞的真實性與正確性,是在充分評估相關風險與遵守相關法規與新聞倫理的前提導入,此外也禁止採用 AI 生成的新聞內容,確保 AI 虛擬主播的播出內容由編輯撰寫並依循既有的審核流程。