大日本印刷與 NHK 合作開發情感表達字幕系統,透過 AI 分析自動幫字幕加上特效

2020.08.25 11:10AM
照片中提到了怖いけど面自いから一気に読んじゃった,包含了肩、NHK、NHK受信料、イラネッチケー、NHK ITEC Inc.

在綜藝節目為了強調臨場感,除了主持人與藝人的演出外,透過字幕特效加深印象也是慣用的方式,不過這些特效是需要經過人工方式處理,故對於後製人員也會造成負擔;而大日本印刷與 NHK Technologies 合作開發一套情表達字幕系統,透過 AI 進行人物的影像分析,自動為字幕加上合適的特效。

照片中提到了怖いけど面白から一気に読んじゃった、音声解析して言葉適したフォントで字幕を自動生成、怖いけど面白いから一気に読んじゃった,包含了美女、染髮、長發、紫色、頭髮

▲下圖為一般字幕,上面為透過 AI 加入效果的字幕(圖片來源:大日本印刷)

照片中提到了やばい、顔の表情を解析して感情に適したフォントを自動表示(同じセレリフでも感情の違いをフォントで表現)上:「不安」の感情、下:「楽しい」の感情,包含了微笑、NHK ITEC Inc.、NHK、臨場、字幕

▲藉由分析說話者的表情,可搭配合適的特效字體(圖片來源:大日本印刷)

情感表達字幕系統的開發經緯是考慮到聽力障礙與老年人觀看的節目,在缺乏聲音的情況下,傳統的標準字體有時無法難以分辨說話者,雖然特效字體有時會有難以閱讀的問題,但更容易搭配表情感受節目內容。

這套系統還在原型階段,其字體是應用大日本印刷在 2018 年的 DNP 情感表達字體,藉由 AI 對影像中人物的語氣以及表情進行分析,可自動辨識並自 DNP 情感表達字體挑出合宜的特效字體,除了強化戲劇效果,亦更容易對聽力不佳或是聽障人士傳達情感。

照片中提到了分類、感情 イメージ、例,包含了軟件、大日本印刷有限公司、NHK、字幕、NHK ITEC Inc.

▲搭配 12 種 DNP 情感表達字體呈現當下的氣氛(圖片來源:大日本印刷)

情感表達字幕系統能夠實現即時的影像與聲音分析,並即刻加上字幕,系統可從 12 種 DNP 情感表達字體挑選最適合呈現當下氣氛的字體,此外藉由影像分析,可把字幕安排在離說話者最接近的位置,使觀看者更容易把字幕與說話者連結。

未來除了持續強化情感表達字幕系統的 AI 辨識性能與提高即時辨識與字幕插入性能,最終目標是希望能把這套系統投入實際的 Live 節目與網路直播,同時希望未來能將這套系統導入大眾能夠使用的影像編輯軟體。

2 則回應

  • 在日本這種讀空氣的國家,到時候辨識錯誤開發者就要出來道歉了
    2020-09-17
  • 在日本這種讀空氣的國家,到時候辨識錯誤開發者就要出來道歉了
    2020-09-17