科技應用 Google 語音內容 AudioPaLM 跨語言溝通 Google 發表語音理解與生成模型 AudioPaLM Google的研究團隊開發了一種名為AudioPaLM的大型自然語言模型,可以聆聽並理解語音內容,並自動生成口說內容,該模型還可以進行多語言翻譯,增進跨語言溝通便利性。 Google研究團隊近期提出一項名為AudioPaLM的大型自然語言模型,將能實現語音內容聆聽理解,並且自動生成口說內容。 AudioPaLM的背後是由PaLM 2與AudioLM兩種模型組合,並且對應多模運作框架,使其能聆聽、理解語言內容,並且藉由自動生成式人工智慧產生口說內容。 除了識別語音內容,並且進行自然互動之外,AudioPaLM更可對應多種語言翻譯功能,因此預期未來將能直接聆聽特定口語內容,隨即轉換成另一種語言呈現 Mash Yang 1 年前