Google 稍早在東京舉辦了 Made with AI 的活動,台灣 Google 也以零時差直播由 Jeff Dean 所進行的主題演說, Jeff Dean 在一開場就表示, AI 與機器學習已經遍及 Google 的各個應用,而藉由 AI 與機器學習, Google 有三大目標: 1 、 產品更好用, 2 、協助企業與開發商解決問題與創新, 3 、研究人員獲得更好的工具面對人類挑戰。
基於深度學習的人工智慧黃金世代
Jeff Dean 接下來也簡單解釋了 AI 是甚麼、為什麼現在 AI 變得重要; AI 的概念出現至今已經有 50 年,不過早期的 AI 是以人工建立規則進行,然而相當仰賴輸入大量的規則與運算力,然而近年在硬體系統提升後,基於神經網路的機器學習被發揚光大,透過模擬人類大腦的學習方式使機器自己撰寫程式並持續進化。
使機器學習能得以被應用的關鍵是類神經網路能夠被實用化,雖然類神經網路也已經有 30 年的歷史,然其多層解析的模式,在過去缺乏平行、異質運算以及運算力不足的情況下,類神經網路難以導入正式的應用,僅能做些樂趣示範,但在近年硬體架構性能提升,才使得這項以模擬人類神經元的學習與思考模式的概念得以實用,同時作為新一代 AI 的根基。
目前深度學習也在多個領域被廣泛使用,而其基礎建立在影、音與文字的分析,從影像中的物件分析,聲音轉化為文字,文字辨識與翻譯,到為一張照片下符合敘述的標籤;同時 Google 也已經將把深度學習應用在旗下七大產品中。其中作為當前深度學習基礎關鍵的,就是在 2015 年開始導入的 TensorFlow ,藉由在 GitHub 開源,目前也是全球最多人使用的深度學習語法。
深植於 Google 服務當中的人工智慧
目前 Google 在旗下產品如何應用 AI 呢?例如在 Google Photo ,藉由上傳照片後進行分析並自動建立 Tag ; Translate ,除了文字翻譯外,還可藉由圖像與語音輸入並進行翻譯: Maps ,在部分無法取得官方地址資訊的地方,利用分析圖資影像訊息建立地址資訊,同時還可藉學習方式分析停車位狀況,以及提供附近可能有車位的停車場: Allo ,藉由 AI 分析人像照片的五官,進行趣味自拍貼圖。
Google Lens ,利用類似 Maps 與 Translate 的技術,分析照片中的景物並提供資訊: Music ,藉人工智慧推薦合適的音樂與影片; Mail ,利用文字語意的解析進行垃圾信分類; YouTube ,藉聲音判斷進行自動字幕;翻譯,在去年導入新系統,對語意分析更強,並簡化程式碼,同時去年秋天加入神經網路架構提升翻譯力; Google Assistant ,則是集大成的服務,同時藉由軟硬體整合, 在今年打造翻譯耳機。
藉由軟體與硬體使手機相機革新
接下來也由 Google 幾項服務的產品經理各自介紹其負責的服務;首先是負責 Google Pixel 2 相機的 Issac Reynolds 介紹 AI 與拍照的結合, Pixel 2 所搭載的雙像素元件可呈現類似人眼的立體影像,同時藉由影像分析的方式,能夠輕鬆拍出凸顯主題的影像,並以情境分析進行潤飾。
自然語言與語意分析的挑戰
接著負責 Translate 的 Linne Ha 談到理解與處理自然語言的重要,由於目前網路仍以英文為大宗,翻譯與語言分析的基礎是建立在數據的豐富程度,但像是全球擁有第四大使用人數的印度文卻在網路語言使用還無法排到前 30 ,故需要利用更多的手段蒐集語言資料。
而建立語言翻譯與自然語意分析,要從幾個領域著手,包括建立標準化的 Unicode 統一的字型如 Noto Fonts ,以及易於產生文字的鍵盤, Google 也利用機器學習建立特殊語言的鍵盤,更有助於蒐集少數語言,同時也導入手寫輸入辨識,但這些還不夠,以便利性與針對部分不認識文字的使用者,語音辨識與翻譯也相當重要,不過語音又比文字更複雜,畢竟還牽涉到口音、方言等問題。 Google 也透過各種手段蒐集各國的語音建立資料庫,並透過機器學習的方式建立少數語言、方言甚至混合語言的語音辨識資料庫。
集 Google 大成的 Assistant
接著則是由 Pravir Gupta 介紹其負責的 Google Assistant ,簡單的說 Google Assistant 是集 Google 技術與服務大成,以辨識自然語意的方式與使用者進行互動,從而提供生活資訊到提供家電的互動,今後也會持續提供更多國家的語言支援。
在雲服務導入 AI 讓企業更易使用
接下來則是由 Kaz Sato 探討透過 Google Cloud 雲服務為企業提供 AI 與機器學習,目前 Google 的服務基礎皆是建立在雲平台,而 Google 為了提供企業用戶更容易應用 AI ,也提供包括 TensorFlow 開源機器學習語言、 TPU 加速器以及包括影像辨識、影片辨識、聲音辨識與自然語言辨識的 API 給予客戶。
Google 也找來日本老字號的食品廠 KEWPIE 介紹他們導入 Google 雲平台 AI 的應用, KEWPIE 希望藉由導入 AI 技術,使人力可更集中在創新,他們目前也著手導入機器視覺,透過影像分析的方式進行嬰兒食品原料的品管,他們坦承目前還未知 AI 能帶來的助益有多大,但絕對值得一試。
AI 協助環保、醫療保健與生態保育
緊接著是由先前與台灣媒體分享過 Google 如何應用深度學習幫助糖尿病引發的眼球病變的彭浩怡,介紹機器學習可用在那些能造福人類的領域,包括透過影像分析解析照片進行海牛的保育,透過能源使用分析進行正確的散熱管理、降低資料中心的能耗,還有利用深度學習幫助糖尿病眼球病變與癌症判斷。此外也由紐西蘭大學的 Victor Anton 介紹如何透過攜手 NEC 以 TensorFlow 的方式辨識鳥鳴,藉此進行特有種鳥類的保育。
提供更公平、更友善的 AI 應用機會與學習管道
在議程的最後, Jeff Dean 表示, Google 希望能夠讓機器學習更為普及,做出許多努力,除了提供開源的 TensorFlow ,也積極地訓練內部人員,目前 Google 內部有多達 18,000 名具機器學習技術的工程人員,並在美國與大專院校開課教授,並預計明年會透過線上課程的方式,讓有志從事機器學習的人可獲得資訊。
此外 Google 也秉持著公平的方式進行相關的研究與合作,其一是 Google 內部的計畫,稱為 People + AI Research Initiave = PAIR ,是研究人機互動的團隊,包括三大使用者方向,包括專業 AI 工程人員,針對主題領域專家,針對所有人三種目標對象,提供專業資訊、便利的工具與簡單能容易被活用的資源,由開放研究成果與開放程式碼方式使所有人都能利用機器學習。
另一個合作就是 Genna Davis 合作,進行媒體性別研究室的分析,藉由影像分析的方式,針對當年度的熱門電影進行角色性別的辨識,同時倡導男女平等,並指出女性擔任主角的電影可比起男性擔當主角的電影有更高的平均獲利,藉此倡導媒體的男女平等。