WWDC 2024:蘋果人工智慧就叫Apple Intelligence,以Private Cloud Compute模式確保隱私攜手OpenAI串接GPT-4o

2024.06.11 04:27AM

一如先前傳聞,蘋果在WWDC宣布蘋果全平台作業系統的人工智慧品牌Apple Intelligence,縮寫成AI,算是簡單暴力的命名方式;未來Apple Intelligence將作為蘋果所有與人工智慧有關的應用統稱,並於語言、圖像、操作與個人化內容四大領域呈現;Apple Intelligence將可在A17 Pro、M1、M2、M3與M4等Apple Silicon執行,並透過稱為Private Cloud Compute的主機與雲端的混合模式執行。

此外iOS 18、iPadOS 18與macOS 15預計在2024年末提供免費且免OpenAI帳號的ChatGPT-4o功能服務,Siri屆時亦可選擇連接到ChatGPT-4o。

▲Apple Inteligence將應用在語言、圖像、操作與個人化內容四大領域

▲Apple Intelligence將可在五款高階Apple Silicon執行

Apple Intelligence將自2024年夏季起提供開發者預覽,並在iOS 18、iPadOS18與macOS15正式推出後成為系統的一部分。

透過混合雲模式兼具算力與個人隱私

▲為了不涉及個人隱私與資料安全,Apple Intelligence是透過主機與雲端混合運算模式執行

▲混合運算的意義在於保護隱私資料的同時分散算力

Apple Inteligence的執行模式是透過稱為Private Cloud Compute的方式執行,此模式是考量到隱私與運算量的混合運算模式,蘋果強調透過Apple Silicon的安全區塊與本機機器學習執行具隱密性的內容,並將與隱私無關的資料透過雲端方式執行,能確保資料安全與AI的體驗。

透過大型語言模型理解語言與文字

▲透過大型語言模型,Apple Inteligence可理解自然方式的文字與語言

▲在郵件中可將內容改寫的更流暢,或是幫內容調整語氣

▲可以幫撰寫的內容產生摘要,也同樣可將一大串內容的郵件整理成摘要

▲在筆記與電話應用程式能夠將通話內容轉錄並產生摘要

▲包括郵件與通知都可透過語言理解顯示優先內容

Apple Intelligence透過結合大型語言模型,為使用者的各種文字應用提供增強,舉凡郵件、筆記、通知與第三方程式都可受益;透過稱為Rewrite的功能,Apple Intelligence可理解整串文字的內容後,依據使用者的需求,從將內容透過校正錯字、調整先後順序與語句變的容易閱讀,或是根據不同的目的以不同的語氣改寫,從與好友的幽默玩笑到求職信的正式內容都能夠進行改寫;此外針對長串的內容也具備摘要功能,包括幫自己撰寫的內容,或是對方寄來長串的電子郵件等,可透過整理成段落、重點、表格等方式幫助理解。

此外在電子郵件與通知也能透過理解文字進行優先權的排列,例如活動邀請、登機通知等訊息會優先於比較無關的內容之上;另外未來郵件內容的預覽方式也不再是出現前言而是內容的摘要,亦可幫助用戶釐清哪些內容是需要盡速處理,此外除了可將長文的信件進行摘要外,針對可快速回答的內容也會透過智慧回覆計算提供回應的建議。這部分的功能與Google在Gmail的服務相當類似。

透過生成式AI的Image Playground與Genmoji

▲Image Playground可透過生成式AI以描述產生個人化圖像

▲Image Playground可依據風格、物件與情境產生圖像

▲可發揮想像力描述產生適合不同情境的圖像

▲Image Wand是將Image Playground整合到Apple Pencil調色盤工具的功能

▲只要能使用Apple Pencil的地方即可透過Image Wand串接Image Playground

現在火紅的生成式AI應用之一就是圖像生成,蘋果的Apple Intelligence當然也不會錯過這個話題性應用;蘋果推出稱為Image Playground的功能,此項功能就如同當前的圖象式生成式AI一樣,可以根據敘述產生圖像,或以用戶裝置中的照片為藍本加上描述變成一張AI圖像,這些圖像不僅可應用在訊息,同時還可根據訊息中的對話內容在產生圖像時提供建議。此外蘋果也將提供Image Playground API供第三方串接,同時Notes、Keynote、Freeform、Pages等也同樣可串接到Image Playground,同時Image Playground也透過Image Wand整合到Apple Pencil調色盤工具,可將草稿透過生成式AI進行增強。

▲結合生成式AI與Emoji所以稱為Genmoji

▲Genmoji可將敘述產生原創的Emoji

▲Genmoji可產生五花八門的個性化Emoji

Genmoji簡言之就是生成式AI與Emoji的結合,透過描述方式產生全新的Emoji,如此一來能夠根據情境產生更符合情境的Emoji,可直接貼在訊息內,或是做為回覆他人對話的表情分享給他人。

蘋果版魔術橡皮擦稱為Clean Up,相簿結合AI聰明分類並使圖影能產生連結

▲Clean Up就是結合生成式AI的魔術橡皮擦

▲相簿可透過自然語言搜尋

▲影片也同樣可透過自然語言搜尋

▲透過AI分類使相簿內容可產生新的連結方式

▲Memorise是依據用戶描述找到關聯的照片與影片後添加音樂產生一段回顧短片

蘋果相簿的新功能也很類似於Google在Google Photos提供的AI增強功能,在圖像編修方面增添稱為Clean Up的魔術橡皮擦,特色也是抹除不必要的圖片元素並透過AI填補抹除的區塊;此外透過基於大型語言模型理解自然語言,使相簿的照片與圖片可透過描述進行搜尋,同時還可依照描述所找到的照片與圖片透過稱為Memories的功能產生加入音樂的精選影片。

Siri將獲得AI升級理解力與更具個人化、後續將可串接ChatGPT

▲Siri將以在邊框添加彩色光帶的方式呈現,不會占用畫面中心

▲Siri將藉Apple Intelligence理解自然語言與更為個人化

▲Siri將能混合語音與文字

▲蘋果將開放SiriKit供第三方串接

Siri在進入Apple Intelligence世代後也獲得昇華,不僅只是從現行會占用畫面的圖像改為邊框的彩色光帶,未來Siri不僅能理解更複雜的自然語言,且回答也會有更好的關聯性,同時也會依據用戶的習慣產生更個人化的互動方式;且Siri將不再僅限於語音,也能支援文字互動,蘋果的說法是用戶可在不同場合使用,不過筆者個人認為是蘋果不再把Siri視為「語音助理」,而是類似Google當前Gemini的角色,只是蘋果並未重新為服務命名,而Google即便推出Gemini後仍保留語音助理Google Assistant(Google助理)。此外,蘋果將釋出SiriKit工具供第三方應用程式串接到Siri。

▲Siri提供應用程式操作指南、感知螢幕內容並進行互動

▲現在動口就可完成圖像編修、生成式AI增強與發送圖片

新版的Siri具備螢幕內容感知功能,能夠幫助用戶回答裝置、應用程式的使用指南,或是在收到包含地址或郵件的訊息後建議把這些資訊加入聯絡人資訊,或是可以透過口述使Siri編修圖片、將圖片重新使用生成式AI增強最後發送給朋友;此外Siri也將變得更個人化,例如當朋友在訊息或信件中推薦餐廳,使用者不須從不同應用程式搜尋,Siri可幫助使用者從過往的資料找到對方推薦的餐廳。

先與OpenAI合作串接ChatGPT-4o,但允諾未來也會串接更多AI

▲一如預期OpenAI是蘋果Apple Intelligence合作夥伴,Siri將可串接ChatGPT-4o

▲基於個人隱私,若要串接到外部的ChatGPT服務會先詢問用戶是否允許

▲來自ChatGPT的功能都會看到ChatGPT的商標

先前就傳出蘋果將與OpenAI合作,將ChatGPT整合到iOS18、iPadOS 18與macOS 15並供用戶無須OpenAI帳號免費使用,此外蘋果預期將ChatGPT-4o先導入Siri,用戶可在Siri選擇是否把問題或文件提供給ChatGPT-4o;蘋果在作業系統的寫作工具也將透過ChatGPT增強內容寫作體驗,以及使用ChatGPT工具產生不同風格的圖像。另外除了免費版的ChatGPT-4o,若為ChatGPT訂閱用戶,還可使用進階付費功能。