Arm 推出 Project Trillium 的出發點:為使互連萬物都能獨立進行機器學習

2018.03.07 11:22AM
arm04_5.jpg

Arm 在今年二月份針對人工智慧與機器學習,宣布了名為 Project Trillium 的人工智慧解決方案,為端點人工智慧提供更完善的人工智慧技術,並使人工智慧深入各個端點;此方案包括軟體與硬體兩個層級,提供藉由 CPU + GPU + DSP 的現行異構解決方案,以及漸為潮流的專屬 AI 加速架構,讓客戶依照人工智慧運算需求選擇合宜的方案。

是Arm 推出 Project Trillium 的出發點:為使互連萬物都能獨立進行機器學習這篇文章的第1圖

為何讓終端裝置具備獨立的機器學習能力很重要,可從六大領域說起,包括頻寬、能源、成本、延遲、可靠性與安全性。當前許多的人工智慧應用是透過基於雲的方式進行,然而仰賴透過網路傳輸到伺服器端,對於如影像分析、安全、自動駕駛等需要大量影像傳輸的應用,就需要耗用大量的頻寬,同時許多應用需要超低延遲,透過雲的機器學習方式就不堪負荷。

其次由於所有的運算都位於雲端,當越來越多中端具備機器學習能力,也需要更大量的伺服器,這也造成能源浪費與建構成本的增加,另外當伺服器需要負擔大量的運算,加上傳輸過程中網路的不確定性,也會降低雲端模式的可靠性,最終許多的應用牽涉到個人隱私甚至重大安全性,雖然現在已經有大量的安全機制,仍不及在裝置端直接運算來的安全。

是Arm 推出 Project Trillium 的出發點:為使互連萬物都能獨立進行機器學習這篇文章的第2圖

那些應用需要在端點進行機器學習?在裝置逐步智慧化、連網化之後,幾乎所有的設備都會應用到機器學習,同時也受機器學習帶來更高的價值,舉凡在手機上拍照的影像處理與使用行為分析,智慧健身的互動語音助理,監控系統的人物辨識,語音助理的自然語意互動,到自動駕駛的邏輯與機器視覺處理,都因能在端點進行機器學習得以實現。

Arm 持續以來都在為機器學習提供良好的基礎,在高性能運算領域, Cortex-A 系列早已提供高效率、高性能的運算能力,而 ARM 也為嵌入式處理器 Cortex-M 系列導入如 CMSIS-NN 這樣能用於機器學習的技術,至於 Mali-GPU 也支援機器學習應用。

不過為了使機器學習更具效率, Arm 也持續提供更具效率的 IP ,包括針對機器學習的專屬加速器架構,另外也將針對機器視覺領域提供物體辨識的專屬 IP 架構,同時讓這些新 IP 架構能與既有的 CPU 與 GPU IP 進行異構運算;另外 Arm 也持續與合作夥伴合作,讓在 DSP 與 FPGA 方面擁有獨一無二的技術的夥伴也能將其核心技術與 Arm 的 IP 進行異構的機器學習。

是Arm 推出 Project Trillium 的出發點:為使互連萬物都能獨立進行機器學習這篇文章的第3圖

Arm 提供多元且可擴充性的機器學習解決方案,也是為了滿足不同領域對於機器學習運算力所需的規劃,使合作夥伴能依照從物聯網、智慧終端、自動駕駛到伺服器,提供從 2GDPs 到 140TOPs 層級的運算性能,使各類應用都能獲得合理、高能源效率的解決方案。

Arm 也提到,為了使機器學習更具效率,當初在規劃 Project Trillium 的軟硬體時,就在雙方面有最基本的要求,其一是機器學習( ML )加速器與物件偵測( Object Dectection )加速器除了節能以外,要能夠大幅超越現行 CPU + GPU 的運算能力,但同時又要能與 CPU 、 GPU 與 DSP 等現行架構進行異構,同時在機器學習框架 ARM-NN 也要透過開源方式,讓開發者、合作夥伴共容易利用。