零代碼將AI應用遷移到生產環境!解讀英特爾的AI軟件布局

2022年10月22日00:33:30 熱門 1209


零代碼將AI應用遷移到生產環境!解讀英特爾的AI軟件布局 - 天天要聞

芯東西(ID:aichip001)文 | 心緣

芯東西4月21日消息,在單機環境中,構建人工智能(AI)模型對數據科學家來說不算難事,但如何很方便地將整個分布式架構構建起來、將AI模型應用到生產數據中,卻令許多數據科學家感到頭疼。

把應用從筆記本電腦搬到生產環境的過程相當漫長。在筆記本電腦上用樣本數據構造出原型後,需在集群上利用歷史數據去運行模型試驗,然後再在生產環境中將這個算法部署上線。

在此過程中,很多時候數據科學家不得不重寫代碼、進行模型轉換、數據傳輸與拷貝等工作,工作量非常大。

那麼能不能構建一個端到端的流水線,幾乎無需修改任何代碼,就可以無縫、自動化地將AI應用從筆記本電腦搬到分布式環境中呢?

這是英特爾大數據分析和人工智能創新院正着力實現的願景。自去年6月在中國成立以來,該創新院一直致力於通過優化的庫、軟件與工具組合,真正提高數據分析和AI落地在實際生產環境中的效率。

近日,通過對話英特爾大數據技術全球CTO、大數據分析和人工智能創新院院長戴金權,我們試圖看清英特爾在人工智能軟件布局上,究竟在下怎樣一盤棋?

零代碼將AI應用遷移到生產環境!解讀英特爾的AI軟件布局 - 天天要聞

▲英特爾大數據技術全球CTO、大數據分析和人工智能創新院院長戴金權

一、創新院應用研究的“三駕馬車”

英特爾希望構建一個統一大數據分析和AI的端到端流水線,可以直接訪問生產數據,當用戶需要將AI應用從筆記本電腦遷移到大型集群進行分布式訓練或推理時,幾乎不需要修改任何代碼。

為了實現這一願景,英特爾大數據分析與人工智能創新院的方法是應用研究,具體而言有“三駕馬車”:前沿技術研究、開源軟件平台、實際應用落地

零代碼將AI應用遷移到生產環境!解讀英特爾的AI軟件布局 - 天天要聞

前沿技術研究可分為兩個階段,早期研究如何在大數據平台上高效構建深度學習應用,下一步研究則側重於在大數據環境下更好地將AI進行自動化和無縫擴展。

據戴金權透露,在今年6月的CVPR學術會議上,英特爾大數據分析和人工智能創新院將對其最新工作進行一個階段性報告,主要工作即是如何在分布式大數據環境中,將機器學習工作流自動化地構建出來。

開源軟件平台包括基於Apache Spark的分布式高性能深度學習框架BigDL和統一的大數據分析+人工智能平台Analytics Zoo。

BigDL與TensorFlow、Caffe等框架的功能類似,能在現有的Hadoop和Spark集群上構建各種數據分析和深度學習應用。Analytics Zoo則被定位為一個框架之上的軟件平台,主要特點是支持各種不同的深度學習框架和大數據框架、庫和工具。

這些平台在利用硬件計算能力的同時,也通過構建開源生態系統能實現更加自動化、無縫的感知,更好地幫助用戶解決問題。

很多英特爾的用戶、客戶和合作夥伴已採用此類開源軟件平台,戴金權舉了一些最新的國內外實際應用落地案例。

在國內,Analytics Zoo已集成於阿里雲E-MapReduce服務上,該服務可直接運行深度學習應用。在去年的阿里雲天池大賽上,英特爾還曾利用Flink加上Analytics Zoo來提供實時的垃圾分類檢測的工作。

Analytics Zoo也集成在騰訊雲智能鈦機器學習TI-ONE平台當中,提供各種基於大數據的深度學習的數據處理和分析。

東軟將基於AutoML時間序列分析的功能集成在其應用性能管理產品RealSight APM中,為他們的用戶提供應用性能的管理和分析。

金風慧能基於Analytics Zoo構建AI應用,將部分地區功率預測準確率從60%提升到80%以上,從而達到節能的效果。

在國外,Analytics Zoo已集成於美國IBM Cloud Pak for Data中,美國萬事達(Mastercard)基於Analytics Zoo和BigDL構建了深度學習推薦服務,歐洲原子研究機構CERN基於Analytics Zoo 和 BigDL 構建了大型強子對撞機的實時事件過濾器;韓國最大的電信公司SK Telecom基於Analytics Zoo構建了智能通訊網絡管理。

二、Analytics Zoo的三層功能

Analytics Zoo構建在英特爾oneAPI底層的軟件層上,以此為基礎提供三層功能。

零代碼將AI應用遷移到生產環境!解讀英特爾的AI軟件布局 - 天天要聞

第一層是統一的數據分析和AI流水線,可提供相對水平的流水線,幫用戶將AI、深度學習可以擴展到大規模分布式的大數據環境當中。

在這一層中,Analytics Zoo將TensorFlow、Keras、PyTorch、BigDL、Spark、Flink等框架有機整合在一起,當用戶想針對其應用需求採用適合的處理方式時,能更加靈活地構建端到端的工作流。

例如SK Telecom、Mastercard等使用Analytics Zoo在Spark上運行大規模分布式TensorFlow來處理他們的數據。

第二層是一個自動化的機器學習工作流,能夠通過AutoML等自動化方法幫助用戶構建下層的流水線。東軟、騰訊雲等客戶均與英特爾合作使用這樣的功能。

最上層針對不同應用場景,提供相應的模型和算法,用戶也可以在Analytics Zoo平台上使用任何標準的深度學習框架,包括TensorFlow、PyTorch等。

三、從整體軟件布局看英特爾的AI底氣

在人們的印象中,英特爾是一家硬件技術實力雄厚的芯片公司,但它在人工智能軟件領域的嚴密布局同樣不容小覷。

零代碼將AI應用遷移到生產環境!解讀英特爾的AI軟件布局 - 天天要聞

第一,從研究角度來看,國內外的英特爾研究院進行均做了很多相對中長期的AI算法等研究。例如英特爾中國研究院在計算機視覺領域開展了許多前沿研究。戴金權介紹說,英特爾在AI算法研究方面有非常大的投入。

第二,除了研究之外,英特爾很多工作針對中期到近期的軟件棧,包括將AI軟件棧很好運行在CPU、GPU、FPGA、ASIC等不同硬件架構上的統一編程模型oneAPI、各種針對深度學習的計算庫、對TensorFlow、PyTorch、MXNet等開源框架的各種優化以及OpenVINO等推理引擎方面的工作。

戴金權告訴芯東西,為了讓用戶通過oneAPI能將模型無縫運行在不同架構平台上,英特爾在工具、編譯器、庫等層面都做了非常多的工作,“我們在性能上我們還是很有信心的,能夠做到在不同的架構上做到最優或者是比較好的性能提升。”

第三,在此基礎之上,英特爾試圖為用戶構建一個方便高效的端到端平台,能夠擴展到大數據、大規模集群上,並且可以非常透明的擴展到不同硬件架構上,將特徵工程、超參數調整、模型選擇和分布式推理等許多原來需要人工完成的工作,通過機器學習的方式將其自動化,從而大幅提升生產效率和模型準確率,更好提升應用級別的服務。

接下來,英特爾將繼續探索基於一些較重要的應用場景,構建更貼近用戶最終應用的解決方案。

結語:軟硬件協同加速AI高效落地

“在我們看來,軟硬件協同才可以真正能夠將硬件或芯片的計算能力發揮到極致。”戴金權說。

很多用戶面臨的核心問題,不是跑什麼硬件、用什麼深度學習框架,而更多是應用層面的問題。

英特爾以底層的硬件創新為基石,經過基礎軟件和平台軟件的中間層次,最後在應用軟件層次幫助企業用戶解決核心問題。

如今越來越多企業正將大數據分析和AI應用於生產、運營等多個環節,而像英特爾這樣軟硬件協同創新的解決方案,不僅有助於降低企業數字化轉型的門檻,也為提升AI應用落地效率按下了加速鍵。

熱門分類資訊推薦

曾小賢的上司Lisa榕,現實中不僅才貌雙全,還嫁給了CEO - 天天要聞

曾小賢的上司Lisa榕,現實中不僅才貌雙全,還嫁給了CEO

曾小賢的上司Lisa榕,現實中不僅才貌雙全,還嫁給了CEO雖然說《愛情公寓》這部劇在劇情上充滿了爭議,但是一定程度上,這部劇也是很多人的回憶,是伴隨了一代人的青春回憶,而且劇中的很多角色都成為了經典,他們的口頭禪也一直被拿來玩兒梗。
Lisa榕做主持多年沒紅,被陳赫拉進愛情公寓爆紅,如今怎樣了 - 天天要聞

Lisa榕做主持多年沒紅,被陳赫拉進愛情公寓爆紅,如今怎樣了

談到《愛情公寓》這部火爆一時的歡樂喜劇,大家肯定都不陌生。不知道大家是否還記得《愛情公寓》中那個把曾小賢治得服服帖帖的女上司Lisa榕,現實中的她名叫榕榕,和劇中的形象也判若兩人。1981年出生在遼寧瀋陽的榕榕,畢業於上海戲劇學院,後來成為了上海東方傳媒集團有限公司的一名主持人。