從基礎設施到場景應用,生成式AI的行業落地之路

2023年07月16日19:34:03 科技 1494

在過去的半年裡,生成式AI得以大爆發。據了解,目前國內已經和將要發布的大模型超過100個。

更進一步,現在有更多的行業用戶在思考該如何將生成式AI落地應用。這其中,既需要適當的方法論支持,也需要配套的數據戰略,當然還離不開相應的算力提供。

在近日舉行的2023亞馬遜雲科技中國峰會上,亞馬遜雲科技大中華區產品部總經理陳曉建和亞馬遜雲科技全球產品副總裁Matt Wood分享了他們的觀點。在這裡,我們從方法論入手,來看看生成式AI應該如何在行業當中落地。

從基礎設施到場景應用,生成式AI的行業落地之路 - 天天要聞


確立自己的方法論

與企業開展其他戰略性舉措一樣,在進入生成式AI領域之前,首先要確立自己的方法論。Matt Wood站在亞馬遜雲科技的角度,提出了一套開啟生成式AI旅程的方法論建議。

這個方法論分為五步,分別是:基於自己現有的數據戰略去做構建;在組織內實現更廣泛、更安全的生成式AI實驗;為需求場景定製化模型;攜手亞馬遜雲科技,探索無限可能;選擇場景,即刻啟程,構建未來。

從中可以看出,他的建議是企業從已有數據入手,這是生成式AI的基礎,沒有相應的數據就無法構建自己的大模型;最後則要落實到場景化應用當中去,為企業創造業務價值。

對於如何解鎖生成式AI的價值,Matt Wood也提了四條建議。他表示:企業應該利用已有的一流基礎模型,構建出色的生成式 AI 應用程序;提供安全私密的環境,使用私有數據來定製化這些模型;利用低成本、低延遲的定製晶元,藉助專門構建的機器學習基礎設施;藉助專業代碼生成工具,消除繁重工作並提高效率。

在上述幾個方面,亞馬遜雲科技能夠為企業提供相應的支持。比如利用基礎模型應用構建工具Amazon Bedrock,企業可以方便地調用多種基礎模型,包括AI21 Labs、Anthropic、Stability AI和亞馬遜雲科技自己的Titan,並在此基礎上進行調優訓練。Amazon SageMaker則是一個機器學習開發平台,幫助企業開發自己的AI模型。對於訓練和推理,則提供Inferentia和Trainium晶元,以及相應的實例Trn1n和Inf2。Amazon CodeWhisperer則是一個AI編程助手,為開發者實時生成代碼建議。

從基礎設施到場景應用,生成式AI的行業落地之路 - 天天要聞

貫徹雲原生的數據戰略

數據是生成式AI的起點,數據也將推動生成式AI的廣泛應用,對於所有的組織企業來說都十分重要。

Matt Wood認為,雲原生數據戰略有三大核心特徵:全面——提供適合任何用例的工具集,集成——輕鬆連接所有數據,受治理——構建端到端的數據治理為幫助企業貫徹雲原生數據戰略,亞馬遜雲科技分別提供了相應的服務和支持。

在工具集方面,亞馬遜雲科技推出15種專門構建的雲上託管資料庫服務,為各類用戶的應用場景提供完美契合的數據服務;數據分析服務已實現Serverless化,包括互動式查詢服務Amazon Athena、大數據處理服務Amazon Managed Streaming for Apache Kafka (Amazon MSK)、實時分析服務Amazon Kinesis、數據倉庫服務Amazon Redshift、數據集成服務Amazon Glue、商業智能服務Amazon QuickSight以及運營分析服務Amazon OpenSearch Service。

在數據連接方面,亞馬遜雲科技提出了Zero-ETL的願景,致力於實現無縫的數據轉換和調用,而用戶不用編寫任何的代碼。Amazon Aurora則可以與Amazon Redshift進行Zero-ETL集成,允許使用 Amazon Redshift 對來自Aurora的PB級事務數據進行近實時分析和機器學習,而不必構建和維護複雜的數據管道來執行提取、轉換和載入 (ETL) 操作。

在數據治理方面,亞馬遜雲科技去年推出的數據管理服務Amazon DataZone,讓客戶可以更快、更輕鬆地對存儲在亞馬遜雲科技、客戶本地和第三方來源的數據進行編目、發現、共享和治理。藉助Amazon DataZone,管理員和數據資產管理者可以使用精細的控制工具管理和治理數據訪問許可權,確保數據訪問發生在正確的許可權和正確的情境之下。

從基礎設施到場景應用,生成式AI的行業落地之路 - 天天要聞

找到高性價比的算力資源

AI創新風潮帶來了算力資源需求爆發,高性價比的算力資源尤其短缺。

不同於互聯網巨頭,企業對於算力成本更為敏感。尤其是隨著大模型的應用,未來生成式AI的算力需求主要集中在推理上。企業需要找到運維簡單、性價比高、無處不在、安全合規的算力資源。

陳曉建介紹說,面對算力需求的井噴,亞馬遜雲科技通過自研晶元創新、彈性的計算存儲組合以及Serverless架構等,來滿足客戶對於多樣算力的需求。

針對算力緊缺需求,亞馬遜雲科技採用多種晶元來提供全面深入的基礎設施能力,包括IntelAMD英偉達,和自研的CPU及加速晶元產品。其中自研產品包括基礎架構晶元Nitro、Arm架構通用處理器Graviton3、機器學習訓練晶元Trainium、機器學習推理晶元Inferentia等。

針對彈性計算資源需求,亞馬遜雲科技提供600多種不同的計算實例,從處理器、網路和存儲等各種服務,都能夠與計算進行很好的結合,以積木的方式搭建出豐富靈活的計算實例的資源,滿足多種不同算力的要求。比如提供了多達八種的存儲層級,無論是冷熱溫凍數據都可以找到合適的存儲層級。

針對簡化算力應用需求,亞馬遜雲科技推動雲服務全面邁向Serverless,將雲的彈性、敏捷性、按需付費的特性發揮到極致。隨著雲服務全面Serverless時代的開啟,用戶無需預置或管理基礎設施,就可以運行幾乎任何類型的應用程序或後端服務代碼,最大限度減輕運維工作,並增加業務敏捷性,更好地應對業務的各種不確定性。

針對無處不在的算力需求,亞馬遜雲科技可以將雲服務交付到客戶需要的任何地方,從全球數據中心,到中心城市、5G網路,再到本地數據中心、邊緣和物聯網,甚至是弱網環境。同時,其遍布全球31個區域的99個可用區,可以覆蓋245個國家和地區,能夠為出海中國企業提供全球化的算力支持。

針對安全合規的需求,亞馬遜雲科技具有支持全球各個國家和地區業務合規能力,幾乎能夠滿足全球所有監管機構的合規性要求。其支持143項安全標準與合規認證,有超過300種安全合規服務,能夠幫助客戶方便地搭建滿足全球各地安全和合規要求的算力架構。

如今,生成式AI正在成為企業新一輪業務創新的重要工具,成為下一代的生產力工具。

陳曉建表示,現今創新至關重要,而雲技術能更快、更高效地幫助企業創新,亞馬遜雲科技廣泛和深入的服務可以讓客戶擺脫基礎架構的束縛,專註於創新。

科技分類資訊推薦

長安與東風重組新進展:朱華榮稱不會改變長安既定戰略 - 天天要聞

長安與東風重組新進展:朱華榮稱不會改變長安既定戰略

2月9日,長安汽車和東風集團股份(00489.HK)同步發布了控股股東「正在與其他國資央企集團籌劃重組事項」的信息。長安汽車的控股股東是兵裝集團,而東風集團股份的控股股東是東風公司。隨即,長安汽車和東風集團這兩家汽車央企將合併重組,成為業內關注的焦點。
公安部出手了!年齡限制放寬10年、送考下鄉,2025年考駕照不難了 - 天天要聞

公安部出手了!年齡限制放寬10年、送考下鄉,2025年考駕照不難了

電動車加強管理以後,要求機動車類型的車輛需要持證上路,但是老年人考駕照卻受阻,一方面有年齡的限制,另一方面偏遠山區考駕照不方便,所以在2025年公安部出手了,年齡限制放寬10年,同時推出送考下鄉服務,還進一步的降低考駕照的費用,2025年起考摩托車駕照不難了。
從「星靈安全守護體系」到昊鉑HL,看懂廣汽科技日 - 天天要聞

從「星靈安全守護體系」到昊鉑HL,看懂廣汽科技日

發布會以技術切入,並全程圍繞安全展開。廣汽集團董事長、總經理馮興亞率先登場,宣布2025年四季度將正式上市支持L3級智能駕駛的車型,他同時強調面向自動駕駛時代對智能駕駛技術、整車安全架構以及突發風險處理能力的要求更高。如何才能滿足更高的要求?馮興亞提到了「廣汽
關稅大棒下,最受傷的車企出現了 - 天天要聞

關稅大棒下,最受傷的車企出現了

特朗普的關稅大棒剛揮出,尚未嚇退「外敵」,卻先刺痛了自己。近日,擁有瑪莎拉蒂、Jeep等14個品牌的全球第四大車企斯泰蘭蒂斯突然宣布裁撤900名美國工人,關閉加拿大和墨西哥兩家工廠,北美生產線陷入癱瘓。幾乎同一時間,捷豹路虎宣布暫停對美出口一個月,奧迪更是直接