在過去的半年裡,生成式AI得以大爆發。據了解,目前國內已經和將要發布的大模型超過100個。
更進一步,現在有更多的行業用戶在思考該如何將生成式AI落地應用。這其中,既需要適當的方法論支持,也需要配套的數據戰略,當然還離不開相應的算力提供。
在近日舉行的2023亞馬遜雲科技中國峰會上,亞馬遜雲科技大中華區產品部總經理陳曉建和亞馬遜雲科技全球產品副總裁Matt Wood分享了他們的觀點。在這裡,我們從方法論入手,來看看生成式AI應該如何在行業當中落地。
確立自己的方法論
與企業開展其他戰略性舉措一樣,在進入生成式AI領域之前,首先要確立自己的方法論。Matt Wood站在亞馬遜雲科技的角度,提出了一套開啟生成式AI旅程的方法論建議。
這個方法論分為五步,分別是:基於自己現有的數據戰略去做構建;在組織內實現更廣泛、更安全的生成式AI實驗;為需求場景定製化模型;攜手亞馬遜雲科技,探索無限可能;選擇場景,即刻啟程,構建未來。
從中可以看出,他的建議是企業從已有數據入手,這是生成式AI的基礎,沒有相應的數據就無法構建自己的大模型;最後則要落實到場景化應用當中去,為企業創造業務價值。
對於如何解鎖生成式AI的價值,Matt Wood也提了四條建議。他表示:企業應該利用已有的一流基礎模型,構建出色的生成式 AI 應用程序;提供安全私密的環境,使用私有數據來定製化這些模型;利用低成本、低延遲的定製芯片,藉助專門構建的機器學習基礎設施;藉助專業代碼生成工具,消除繁重工作並提高效率。
在上述幾個方面,亞馬遜雲科技能夠為企業提供相應的支持。比如利用基礎模型應用構建工具Amazon Bedrock,企業可以方便地調用多種基礎模型,包括AI21 Labs、Anthropic、Stability AI和亞馬遜雲科技自己的Titan,並在此基礎上進行調優訓練。Amazon SageMaker則是一個機器學習開發平台,幫助企業開發自己的AI模型。對於訓練和推理,則提供Inferentia和Trainium芯片,以及相應的實例Trn1n和Inf2。Amazon CodeWhisperer則是一個AI編程助手,為開發者實時生成代碼建議。
貫徹雲原生的數據戰略
數據是生成式AI的起點,數據也將推動生成式AI的廣泛應用,對於所有的組織企業來說都十分重要。
Matt Wood認為,雲原生數據戰略有三大核心特徵:全面——提供適合任何用例的工具集,集成——輕鬆連接所有數據,受治理——構建端到端的數據治理。為幫助企業貫徹雲原生數據戰略,亞馬遜雲科技分別提供了相應的服務和支持。
在工具集方面,亞馬遜雲科技推出15種專門構建的雲上託管數據庫服務,為各類用戶的應用場景提供完美契合的數據服務;數據分析服務已實現Serverless化,包括交互式查詢服務Amazon Athena、大數據處理服務Amazon Managed Streaming for Apache Kafka (Amazon MSK)、實時分析服務Amazon Kinesis、數據倉庫服務Amazon Redshift、數據集成服務Amazon Glue、商業智能服務Amazon QuickSight以及運營分析服務Amazon OpenSearch Service。
在數據連接方面,亞馬遜雲科技提出了Zero-ETL的願景,致力於實現無縫的數據轉換和調用,而用戶不用編寫任何的代碼。Amazon Aurora則可以與Amazon Redshift進行Zero-ETL集成,允許使用 Amazon Redshift 對來自Aurora的PB級事務數據進行近實時分析和機器學習,而不必構建和維護複雜的數據管道來執行提取、轉換和加載 (ETL) 操作。
在數據治理方面,亞馬遜雲科技去年推出的數據管理服務Amazon DataZone,讓客戶可以更快、更輕鬆地對存儲在亞馬遜雲科技、客戶本地和第三方來源的數據進行編目、發現、共享和治理。藉助Amazon DataZone,管理員和數據資產管理者可以使用精細的控制工具管理和治理數據訪問權限,確保數據訪問發生在正確的權限和正確的情境之下。
找到高性價比的算力資源
AI創新風潮帶來了算力資源需求爆發,高性價比的算力資源尤其短缺。
不同於互聯網巨頭,企業對於算力成本更為敏感。尤其是隨着大模型的應用,未來生成式AI的算力需求主要集中在推理上。企業需要找到運維簡單、性價比高、無處不在、安全合規的算力資源。
陳曉建介紹說,面對算力需求的井噴,亞馬遜雲科技通過自研芯片創新、彈性的計算存儲組合以及Serverless架構等,來滿足客戶對於多樣算力的需求。
針對算力緊缺需求,亞馬遜雲科技採用多種芯片來提供全面深入的基礎設施能力,包括Intel、AMD、英偉達,和自研的CPU及加速芯片產品。其中自研產品包括基礎架構芯片Nitro、Arm架構通用處理器Graviton3、機器學習訓練芯片Trainium、機器學習推理芯片Inferentia等。
針對彈性計算資源需求,亞馬遜雲科技提供600多種不同的計算實例,從處理器、網絡和存儲等各種服務,都能夠與計算進行很好的結合,以積木的方式搭建出豐富靈活的計算實例的資源,滿足多種不同算力的要求。比如提供了多達八種的存儲層級,無論是冷熱溫凍數據都可以找到合適的存儲層級。
針對簡化算力應用需求,亞馬遜雲科技推動雲服務全面邁向Serverless,將雲的彈性、敏捷性、按需付費的特性發揮到極致。隨着雲服務全面Serverless時代的開啟,用戶無需預置或管理基礎設施,就可以運行幾乎任何類型的應用程序或後端服務代碼,最大限度減輕運維工作,並增加業務敏捷性,更好地應對業務的各種不確定性。
針對無處不在的算力需求,亞馬遜雲科技可以將雲服務交付到客戶需要的任何地方,從全球數據中心,到中心城市、5G網絡,再到本地數據中心、邊緣和物聯網,甚至是弱網環境。同時,其遍布全球31個區域的99個可用區,可以覆蓋245個國家和地區,能夠為出海中國企業提供全球化的算力支持。
針對安全合規的需求,亞馬遜雲科技具有支持全球各個國家和地區業務合規能力,幾乎能夠滿足全球所有監管機構的合規性要求。其支持143項安全標準與合規認證,有超過300種安全合規服務,能夠幫助客戶方便地搭建滿足全球各地安全和合規要求的算力架構。
如今,生成式AI正在成為企業新一輪業務創新的重要工具,成為下一代的生產力工具。
陳曉建表示,現今創新至關重要,而雲技術能更快、更高效地幫助企業創新,亞馬遜雲科技廣泛和深入的服務可以讓客戶擺脫基礎架構的束縛,專註於創新。