AIGC行業周報 | 2024,有分析稱英偉達要花68億美元買晶元;ShareGPT4Video系列發布;馬斯克:我沒投資任何永生技術,活太久會對社會產生負面影響

2024年06月21日19:30:19 科技 5408

每經編輯:張錦河

開欄語:《aigc行業周報》梳理aigc行業一周內發生的重要動態,產品發布和業內大咖的最新觀點。

AIGC行業周報 | 2024,有分析稱英偉達要花68億美元買晶元;ShareGPT4Video系列發布;馬斯克:我沒投資任何永生技術,活太久會對社會產生負面影響 - 天天要聞

圖片來源:每經製圖

一、企業動態

(一)前openai聯合創始人ilya sutskever成立新公司

openai聯合創始人ilya sutskever宣布成立safe superintelligence inc.(ssi),專註於開發安全超級智能。

ssi致力於實現「核能級別」的安全超級智能,不受短期商業壓力影響,專註於安全性和ai能力的提升。

擁有強大的資金、算力和人才支持,包括與eric schmidt的合作和daniel gross的天使投資經驗,以及在矽谷和以色列特拉維夫的人才網路。

(二)2024,有分析稱英偉達要花68億美元買晶元

預計2024年全球hbm晶元總產能約為5600萬顆,英偉達的需求量預計為2700萬顆,基於單顆250美元的成本測算,意味著英偉達全年採購hbm晶元的費用可以預測到68億美元,遠超此前媒體披露的13億美元預算。

cowos封裝技術是gpu-hbm晶元的關鍵,台積電和amkor為主要供應商。

二、產品技術動態

(一)sharegpt4video系列發布

由中國科學技術大學、北京大學等研究人員推出的sharegpt4video系列,包含4萬條高質量視頻-字幕數據,旨在提升視頻理解和生成能力。

通過差分滑窗視頻描述策略,創建了能夠為任意視頻生成詳細描述的模型,有助於提高視頻語言模型的性能。

數據集在多個長視頻理解基準上帶來性能增益,同時在視頻生成任務中,使用該數據集訓練的模型展現出更好的鏡頭和語義控制能力。

(二)ai視頻巨頭runway深夜發布gen-3

ai視頻製作公司runway推出了新一代視頻生成模型gen-3 alpha,其在細節、一致性和動作表現上進行了顯著改進,達到電影級畫質。

gen-3 alpha支持文本到視頻、圖像到視頻等多種功能,被認為將挑戰現有的ai視頻生成技術,包括sora。

runway計劃提供定製版本,並宣布了新的安全功能,gen-3 alpha即將向付費訂閱者開放。

(三)開源版sora:單鏡頭16秒720p高清視頻一鍵生成

潞晨團隊open-sora項目在720p高清視頻質量和生成時長上取得顯著進展,支持一鍵生成16秒的任意風格高質量視頻,並且宣布全部開源。

引入視頻壓縮網路和優化的擴散模型演算法,發布了1.1b的擴散生成模型,實現了成本與生成質量的平衡,提供了訓練和推理的高效解決方案。

open-sora的開源為視頻內容創作者提供了豐富的創作工具,使用戶從消費者轉變為創造者。

(四)google deepmind 最新研究:為ai視頻生成創建逼真的背景聲音

deepmind開發了v2a技術,將視頻像素與自然語言文本相結合,生成與視頻動作同步的逼真音效。

v2a技術能夠為無聲視頻添加相應的背景聲音或對話,提升視頻的真實感和用戶體驗,同時支持對生成音效的創意控制。

v2a基於擴散模型,通過編碼視頻輸入、迭代改進音頻並解碼生成波形實現同步生成,但仍在改進中,如提高音頻質量和唇語同步的準確性。

(五)chatgpt最新定價體系

openai的chatgpt提供多種訂閱計劃,滿足從個人到企業的各類需求,包括免費版、chatgpt plus、團隊版、企業版、教育版本和非營利組織版本。

免費版用戶可訪問gpt-4o模型和gpt store,但有日容量限制;chatgpt plus提供更高容量和高級數據分析功能;團隊版和企業版提供協作工具、定製應用程序和增強的管理控制。

chatgpt edu專為教育機構設計,提供額外的scim支持;非營利組織可獲得chatgpt團隊和企業版的折扣價格。

(六)dreamtech 推出全球首個原生 3d-dit 大模型 direct3d

通過3d diffusion transformer技術,實現高質量3d內容生成。

解決了傳統2d-to-3d升維技術中的多個問題,如多頭多面、空腔、遮擋等,滿足商業應用需求。

推出面向c端用戶產品,可將圖片/文字轉換為二次元3d人物形象,以及面向創作者的3d內容創作平台,大幅簡化3d模型獲取流程。

(七)英偉達開源nemotron-4 340b模型

英偉達發布了一個包含3400億參數的開源模型家族,包括基礎模型、指令模型和獎勵模型,採用nvidia open model license agreement,允許分布、修改和使用模型及其輸出。

模型訓練使用了超過98%的合成數據,展示了在生成合成數據方面的能力,有助於訓練更小的語言模型,同時開源了合成數據生成流程。

nemotron-4 340b性能在多個基準測試中與gpt-4o等專有模型競爭,支持多種語言和編程語言,對商用友好的許可協議,可能對醫療、金融、製造業和零售業等行業產生重大影響。

三、前沿觀點

(一)馬斯克最新專訪:我沒投資任何永生技術,活太久會對社會產生負面影響

人工智慧很快會改變一切,最早明年就能帶來顯著改變,五年內將帶來激進變化。

馬斯克認為,人工智慧將在搜索領域超越谷歌,提供更為精準、個性化的搜索結果。

馬斯克透露,spacex的最終使命是將生命拓展至多個行星,以擴展人類的意識邊界。

馬斯克的腦機介面公司neuralink正研究大腦晶元,致力於創造人類與人工智慧的共生關係。

馬斯克預測,將來每個人至少會擁有一個機器人。全球將有200億台類似擎天柱的人形機器人。

(二)奧特曼談ai的機遇、挑戰與人類自我反思:中國將擁有獨特的大語言模型

認為ai在提升生產力方面已顯現積極作用,但網路安全等問題也隨之而來。

gpt-4o能覆蓋97%人群的母語,奧特曼承諾將持續改進,解決語言公平性問題。

面對ai治理的挑戰,openai成立安全委員會,奧特曼強調安全與效率並重。

奧特曼預測在眾多大語言模型,少數將會勝出;中國將會擁有自己獨特的大語言模型。

奧特曼認為ai可能使人類更謙卑,促使我們重新認識自身在宇宙中的位置。

來源:每經科技提供

科技分類資訊推薦

生態科技助力奧運保障,國家體育總局訓練局新添合作夥伴 - 天天要聞

生態科技助力奧運保障,國家體育總局訓練局新添合作夥伴

巴黎奧運會進入開幕倒計時一個月之際,中國奧運軍團的「大本營」迎來新的合作夥伴。6月26日,國家體育總局訓練局與納愛斯集團攜手舉行以「生態科技讓運動更美好」為主題的簽約儀式,後者旗下生態科技洗護系列產品成為國家體育總局訓練局國家隊運動員備戰保障產品。國家體育總局訓練局成立於1951年,是新中國成立後建成的第...
科大訊飛發布訊飛星火大模型V4.0,稱多方面超GPT-4 Turbo - 天天要聞

科大訊飛發布訊飛星火大模型V4.0,稱多方面超GPT-4 Turbo

藍鯨新聞6月28日訊(記者 張信宇)「真正在乎軟體的人,應該去製造屬於自己的硬體。」這句科技界著名的判斷來自於曾獲圖靈獎的著名計算機科學家Alan Kay,預示了技術發展的一種趨勢,後來又被喬布斯用於表達蘋果公司的產品開發理念,奠定了如今蘋果公司的科技帝國。實際上,Alan Kay早在1970年代就提出了這一點,不止蘋果,...
AutoStudio:能做漫畫的AI,多輪對話保持一致風格! - 天天要聞

AutoStudio:能做漫畫的AI,多輪對話保持一致風格!

在當今的AI的帶領下域,圖像生成技術正不斷取得令人矚目的進展。今天要給大家介紹一個能幫你生成漫畫的技術:AutoStudioAutoStudio是什麼?AutoStudio是一個先進的AI工具,它能夠在多輪對話中與用戶互動,生成一系列主題和
三星 Galaxy Z Fold6 粉色款渲染圖首曝,7 月 10 日發布 - 天天要聞

三星 Galaxy Z Fold6 粉色款渲染圖首曝,7 月 10 日發布

IT之家 6 月 27 日消息,三星將於 7 月 10 日在巴黎舉辦 Galaxy Unpacked 新品發布會,屆時可摺疊手機 Galaxy Z Fold 6 和 Z Flip 6 有望在此次活動中亮相。PassionateGeekz 網站現已分享一組 Galaxy Z Fold6 的外觀渲染圖。▲ 圖源 PassionateGeekz 網站,下同此次曝光