AIGC行業周報 | 2024,有分析稱英偉達要花68億美元買晶元;ShareGPT4Video系列發布;馬斯克:我沒投資任何永生技術,活太久會對社會產生負面影響

2024年06月21日19:30:19 科技 5408

每經編輯:張錦河

開欄語:《aigc行業周報》梳理aigc行業一周內發生的重要動態,產品發布和業內大咖的最新觀點。

AIGC行業周報 | 2024,有分析稱英偉達要花68億美元買晶元;ShareGPT4Video系列發布;馬斯克:我沒投資任何永生技術,活太久會對社會產生負面影響 - 天天要聞

圖片來源:每經製圖

一、企業動態

(一)前openai聯合創始人ilya sutskever成立新公司

openai聯合創始人ilya sutskever宣布成立safe superintelligence inc.(ssi),專註於開發安全超級智能。

ssi致力於實現「核能級別」的安全超級智能,不受短期商業壓力影響,專註於安全性和ai能力的提升。

擁有強大的資金、算力和人才支持,包括與eric schmidt的合作和daniel gross的天使投資經驗,以及在矽谷和以色列特拉維夫的人才網路。

(二)2024,有分析稱英偉達要花68億美元買晶元

預計2024年全球hbm晶元總產能約為5600萬顆,英偉達的需求量預計為2700萬顆,基於單顆250美元的成本測算,意味著英偉達全年採購hbm晶元的費用可以預測到68億美元,遠超此前媒體披露的13億美元預算。

cowos封裝技術是gpu-hbm晶元的關鍵,台積電和amkor為主要供應商。

二、產品技術動態

(一)sharegpt4video系列發布

由中國科學技術大學、北京大學等研究人員推出的sharegpt4video系列,包含4萬條高質量視頻-字幕數據,旨在提升視頻理解和生成能力。

通過差分滑窗視頻描述策略,創建了能夠為任意視頻生成詳細描述的模型,有助於提高視頻語言模型的性能。

數據集在多個長視頻理解基準上帶來性能增益,同時在視頻生成任務中,使用該數據集訓練的模型展現出更好的鏡頭和語義控制能力。

(二)ai視頻巨頭runway深夜發布gen-3

ai視頻製作公司runway推出了新一代視頻生成模型gen-3 alpha,其在細節、一致性和動作表現上進行了顯著改進,達到電影級畫質。

gen-3 alpha支持文本到視頻、圖像到視頻等多種功能,被認為將挑戰現有的ai視頻生成技術,包括sora。

runway計劃提供定製版本,並宣布了新的安全功能,gen-3 alpha即將向付費訂閱者開放。

(三)開源版sora:單鏡頭16秒720p高清視頻一鍵生成

潞晨團隊open-sora項目在720p高清視頻質量和生成時長上取得顯著進展,支持一鍵生成16秒的任意風格高質量視頻,並且宣布全部開源。

引入視頻壓縮網路和優化的擴散模型演算法,發布了1.1b的擴散生成模型,實現了成本與生成質量的平衡,提供了訓練和推理的高效解決方案。

open-sora的開源為視頻內容創作者提供了豐富的創作工具,使用戶從消費者轉變為創造者。

(四)google deepmind 最新研究:為ai視頻生成創建逼真的背景聲音

deepmind開發了v2a技術,將視頻像素與自然語言文本相結合,生成與視頻動作同步的逼真音效。

v2a技術能夠為無聲視頻添加相應的背景聲音或對話,提升視頻的真實感和用戶體驗,同時支持對生成音效的創意控制。

v2a基於擴散模型,通過編碼視頻輸入、迭代改進音頻並解碼生成波形實現同步生成,但仍在改進中,如提高音頻質量和唇語同步的準確性。

(五)chatgpt最新定價體系

openai的chatgpt提供多種訂閱計劃,滿足從個人到企業的各類需求,包括免費版、chatgpt plus、團隊版、企業版、教育版本和非營利組織版本。

免費版用戶可訪問gpt-4o模型和gpt store,但有日容量限制;chatgpt plus提供更高容量和高級數據分析功能;團隊版和企業版提供協作工具、定製應用程序和增強的管理控制。

chatgpt edu專為教育機構設計,提供額外的scim支持;非營利組織可獲得chatgpt團隊和企業版的折扣價格。

(六)dreamtech 推出全球首個原生 3d-dit 大模型 direct3d

通過3d diffusion transformer技術,實現高質量3d內容生成。

解決了傳統2d-to-3d升維技術中的多個問題,如多頭多面、空腔、遮擋等,滿足商業應用需求。

推出面向c端用戶產品,可將圖片/文字轉換為二次元3d人物形象,以及面向創作者的3d內容創作平台,大幅簡化3d模型獲取流程。

(七)英偉達開源nemotron-4 340b模型

英偉達發布了一個包含3400億參數的開源模型家族,包括基礎模型、指令模型和獎勵模型,採用nvidia open model license agreement,允許分布、修改和使用模型及其輸出。

模型訓練使用了超過98%的合成數據,展示了在生成合成數據方面的能力,有助於訓練更小的語言模型,同時開源了合成數據生成流程。

nemotron-4 340b性能在多個基準測試中與gpt-4o等專有模型競爭,支持多種語言和編程語言,對商用友好的許可協議,可能對醫療、金融、製造業和零售業等行業產生重大影響。

三、前沿觀點

(一)馬斯克最新專訪:我沒投資任何永生技術,活太久會對社會產生負面影響

人工智慧很快會改變一切,最早明年就能帶來顯著改變,五年內將帶來激進變化。

馬斯克認為,人工智慧將在搜索領域超越谷歌,提供更為精準、個性化的搜索結果。

馬斯克透露,spacex的最終使命是將生命拓展至多個行星,以擴展人類的意識邊界。

馬斯克的腦機介面公司neuralink正研究大腦晶元,致力於創造人類與人工智慧的共生關係。

馬斯克預測,將來每個人至少會擁有一個機器人。全球將有200億台類似擎天柱的人形機器人。

(二)奧特曼談ai的機遇、挑戰與人類自我反思:中國將擁有獨特的大語言模型

認為ai在提升生產力方面已顯現積極作用,但網路安全等問題也隨之而來。

gpt-4o能覆蓋97%人群的母語,奧特曼承諾將持續改進,解決語言公平性問題。

面對ai治理的挑戰,openai成立安全委員會,奧特曼強調安全與效率並重。

奧特曼預測在眾多大語言模型,少數將會勝出;中國將會擁有自己獨特的大語言模型。

奧特曼認為ai可能使人類更謙卑,促使我們重新認識自身在宇宙中的位置。

來源:每經科技提供

科技分類資訊推薦

深藍 SO7:超級增程與智能的完美融合 - 天天要聞

深藍 SO7:超級增程與智能的完美融合

深藍 SO7:超級增程與智能的完美融合在科技日新月異的當下,深藍 SO7 以其卓越的「深藍超級增程+華為乾嵬智能」兩大核心賣點,成為科技新主流 SUV 的璀璨明星。深藍超級增程技術,宛如為車輛注入了源源不斷的強大動力源泉。
華為倒下?背後真相與利益鏈條大曝光! - 天天要聞

華為倒下?背後真相與利益鏈條大曝光!

隨著科技行業的迅速發展,華為這個名字幾乎成了「創新」的代名詞。然而,近日關於華為的種種傳聞讓人心生疑慮。華為真的要倒下了嗎?今天,我們就來揭開華為背後的真相,以及那些隱藏在暗處的利益鏈條。
iPhone 17 外觀大變,這也太薄了! - 天天要聞

iPhone 17 外觀大變,這也太薄了!

最近,關於明年 iPhone 17 系列的爆料又多了起來,知名分析師郭明錤也分享了最新消息。他表示,iPhone 17 系列還是採用四機型策略,但會移除當前的 Plus 機型,同時新增一款主打「超薄」的新機。至於為何要移除 Plus,原因很
男子誤闖魚塘被抓引熱議,創維極黑光下心酸一幕 - 天天要聞

男子誤闖魚塘被抓引熱議,創維極黑光下心酸一幕

近日,某中年男子誤闖入私人魚塘夜釣「被抓」,老闆反送兩條魚的事件衝上熱搜第一。讓人沒想到是一次普通的夜釣,竟然引出一段辛酸的故事。事件經過是中年失業男子誤將烏漆嘛黑的私人魚塘當著野塘,折騰整晚一條沒釣上來。
2024可持續發展青年創辯大會在杭州開幕 - 天天要聞

2024可持續發展青年創辯大會在杭州開幕

7月25日,2024可持續發展青年創辯大會(海外)暨倫敦大學學院中國論壇開幕式在杭州蕭山國際人才俱樂部舉辦。大會聚焦聯合國可持續發展第9個目標「產業,創新與基礎設施」、第12個目標「永續的消費與生產模式」和第13個目標「氣候行動」等3個主要
電競叛客RTX4070TI SUPER助力玩家成就《七日殺》生存之王 - 天天要聞

電競叛客RTX4070TI SUPER助力玩家成就《七日殺》生存之王

歷經了近10年的搶先體驗版,經典殭屍開放世界恐怖生存遊戲《七日殺(7Days To Die)》終於迎來了正式版更新。《七日殺》是一款由TheFunPimps開發的開放世界殭屍生存遊戲。遊戲將生存、探索、建造和塔防元素融合在一起,玩家需要在一