AIGC行业周报 | 2024,有分析称英伟达要花68亿美元买芯片;ShareGPT4Video系列发布;马斯克:我没投资任何永生技术,活太久会对社会产生负面影响

2024年06月21日19:30:19 科技 5408

每经编辑:张锦河

开栏语:《aigc行业周报》梳理aigc行业一周内发生的重要动态,产品发布和业内大咖的最新观点。

AIGC行业周报 | 2024,有分析称英伟达要花68亿美元买芯片;ShareGPT4Video系列发布;马斯克:我没投资任何永生技术,活太久会对社会产生负面影响 - 天天要闻

图片来源:每经制图

一、企业动态

(一)前openai联合创始人ilya sutskever成立新公司

openai联合创始人ilya sutskever宣布成立safe superintelligence inc.(ssi),专注于开发安全超级智能。

ssi致力于实现“核能级别”的安全超级智能,不受短期商业压力影响,专注于安全性和ai能力的提升。

拥有强大的资金、算力和人才支持,包括与eric schmidt的合作和daniel gross的天使投资经验,以及在硅谷和以色列特拉维夫的人才网络。

(二)2024,有分析称英伟达要花68亿美元买芯片

预计2024年全球hbm芯片总产能约为5600万颗,英伟达的需求量预计为2700万颗,基于单颗250美元的成本测算,意味着英伟达全年采购hbm芯片的费用可以预测到68亿美元,远超此前媒体披露的13亿美元预算。

cowos封装技术是gpu-hbm芯片的关键,台积电和amkor为主要供应商。

二、产品技术动态

(一)sharegpt4video系列发布

由中国科学技术大学、北京大学等研究人员推出的sharegpt4video系列,包含4万条高质量视频-字幕数据,旨在提升视频理解和生成能力。

通过差分滑窗视频描述策略,创建了能够为任意视频生成详细描述的模型,有助于提高视频语言模型的性能。

数据集在多个长视频理解基准上带来性能增益,同时在视频生成任务中,使用该数据集训练的模型展现出更好的镜头和语义控制能力。

(二)ai视频巨头runway深夜发布gen-3

ai视频制作公司runway推出了新一代视频生成模型gen-3 alpha,其在细节、一致性和动作表现上进行了显著改进,达到电影级画质。

gen-3 alpha支持文本到视频、图像到视频等多种功能,被认为将挑战现有的ai视频生成技术,包括sora。

runway计划提供定制版本,并宣布了新的安全功能,gen-3 alpha即将向付费订阅者开放。

(三)开源版sora:单镜头16秒720p高清视频一键生成

潞晨团队open-sora项目在720p高清视频质量和生成时长上取得显著进展,支持一键生成16秒的任意风格高质量视频,并且宣布全部开源。

引入视频压缩网络和优化的扩散模型算法,发布了1.1b的扩散生成模型,实现了成本与生成质量的平衡,提供了训练和推理的高效解决方案。

open-sora的开源为视频内容创作者提供了丰富的创作工具,使用户从消费者转变为创造者。

(四)google deepmind 最新研究:为ai视频生成创建逼真的背景声音

deepmind开发了v2a技术,将视频像素与自然语言文本相结合,生成与视频动作同步的逼真音效。

v2a技术能够为无声视频添加相应的背景声音或对话,提升视频的真实感和用户体验,同时支持对生成音效的创意控制。

v2a基于扩散模型,通过编码视频输入、迭代改进音频并解码生成波形实现同步生成,但仍在改进中,如提高音频质量和唇语同步的准确性。

(五)chatgpt最新定价体系

openai的chatgpt提供多种订阅计划,满足从个人到企业的各类需求,包括免费版、chatgpt plus、团队版、企业版、教育版本和非营利组织版本。

免费版用户可访问gpt-4o模型和gpt store,但有日容量限制;chatgpt plus提供更高容量和高级数据分析功能;团队版和企业版提供协作工具、定制应用程序和增强的管理控制。

chatgpt edu专为教育机构设计,提供额外的scim支持;非营利组织可获得chatgpt团队和企业版的折扣价格。

(六)dreamtech 推出全球首个原生 3d-dit 大模型 direct3d

通过3d diffusion transformer技术,实现高质量3d内容生成。

解决了传统2d-to-3d升维技术中的多个问题,如多头多面、空腔、遮挡等,满足商业应用需求。

推出面向c端用户产品,可将图片/文字转换为二次元3d人物形象,以及面向创作者的3d内容创作平台,大幅简化3d模型获取流程。

(七)英伟达开源nemotron-4 340b模型

英伟达发布了一个包含3400亿参数的开源模型家族,包括基础模型、指令模型和奖励模型,采用nvidia open model license agreement,允许分布、修改和使用模型及其输出。

模型训练使用了超过98%的合成数据,展示了在生成合成数据方面的能力,有助于训练更小的语言模型,同时开源了合成数据生成流程。

nemotron-4 340b性能在多个基准测试中与gpt-4o等专有模型竞争,支持多种语言和编程语言,对商用友好的许可协议,可能对医疗、金融、制造业和零售业等行业产生重大影响。

三、前沿观点

(一)马斯克最新专访:我没投资任何永生技术,活太久会对社会产生负面影响

人工智能很快会改变一切,最早明年就能带来显著改变,五年内将带来激进变化。

马斯克认为,人工智能将在搜索领域超越谷歌,提供更为精准、个性化的搜索结果。

马斯克透露,spacex的最终使命是将生命拓展至多个行星,以扩展人类的意识边界。

马斯克的脑机接口公司neuralink正研究大脑芯片,致力于创造人类与人工智能的共生关系。

马斯克预测,将来每个人至少会拥有一个机器人。全球将有200亿台类似擎天柱的人形机器人。

(二)奥特曼谈ai的机遇、挑战与人类自我反思:中国将拥有独特的大语言模型

认为ai在提升生产力方面已显现积极作用,但网络安全等问题也随之而来。

gpt-4o能覆盖97%人群的母语,奥特曼承诺将持续改进,解决语言公平性问题。

面对ai治理的挑战,openai成立安全委员会,奥特曼强调安全与效率并重。

奥特曼预测在众多大语言模型,少数将会胜出;中国将会拥有自己独特的大语言模型。

奥特曼认为ai可能使人类更谦卑,促使我们重新认识自身在宇宙中的位置。

来源:每经科技提供

科技分类资讯推荐

大疆OSMO 360 完整规格 7月29日发布 - 天天要闻

大疆OSMO 360 完整规格 7月29日发布

对于那些一直在等待大疆 Osmo 360 的人来说,听到在本月底7月29日开售的消息,你们一定会很高兴。今天我偶然发现了这两款产品的完整网店描述和图片已经上线。所以,我们先来深入了解一下那款“革命性 8K” Osmo 360 的描述。
iPhone一键降温?苹果这隐藏模式有点过分啊 - 天天要闻

iPhone一键降温?苹果这隐藏模式有点过分啊

为了解决发热这亘古难题,手机厂商绞尽脑汁,往手机里塞散热膜、均热板、填充硅脂,甚至还用上了主动风扇。 但到了夏天三四十度的室外,该发热还是发热,该烫手还是烫手。 国产安卓如此。 ....
三星Galaxy S26Ultra不装了,性能太炸裂了! - 天天要闻

三星Galaxy S26Ultra不装了,性能太炸裂了!

三星Galaxy S26 Ultra即将亮相,带来多方面升级。·该机型将采用6.9英寸QHD+LTPO AMOLED显示屏,支持120Hz自适应刷新率和3000尼特峰值亮度,确保在各种光照条件下都能提供清晰的视觉体验。
中集洋山集装箱第三季度订单饱满 开拓氢能集成装备求新|公司调研 - 天天要闻

中集洋山集装箱第三季度订单饱满 开拓氢能集成装备求新|公司调研

财联社7月5日讯(记者 胡皓琼)中美关税缓和之下,外贸企业对美出货恢复,带动中集洋山集装箱制造订单增长。集装箱制造厂在提升自动化水平的同时,为提高自身抗风险能力,还正布局新赛道。财联社记者近日走访中集集团(000039.SZ)旗下中集洋山,眼见一片片钢板,经历冲压、焊接组装、打砂等一道道工序,逐渐成形。产线上布...
数据宝一体机实机首秀2025生态文明贵阳国际论坛 - 天天要闻

数据宝一体机实机首秀2025生态文明贵阳国际论坛

7月5日至6日,2025年生态文明贵阳国际论坛召开,数据宝携其AI技术领先成果重磅亮相论坛人工智能展区,并以“企业私域业务模型一体机”实机首秀,现场演绎数据资产与AI深度赋能绿色发展的创新融合实践。数据宝“企业私域业务模型一体机”。
登上C909样机,听听中国商飞工程总师怎么说?《明青讲习所》又上新了 - 天天要闻

登上C909样机,听听中国商飞工程总师怎么说?《明青讲习所》又上新了

名师金课《明青讲习所》今又上新,这期节目《“科学家精神”的回响》聚焦于“科学家精神的时代传承”,定于7月5日(周六)19:30 在上海教育电视台首播。陈明青老师带领华东师范大学第一附属中学、上海市鲁迅中学、上海南湖职业技术学院的学生们,踏上沉浸式学习之旅,走进钱学森图书馆、中国商飞上海飞机设计研究院、上海科...