全息/VR/AR行业发展动态周报2023年第49周(11月27日-12月3日)

一、政策环境

【《北京市人工智能行业大模型创新应用白皮书(2023年)》发布】

11月29日,在AICC 2023人工智能计算大会上发布了《北京市人工智能行业大模型创新应用白皮书(2023年)》。

《白皮书》从大模型全球发展态势、国内外行业应用概述、北京应用情况和发展建议等方面进行了系统分析和阐述,旨在进一步推动大模型应用落地,展示北京市大模型应用成果,促进大模型价值传播和供需对接。

《白皮书》认为,大模型技术迅速迭代,打破了原有AI技术发展的上限,呈现出数据巨量化、模型通用化、应用模式中心化等特点,以"无限生产"的能力重塑企业生产引擎,推动生产效率颠覆式提升。

二、产业发展

亚马逊发布生成式AI“王炸”成果捍卫地位,发布聊天机器人,升级自研AI芯片!】

北京时间11月29日凌晨,亚马逊在公司一年一度的 AWS Reinvent 大会上,从芯片、大模型平台、AI应用、生态合作等多个方面秀出“肌肉”。

1、推出亚马逊版的GPT——人工智能(AI)聊天机器人,推出第四代自研服务器CPU芯片AWS Graviton4,相比三代处理速度快30%,能将处理大型Java应用的速度提升45%。

2、推出为生成式AI和机器学习训练设计的云端AI芯片AWS Trainium2,性能比上一代芯片提高到4倍,可提供65ExaFlops超算性能。

3、深化同英伟达的合作,推出基于英伟达芯片的新服务,针对生成式AI推出全新超级计算基础设施、软件及服务。

4、推出生成式AI助手Amazon Q,支持聊天、生成内容、编程、插件及定制开发,硬杠微软Copilot。

【MR让AI“听聪视明”,微软将Copilot整合至Dynamics 365 Guides】

微软宣布Copilot将整合到Dynamics 365 Guides中,旨在为工业环境中处理复杂设备和流程的一线员工带来新助力。在学习如何操作和维护设备的同时,新员工还需快速提升技能。现在,有了Copilot, 他们可使用自然语言和手势获取相关信息,无需费力翻阅大量数字文档或纸质手册。

【传Apple Vision Pro首批备货40万台,到2026年出货1000万台】

日前业内人士称,苹果将在今年12月正式量产第一代MR头显Apple Vision Pro,首批备货40万台左右,2024年销量目标100万台,第三年达到1000万台。消息还表明,Vision Pro 60%的供应链来自中国,这表明这种趋势将持续到未来Vision Pro,苹果已与供应链来源就未来两代Vision Pro进行了沟通。

【微软 Copilot “大脑”升至 GPT-4 Turbo,并提高字符上限】

11 月 28 日消息,Mikhail Parakhin 近期在 X(推特)平台发布推文,表示团队正在积极改善 Copilot(Bing Chat),在解决某些问题之后,会升级到 OpenAI 的 GPT-4 Turbo 上。

Parakhin 是微软广告和网络服务负责人,近日他宣布出任 Windows 和 Web 体验团队的负责人,他在推文中表示:“尚未升级到 GPT-4-turbo,仍需解决某些问题”。Parakhin 还表示在升级 GPT-4-turbo 之后,字符限制数量会进一步扩充,目前最高输入字数为 4000 字。

【华为云推出首个大模型混合云】

据消息,日前华为云行业高峰论坛2023在北京开幕。会上,华为云推出业界首个大模型混合云,并发布《深度用云展望2025》白皮书及深度用云行动计划。同时,华为云提出深度用云行动倡议,并联合10+伙伴和行业组织,共同发起深度用云行动计划,计划未来三年投入1亿人民币,用于能力型伙伴建设、云原生应用开发、行业专家培养、行业标杆打造等领域。

【人体实验在即,马斯克的脑机接口公司Neuralink再融资4300万美元!】

根据提交给美国SEC的一份文件显示,马斯克的脑机接口公司Neuralink公司又获得了4300万美元的风险投资。Neuralink希望建立人脑与外部设备的通信通道,通过在大脑内植入超细线,并将这些线程连接到一个定制设计的芯片上,该芯片包含可以读取神经元组信息的电极。

今年5月,Neuralink获得了美国食品和药物监管局(FDA)的人体临床试验批准,今年9月,Neuralink宣布首次进行脑机接口人体实验。据报道,已有数千人正排队等候植入Neuralink的大脑植入设备。

【福特AR-HUD新专利,可动态显示多焦平面信息】

近日,福特汽车公司申请了一项名为“multi-plane augmented reality image generation”(多平面AR图像生成)的新专利。专利介绍指出,福特的汽车驾驶系统可通过神经网络来生成“像素级相位矩阵”,它可在合适的时间在挡风玻璃上显示合适的数据。此外,系统会自动调整AR图像的焦平面,这样可提供更好的视觉体验。

福特为其挡风玻璃提供了很多用例,其中包括显示里程表、导航指令、燃油状态等,此外,当道路中闯入动物等物体,系统也会出现相应的提示。

【亚马逊黑五促销,Quest 2销量远超Quest 3】

黑色星期五期间,Meta新发售的Quest 3头显没有任何官方优惠,售价保持500美元不变。但是,Meta将原价299.99美元的Quest 2降价50美元至249.99美元,并且进一步额外赠送了50美元的Creadit,等价亚马逊的Amazon Credit或Meta Store Credit。

根据亚马逊平台的销售数据,Quest 2的巨大优惠更受消费者青睐。在过去的30天里,Quest 2与Quest 3的销量之比高达3:1。其中Quest 3仅售出大约6.9万台,而Quest 2则为16.3万台左右。

三、市场动态

【苹果(AAPL.US)获批新专利:机器学习追踪用户血液流动,创建更逼真虚拟人像】

11 月 29 日消息,根据美国商标和专利局(USPTO)今天公示的清单,苹果公司获得了一项新的技术专利,利用机器学习技术,追踪映射用户的血液流动,从而创建更逼真的虚拟人像。

这项专利全称为《Machine Learning-based Blood Flow Tracking》,可以通过机器学习方法推断“血流纹理图”,以更逼真地呈现虚拟人像的情感和面部表情。现有的虚拟人像系统通常不提供传达细微的面部表征或情绪状态的能力,苹果的这项技术如果能投入商用,可以传达用户的实际情绪状态。

【微美全息(WIMI.US)领先开发全息复振幅计算与更新技术,开辟未来全息无接触交互】

在过去几年,全息技术在科学、工程和娱乐等领域中引起了越来越多的关注。尽管全息显示技术在理论上已有很长的历史,但其实际应用受限于技术上的限制和瓶颈。传统的全息图像计算方法受到了计算复杂度和延迟的限制,无法实现高效的实时更新和交互操作。此外,许多全息显示系统存在与观察者交互的延迟,限制了用户体验的沉浸感和真实感。

因此,对于全息显示技术来说,开发一种能够实时计算复杂全息图像的方法以及提供无延迟交互体验的技术势在必行。这种技术不仅需要能够处理大规模的复杂计算,还需要能够实时响应观察者的操作,使得全息显示系统能够与用户的动作保持同步,实现更加直观和自然的交互体验。

在全息显示技术领域,微美全息一直在技术领域不断创新引领行业发展,近日成功开发了一项创新的技术——"全息复振幅计算与更新技术",该技术致力于利用复振幅计算方法来实现全息图像的实时更新和精确重建,通过最新的算法和传感技术,使全息显示系统能够更加高效地处理复杂的计算任务,并提供无延迟的交互体验。这一技术的开发是对全息显示交互领域技术局限性的突破。

【微软(MSFT.US)AR/VR专利分享更安全实现更高发射功率,降低射频辐射】

智能眼镜和头显的特定电子元件可以产生射频辐射。所以有必要管制用户可能接触的射频辐射量,以限制对用户的任何潜在不利影响。

在名为“Systems and methods for wireless communications in head-mounted devices”的专利申请中,微软就介绍了一种相关的方法。微软指出,发明所述的方法允许头显以比传统头显更大的发射功率和/或更低的SAR为用户传输RF信号。

华为正研发苹果Vision Pro头显竞品:搭载麒麟旗舰处理器】

11 月 27 日,在社交平台 X 上,有博主透露了华为的 XR 硬件产品开发计划,以应对苹果明年即将上市的 Vision Pro。

该博主没有透露这款“旗舰处理器”的具体型号,但考虑到 Apple Vision Pro 由 Mac 级的 M2 和 R1 协处理器驱动,华为将不得不采用类似的配置,麒麟 9000S 或占据一席之地。考虑到华为本身就有具备芯片设计能力,对于 R1 类似的 XR 协处理芯片的全新推出并并非不可能。

另外,华为的目标是轻量化,与苹果 Vision Pro 一样,据说电池从外部连接到头显,并由专用风扇进行散热管理,这是 Apple Vision Pro 所缺少的附加功能,或是一个亮点之一。