据环球时报报道,美国海关与边境保护局近日宣布,美国联邦政府已同意对智能手机、电脑、芯片等电子科技类产品免除所谓「对等关税」。
海关与边境保护局发布的文件显示,这一些产品被排除在政府对贸易伙伴实施的所谓「对等关税」之外。文件显示,豁免的产品适用于 4 月 5 日以后进入美国的电子科技类产品,已经支付的「对等关税」可以寻求退款。
彭博社报道指出,该措施可能会在某些特定的程度上缓解美国消费者面临的涨价压力,同时有利于包括苹果公司和三星电子公司在内的电子巨头。
此前,美国政府计划取消价值 800 美元及以下小包裹的免税待遇,特别是针对中国包裹。如今,最新豁免政策延续了对小包裹的关税减免,确保这些包裹暂时免受高额税费的冲击。
据外媒 Fortune 的报道,随着 Meta CEO 扎克伯格近两年将公司重心转向生成式 AI 产品,FAIR(基础人工智能研究实验室)实验室在组织内逐渐被边缘化。
报道称,2024 年 1 月,随着生成式 AI 热潮加速,Meta 对其 AI 研究架构进行了重大重组。
FAIR 与 Ahmad Al-Dahle 领导下的生成式 AI 产品团队(称为 GenAI)被合并为一个小组。一位前 FAIR 领导人将这一合并描述为对研究实验室的「打击」。这次重组直接影响了 Llama 模型的开发工作。
对于「不同服务中模型质量参差不齐」这一问题,Ahmad Al-Dahle 解释称,由于模型一准备好就发布了,所以 Meta 的团队预计所有公开的应用实现都需要几天时间来来优化调整,团队后续会接着来进行漏洞修复工作。
对于 Llama 4「开卷作弊」(在测试集上进行训练),Ahmad Al-Dahle 表示这纯属无稽之谈,并表示团队绝不会这么做。其表示,质量差异是由于需要对应用实现进行稳定化处理造成的。
据前 Meta 员工透露,FAIR 近年来逐渐萎缩,与此同时,FAIR 人才流失严重。原始 Llama 研究论文的 14 位作者中,超过半数在论文发表六个月后离开了公司,过去一年至少有八位顶尖研究人员选择离职。
近期 FAIR 负责人 Joelle Pineau 宣布辞职,Meta 首席 AI 科学家 Yann LeCun 目前临时领导 FAIR,直到公司找到 Pineau 的继任者。且他否认 FAIR 即将消亡,相反强调实验室即将迎来新篇章,并将重新专注于长期 AI 研究。
LeCun 表示:「这更像是一个新的开始,FAIR 正在重新聚焦于我们叫做 AMI(高级机器智能)的雄心勃勃且长期的目标。」他所说的 AMI 是指帮助机器像动物和人类一样理解世界、推理、规划和高效学习。
据外媒《金融时报》援引知情人士的消息称,随着 AI 行业竞争的日益激烈,OpenAI 已大幅削减了对其 AI 模型进行安全测试的时间和资源。
目前,员工和第三方团体对 OpenAI 最新的大型语言模型进行的「评估」(即评估模型风险和性能的测试)仅有几天时间,而此前这一过程需要数月之久。
一位正在测试 OpenAI 即将推出的 o3 模型(设计用于复杂问题解决和推理任务)的的人说:「当技术不那么重要时,我们的安全测试更加彻底。」
该人士补充说,随着大型语言模型变得更强大,技术被「武器化」的潜在可能性也随之增加。
「但由于市场需求更高,他们盼望更快推出产品。我希望这不会是一个灾难性的错误,但这样的做法确实草率冒险,是灾难的配方。」
OpenAI 则表示,他们已提高了评估过程的效率,包括自动化测试,这导致了时间框架的缩短。该公司安全系统负责人 Johannes Heidecke 表示:「我们在行动速度和测试彻底性之间取得了很好的平衡。」
报道称,本轮筹集的 20 亿美元资金将作为该公司的种子轮融资,相较于此前 2 月报道的 10 亿美元融资,本次金额直接翻了 2 倍;消息人士还表示,若本次融资成功,Thinking Machines Lab 估值将达到至少 100 亿美元。
本周,The Information 曝光了更多升级版 Siri 未能按时更新的原因及细节,其中最核心的原因是由于 Siri 团队内部在技术选择上犹豫不决,以及人员变动导致了升级版 Siri 难产。
据悉,最初 Siri 团队选择的是大小模型混合为升级版 Siri 提供支持。据熟悉新版 Siri 项目的苹果前员工透露,大小模型连名字都已经定好,分别叫「大力鼠标(Mighty Mouse)」和「迷你鼠标(Mini Mouse)」。其中,大模型将会用于云端计算,处理复杂任务,而小模型在 iPhone 上进行本地运行,执行轻量化的任务(如 Siri 定闹钟)。
但 Siri 团队的「领头羊」决定构建一个能处理所有事务的大模型,但需要新版 Siri 保持云端计算,恰恰这一做法违反了 Siri 的保护隐私策略;随后团队内部还发生了一系列的技术转型,导致不少小组成员感到沮丧,甚至选择离职。
报道中透露,Federighi 也有自己的机器学习团队,该团队负责了苹果相当多的 AI 功能开发任务,而这些功能均已划分到 Apple Intelligence 中,并成功发布。
而对于 John Giannandrea 和 Robby Walker,两位前 Siri 负责人都因自己的决策问题,导致 Siri 没能得到很好的资源分配,从而促使了技术的落后。报道还提到,Walker 不愿承担 Siri 的项目风险,并且专注于对性能影响不大的功能,而不是选择彻底改造 Siri。
此外,有知情的人偷偷表示,因为 Federighi 和 Giannandrea 两人的性格截然不同,导致前者的 AI 团队与后者的 Siri 团队没能很好相互交流,甚至两人关系一度恶化。
一则来自的报道也曝光了更多细节。据悉,由于苹果数据中心仅拥有约 5 万个使用超过 5 年的 GPU,负责 AI 项目的 John Giannandre 曾特地向库克申请增购 GPU。
库克最初批准将芯片预算翻倍,但财务主管卢卡·马埃斯特里将增幅削减至不到一半,并建议团队提高现有芯片效率。由于 GPU 不足,AI 团队不得不向 Google 和亚马逊等供应商租用计算资源,甚至使用 Google 的替代芯片进行开发。
苹果发言人特鲁迪·穆勒事后澄清,公司已逐步满足 Giannandre 的预算需求,而非一次性全额拨款,且马埃斯特里未要求团队优化芯片效率。
尽管如此,报道称苹果并未放弃 Siri 升级计划,预计今年秋季推出延迟的 Apple Intelligence Siri 功能,比如能编辑照片并发送给朋友的虚拟 AI 助手。
本周,OpenAI 在 X 平台宣布将对马斯克提起反诉,指责其一系列行为意在拖延 OpenAI 的发展并谋取个人利益,以及还指责马斯克一直在散布虚假信息,试图误导公众。
同期,包括史蒂文·阿德勒、丹尼尔·科科塔伊洛、格雷琴·克鲁格在内的 12 名前 OpenAI 员工近日则提交了一份法庭文件,支持马斯克对 OpenAI 的诉讼,反对 OpenAI 从非营利组织转为盈利公司。
这群前员工中有多人曾公开批评 OpenAI 的管理方式,例如克鲁格呼吁公司提高透明度,科科塔伊洛和威廉·桑德斯则警告 OpenAI 在 AI 竞赛中过于「鲁莽」。
前员工在文件中指出,OpenAI 现行结构——非营利部分控制子公司——对其使命至关重要。
转为盈利公司可能会引起 OpenAI 第一先考虑股东利益,削减安全投入,甚至放弃「合并与协助」承诺,即支持其他安全导向的 AGI(通用AI)项目。
他们还透露,OpenAI 常以非营利治理结构吸引人才,2020 年底的一次全员会议上,CEO Sam Altman 曾强调非营利监督对确保安全和社会利益优先至关重要。
4 月 10 日,宇树科技发布了一段展示机器人与人类及机器人之间格斗的视频。
视频显示,头戴头盔、手戴拳击手套的人形机器人在出拳速度、下盘稳定性和反应灵敏度等方面与真人无异,在被击倒后还能迅速站起并调整姿势。
宇树科技还宣布计划于一个月内开启机器人格斗直播,称机器人目前正在学习更多技能,期待在马上就要来临的格斗直播中展示更多功能。
SSI 以 320 亿美元(约合人民币 2340 亿元)的估值额外筹集了 20 亿美元资金。据悉,此轮融资由 Greenoaks 领投。
在此之前,SSI 已成功筹集 10 亿美元资金,且有消息称公司正在进行另一轮 10 亿美元的融资。对于最新的融资消息,SSI 方面尚未发表评论。
在 Google Cloud 大会上,Google 第七代 TPU「Ironwood」正式亮相,其为 Google 迄今为止性能最强、可扩展性最高的定制 AI 加速器,也是首款专为推理设计的加速器。
Ironwood 搭载了高达 192GB 的显存,在带宽方面提升到至 7.2 Tbps,双向带宽也增加到 1.2 Tbps,让数据、芯片之间的传输速度更快,提升大规模分布式训练和推理的效率。
Vertex AI 加入「文字转音乐模型」Lyria,成为唯一一个涵盖所有模态(视频、图像、语音和音乐)的生成式媒体模型的平台;
Google AI 视频生成模型 Veo 2 新增视频修复、画面拓展、镜头构图指导等功能;
文字转图像模型 Imagen 3 提升画面细节表现,拥有更丰富的光照以及减少干扰性伪影,同时还改善了图像修复(擦除)能力。
Google 还推出了 Agent(智能体)的全新开放协议「Agent2Agent(A2A)」,其旨在帮助多个智能体之间能够相互协作,并通过开放协议相互通信,从而提升智能体的实用性。值得一提的是,A2A 协议是对 Anthropic 提出的 MCP 模型上下文协议的补充,Google 还宣布,旗下 Gemini 模型也将支持 MCP 协议。
据悉,模型上下文协议(Model Context Protocol,MCP)是由 Anthropic 推出的开源协议,旨在实现大语言模型与外部数据源和工具的集成,用来在大模型和数据源之间建立安全双向的连接。
另外,Google 的 AI 编码助手「Gemini Code Assist」已经在预览版中提供了 Agent(智能体)能力。Google 在大会上宣布,Code Assist 中的智能体可以执行多个步骤并完成复杂的编程任务。
据介绍,ChatGPT 将能够参考用户所有的历史对话内容,提供更个性化的服务体验,比如在写作、建议、学习等方面,能给出贴合用户喜好的回答。
早在去年 9 月,ChatGPT 就已全量推送记忆功能,并将其扩展到 GPTs 功能。而此次升级后,新的对话将在已保存的记忆信息上自然延伸,交互更加流畅,更符合用户个人风格。新功能将逐步向所有 Plus 和 Pro 用户开放,但欧洲经济区(EEA)、英国、瑞士、挪威、冰岛和列支敦士登除外。团队版、企业版和教育版用户则需再等几周。
此外,OpenAI 还公布并开源了一个新的浏览能力测试基准 —— BrowseComp(Browsing Competition),专门用于测试 AI 模型在跨网站、多跳推理与策略搜索方面的能力。结果显示,只有特训版 OpenAI Deep Research 在测试中获得较好成绩,4o、GPT-4.5 纷纷败下阵来。
本周, 该模型基于 Meta 早期的 Llama-3.1-405B-Instruct 模型开发,拥有 2530 亿个参数,在多项第三方基准测试中表现出色:
英伟达新模型的性能逼近拥有 6710 亿参数的 DeepSeek R1,但只用了不到一半的参数量。
在 BF16 和 FP8 精度模式下均验证通过目前,该模型的代码已在 Hugging Face 平台上公开,包含开放的权重和训练后数据。
官方介绍,Llama-3.1-Nemotron-Ultra-253B 可用于聊天机器人开发、AI Agent 工作流、检索增强生成(RAG)和代码生成等场景。根据英伟达开放模型许可证及 Llama 3.1 社区许可协议,该模型已获准用于商业用途。
最近,一位软件工程师最近在 Twitch 平台上创建了名为「Gemini_Plays_Pokemon」的频道,他表示:「我正在测试 Gemini Pro 2.5,看看它在《Pokemon》游戏中表现如何。」
直播画面分为两部分:左侧显示 Gemini 的程序如何获取游戏数据,包括玩家位置、地图细节等信息,并进行屏幕截图;右侧则展示 AI 在游戏中的实际进展,包括捕捉宝可梦等活动。
这并非 AI 首次尝试玩《Pokemon》。今年 2 月,Anthropic 也宣布其最新 AI 模型 Claude 3.7 Sonnet 已在《Pokemon》上进行训练,成功获得了三个徽章,相当于完成了游戏的一半进度。
Google AI 产品负责人也对这一现象表示关注,他在社会化媒体上分享了直播链接并评论道:「Gemini 2.5 Pro 目前在完成《Pokemon》方面取得了巨大进展,观看过程很有趣。」
Altman 在谈到 AI 对就业的影响时表示,人们通常有两种反应:担忧被取代,或将 AI 视为提升能力的工具。他强调,人类创造力仍然至关重要,并承认在知识产权和公平使用方面存在挑战,提议建立新商业模式确保创作者获得合理报酬。
关于开源模型,Altman 承认 OpenAI 在这方面行动较晚,但确认他们正在开发一款强大的接近前沿水平的开源模型。他反对将 AI 发展描述为「不负责任的竞赛」,表示大多数 AI 公司都真诚关注安全问题。
Altman 透露,OpenAI 未来将专注于使用者真实的体验而非单纯追求模型能力,同时预测 AI 在科学领域的应用将带来重大突破,尤其是在疾病防治和新材料发现方面。另一个马上就要来临的飞跃是由自主软件编写代理推动的软件工程。
当被问及对 AGI 的定义时,Altman 调侃道:「这个嘛,就像个笑线 个 OpenAI 的研究人员坐在一个房间里,让他们定义 AGI,你可能会得到 14 种不同的定义。」
他还明确说 ChatGPT 并不是 AGI,因为它无法自主学习、改进自身或独立完成复杂任务。
Altman 预计未来的人类将永远生活在比人类更智能的 AI 存在的环境中,「他们将生活在一个全部的产品和服务都极度智能、高效的世界里,将没办法想象一个计算机没办法理解你的意思、没办法实现你想象的事的时代。」
日前,斯坦福 HAI 发布了 2025 年 AI 指数年度报告(The 2025 AI Index Report),认为「AI 对社会的影响从未如此明显」,AI 将成为 21 世纪最具变革性的技术。
在 12 个重要结论中,斯坦福 HAI 认为美国在生产顶级 AI 模型方面仍然处于领头羊,但中国正在缩小性能差距。
2024 年,美国相关机构生产了 40 个著名的 AI 模型,大大超过了中国的 15 个和欧洲的 3 个。尽管美国在数量上保持领先,但中国的 AI 模型在质量上迅速缩小了差距:在 MMLU 和 HumanEval 等主要基准上的性能差距从 2023 年的两位数缩小到 2024 年的接近持平。报告数据显示到 2024 年底,美国顶级 AI 模型的性能的优势仅剩 0.3%。
与此同时,中国在 AI 出版物和专利方面继续保持领先。并且模型开发日益全球化,中东、拉美和东南亚等地区都推出了引人注目的模型。
在中国(83%)、印度尼西亚(80%)和泰国(77%)等国家,绝大多数人认为 AI 产品和服务利大于弊。
相比之下,加拿大(40%)、美国(39%)和荷兰(36%)等地的乐观情绪仍然低得多。
不过,情绪正在发生明显的变化:自 2022 年以来,几个以前持怀疑态度的国家的乐观情绪明显地增强,包括德国(+10%)、法国(+10%)、加拿大(+8%)、英国(+8%)和美国(+4%)。
日前,微软首席技术官 Kevin Scott 参加了播客 20VC 的访谈节目,前者在交流中,分享了对未来「人类与 AI 共存的工作环境、状态」的预测。
整个访谈中,Kevin Scott 提到了很令人震惊的一点:到了 2030 年,将有 95% 的编程代码由 AI 生成。虽然观点很不可思议,但 Kevin Scott 随后也解释称,但这并不代表软件工程的工作完全由 AI 接管。他认为,在 AI 霸占「写代码」这件事上,人类将会由编译者变为指令引导者,简单来说就是化身为指挥家,命令 AI「干活」。
Kevin Scott 还表示,AI 并不会取代开发者,而是能从根本改变开发者的工作方式:开发者将不再像以前那样逐行编写代码,而是通过 AI 工具,运用提示词和指令生成对应所需的代码。Kevin Scott 表示,在这种新的工作模式下,研发人员将专注于引导 AI 而非手动编程。
此外,Kevin Scott 也承认了目前 AI 仍有十分多局限性(尤其是记忆能力)。但 Scott 仍愿意相信「这些局限性只是暂时的」,他预测未来的 AI 工具将在个性化和上下文感知方面做得更好,还可以通过学习过去的互动来提升性能,未来一年,AI 的记忆能力将大幅度的提高。