📰 AI 博客每日精选 — 2026-04-15

来自 Karpathy 推荐的 149 个顶级技术博客,AI 精选 Top 15

📝 今日看点

今日技术圈聚焦于AI基础设施的竞争与安全挑战。英伟达CEO阐述了其在AI芯片供应链的战略布局,同时业界正积极推动大模型架构创新以提升效率。另一方面,AI技术的滥用引发深度伪造校园危机,而智能体与LLM应用的快速发展也暴露出新的安全漏洞与评估瓶颈,凸显了技术伦理与治理的紧迫性。


🏆 今日必读

🥇 黄仁勋访谈:TPU竞争、为何应向中国出售芯片,以及英伟达的供应链护城河

Jensen Huang – TPU competition, why we should sell chips to China, & Nvidia’s supply chain moat — dwarkesh.com · 6 小时前 · 🤖 AI / ML

英伟达CEO黄仁勋讨论了公司在AI芯片领域的竞争格局与供应链战略。他解释了为何继续向中国销售芯片符合商业逻辑,并阐述了英伟达通过多年投资构建的供应链“护城河”,使其能够应对未来万亿美元规模的业务需求。黄仁勋认为,强大的供应链能力是英伟达应对竞争和满足全球需求的关键优势。

💡 为什么值得读: 通过CEO的深度访谈,直接了解全球AI芯片霸主对地缘政治、商业竞争和核心竞争力的第一手思考。

🏷️ Nvidia, AI Chips, Supply Chain

🥈 Nemotron 3 Super:用于智能体推理的开放、高效的混合Mamba-Transformer专家混合模型

Nemotron 3 Super: Open, Efficient Mixture-of-Experts Hybrid Mamba-Transformer Model for Agentic Reasoning — arXiv ML · 18 小时前 · 🤖 AI / ML

论文介绍了Nemotron 3 Super,一个1200亿参数(激活120亿)的混合Mamba-注意力专家混合模型。该模型是Nemotron 3系列中首个使用NVFP4格式进行预训练的模型,并采用了新的LatentMoE架构,以优化每FLOP和每参数的准确率。此外,模型还包含MTP层以实现推理加速,涵盖了预训练、后训练和量化全过程。

💡 为什么值得读: 了解前沿大模型如何融合Mamba与Transformer架构,并通过创新的LatentMoE设计在效率与性能间取得平衡。

🏷️ LLM, MoE, Mamba, agentic reasoning

🥉 校园深度伪造裸照危机:远比想象中严重

The Deepfake Nudes Crisis in Schools Is Much Worse Than You Thought — Wired · 12 小时前 · 🤖 AI / ML

WIRED与Indicator的分析揭示,AI生成的深度伪造裸照已构成全球性的校园危机。调查发现全球近90所学校和至少600名学生受到影响,且问题没有消退的迹象。这些伪造图像主要通过社交媒体和消息应用传播,对受害者造成严重的心理伤害。这表明现有的法律和技术防护措施远远不足以应对此威胁。

💡 为什么值得读: 基于具体数据的调查报告,揭示了AI滥用对青少年造成的真实、广泛且日益严重的伤害,具有强烈的社会警示意义。

🏷️ deepfake, AI ethics, schools


📊 数据概览

扫描源 抓取文章 时间范围 精选
133/149 7439 篇 → 890 篇 24h 15 篇

分类分布

pie showData title "文章分类分布" "🤖 AI / ML" : 9 "🔒 安全" : 4 "🛠 工具 / 开源" : 1 "⚙️ 工程" : 1

高频关键词

xychart-beta horizontal title "高频关键词" x-axis ["llm", "supply chain", "agents", "ai security", "backdoor", "reasoning", "vulnerabilities", "microsoft", "nvidia", "ai chips", "moe", "mamba"] y-axis "出现次数" 0 --> 8 bar [6, 3, 2, 2, 2, 2, 2, 2, 1, 1, 1, 1]
📈 纯文本关键词图(终端友好)
llm             │ ████████████████████ 6
supply chain    │ ██████████░░░░░░░░░░ 3
agents          │ ███████░░░░░░░░░░░░░ 2
ai security     │ ███████░░░░░░░░░░░░░ 2
backdoor        │ ███████░░░░░░░░░░░░░ 2
reasoning       │ ███████░░░░░░░░░░░░░ 2
vulnerabilities │ ███████░░░░░░░░░░░░░ 2
microsoft       │ ███████░░░░░░░░░░░░░ 2
nvidia          │ ███░░░░░░░░░░░░░░░░░ 1
ai chips        │ ███░░░░░░░░░░░░░░░░░ 1

🏷️ 话题标签

llm(6) · supply chain(3) · agents(2) · ai security(2) · backdoor(2) · reasoning(2) · vulnerabilities(2) · microsoft(2) · nvidia(1) · ai chips(1) · moe(1) · mamba(1) · agentic reasoning(1) · deepfake(1) · ai ethics(1) · schools(1) · openai(1) · sdk(1) · development(1) · testing(1)


🤖 AI / ML

1. 黄仁勋访谈:TPU竞争、为何应向中国出售芯片,以及英伟达的供应链护城河

Jensen Huang – TPU competition, why we should sell chips to China, & Nvidia’s supply chain moatdwarkesh.com · 6 小时前 · ⭐ 27/30

英伟达CEO黄仁勋讨论了公司在AI芯片领域的竞争格局与供应链战略。他解释了为何继续向中国销售芯片符合商业逻辑,并阐述了英伟达通过多年投资构建的供应链“护城河”,使其能够应对未来万亿美元规模的业务需求。黄仁勋认为,强大的供应链能力是英伟达应对竞争和满足全球需求的关键优势。

🏷️ Nvidia, AI Chips, Supply Chain


2. Nemotron 3 Super:用于智能体推理的开放、高效的混合Mamba-Transformer专家混合模型

Nemotron 3 Super: Open, Efficient Mixture-of-Experts Hybrid Mamba-Transformer Model for Agentic ReasoningarXiv ML · 18 小时前 · ⭐ 27/30

论文介绍了Nemotron 3 Super,一个1200亿参数(激活120亿)的混合Mamba-注意力专家混合模型。该模型是Nemotron 3系列中首个使用NVFP4格式进行预训练的模型,并采用了新的LatentMoE架构,以优化每FLOP和每参数的准确率。此外,模型还包含MTP层以实现推理加速,涵盖了预训练、后训练和量化全过程。

🏷️ LLM, MoE, Mamba, agentic reasoning


3. 校园深度伪造裸照危机:远比想象中严重

The Deepfake Nudes Crisis in Schools Is Much Worse Than You ThoughtWired · 12 小时前 · ⭐ 27/30

WIRED与Indicator的分析揭示,AI生成的深度伪造裸照已构成全球性的校园危机。调查发现全球近90所学校和至少600名学生受到影响,且问题没有消退的迹象。这些伪造图像主要通过社交媒体和消息应用传播,对受害者造成严重的心理伤害。这表明现有的法律和技术防护措施远远不足以应对此威胁。

🏷️ deepfake, AI ethics, schools


4. Local-Splitter:针对编码智能体工作负载,减少云端LLM令牌使用的七种策略测量研究

Local-Splitter: A Measurement Study of Seven Tactics for Reducing Cloud LLM Token Usage on Coding-Agent WorkloadsarXiv AI · 18 小时前 · ⭐ 26/30

研究系统性地测量了七种策略,用于在小型本地模型作为前沿云端模型前置分流层时,减少云端LLM的令牌使用量。这些策略包括本地路由、提示压缩、语义缓存、本地起草云端审查、最小差异编辑、结构化意图提取以及利用供应商提示缓存的批处理。所有策略均在一个开源垫片库中实现并进行评估。

🏷️ LLM, token usage, cost optimization, coding agent


5. 模拟即监督:用于科学发现的机制化预训练

Simulation as Supervision: Mechanistic Pretraining for Scientific DiscoveryarXiv AI · 18 小时前 · ⭐ 26/30

研究旨在解决科学建模中机制理论的可解释性与机器学习的预测能力之间的权衡问题。现有混合方法通过将领域知识作为函数约束融入机器学习,但依赖于精确的数学规范,当底层方程部分未知或设定错误时,刚性约束会限制模型。本文提出一种新方法,利用模拟作为监督信号进行预训练,以学习更灵活的机制化表示。

🏷️ scientific discovery, mechanistic model, pretraining, hybrid AI


6. 重新思考大语言模型的同策略蒸馏:现象、机制与方案

Rethinking On-Policy Distillation of Large Language Models: Phenomenology, Mechanism, and RecipearXiv ML · 18 小时前 · ⭐ 26/30

论文系统研究了同策略蒸馏的训练动态与机制,这是大语言模型后训练中的一项核心技术。研究首先确定了OPD成功与否的两个条件:师生模型需具备兼容的思维模式;即使思维一致且分数更高,学生也可能因过度模仿教师的表面风格而非内在推理过程而失败。基于此,论文提出了改进的蒸馏方案。

🏷️ LLM, Knowledge Distillation, Training Dynamics


7. 超越输出正确性:在编码任务中基准化评估大语言模型的推理能力

Beyond Output Correctness: Benchmarking and Evaluating Large Language Model Reasoning in Coding TasksarXiv ML · 18 小时前 · ⭐ 26/30

研究指出,当前缺乏专门用于评估LLM在编码任务中推理质量的基准。现有推理评估器并非为编码设计,且基准多集中于代码生成。为此,研究者引入了CodeRQ-Bench,这是首个用于评估LLM在三大编码任务类别中推理质量的基准,旨在更全面地衡量模型的推理过程而不仅仅是最终输出。

🏷️ LLM, code generation, reasoning, evaluation


8. Olmo 3

Olmo 3arXiv ML · 18 小时前 · ⭐ 26/30

Olmo 3 是一个包含 7B 和 32B 参数规模的最新、完全开源的语言模型家族。该模型构建目标涵盖长上下文推理、函数调用、编码、指令遵循、通用对话和知识回忆。此次发布包含了完整的模型流程,即模型家族构建的完整生命周期,涉及每个阶段、检查点、数据点和依赖项。这标志着在模型透明度和可复现性方面迈出了重要一步。

🏷️ LLM, open-source, Olmo, reasoning


9. 啃了那篇 54 页的 Agent Harness 综述,给大伙讲个省流版

啃了那篇 54 页的 Agent Harness 综述, 给大伙讲个省流版V2EX Tech · 18 小时前 · ⭐ 26/30

一篇题为《LLM Agent 中的外化》的 54 页综述,用认知科学框架将 Memory、Skills、Protocols、Harness 等工程趋势统一起来。其核心论点是 LLM 智能体的发展是一个将能力从模型内部“外化”到运行环境的过程。文章梳理了将能力外化到工具、环境中的实践与发展脉络。这为理解当前分散的智能体工程实践提供了一个统一的理论视角。

🏷️ LLM Agent, Survey, Externalization, Harness


🔒 安全

10. 智能体领域的恶意:深入AI供应链后门漏洞

Malice in Agentland: Down the Rabbit Hole of Backdoors in the AI Supply ChainarXiv AI · 18 小时前 · ⭐ 26/30

研究揭示了在交互数据上微调AI智能体带来的严重供应链安全漏洞。攻击者可以在数据收集管线的多个阶段进行投毒,植入难以检测的后门,触发时会导致不安全或恶意行为。论文形式化了三种现实的威胁模型,并展示了这种攻击在智能体场景下的有效性,警示了AI供应链的安全风险。

🏷️ AI security, supply chain, backdoor, AI agents


11. Agentland 中的恶意:深入探究 AI 供应链中的后门漏洞

Malice in Agentland: Down the Rabbit Hole of Backdoors in the AI Supply ChainarXiv ML · 18 小时前 · ⭐ 26/30

在交互数据上微调 AI 智能体会引入供应链安全漏洞。攻击者可在数据收集管道的多个阶段植入难以检测的后门,一旦触发便导致不安全或恶意行为。研究形式化了三种现实的威胁模型,揭示了通过数据投毒攻击智能体系统的具体路径。这表明依赖外部数据进行能力提升的智能体范式存在根本性的安全风险。

🏷️ AI security, backdoor, supply chain, agents


12. 四月补丁星期二修复 SAP、Adobe、微软、Fortinet 等产品的严重漏洞

April Patch Tuesday Fixes Critical Flaws Across SAP, Adobe, Microsoft, Fortinet, and MoreThe Hacker News · 9 小时前 · ⭐ 26/30

四月补丁星期二集中修复了 Adobe、Fortinet、微软和 SAP 产品中的一系列严重漏洞。其中最严重的是影响 SAP Business Planning and Consolidation 及 SAP Business Warehouse 的 SQL 注入漏洞(CVE-2026-27681,CVSS 评分 9.9),可导致任意数据库命令执行。这些漏洞若被利用,可能对使用这些企业级软件的组织造成重大安全风险。用户和管理员必须优先应用这些关键补丁。

🏷️ Patch Tuesday, vulnerabilities, SAP, Microsoft


13. 微软发布补丁修复 SharePoint 零日漏洞及其他 168 个新漏洞

Microsoft Issues Patches for SharePoint Zero-Day and 168 Other New VulnerabilitiesThe Hacker News · 13 小时前 · ⭐ 26/30

微软本月发布了创纪录的 169 个安全漏洞补丁,其中包含一个已被在野利用的零日漏洞。在这 169 个漏洞中,157 个被评为“重要”,8 个为“严重”,3 个为“中等”,1 个为“低危”。其中 93 个漏洞允许权限提升,24 个可导致远程代码执行。这表明微软产品面在近期面临着广泛而严峻的安全威胁。所有用户应立即评估并部署相关更新。

🏷️ Microsoft, zero-day, SharePoint, vulnerabilities


🛠 工具 / 开源

14. 智能体SDK的下一阶段演进

The next evolution of the Agents SDKOpenAI Blog · 12 小时前 · ⭐ 26/30

OpenAI发布了其智能体SDK的重大更新,核心是引入了原生沙箱执行环境和模型原生框架。新特性旨在帮助开发者构建更安全、能够长期运行、并可跨文件和工具操作的智能体。此次升级简化了复杂智能体的开发流程,并增强了其运行时的安全性与可控性。

🏷️ OpenAI, Agents, SDK, development


⚙️ 工程

15. 基于LLM的谷歌集成测试故障自动化诊断

LLM-Based Automated Diagnosis Of Integration Test Failures At GooglearXiv AI · 18 小时前 · ⭐ 26/30

针对复杂软件系统集成测试故障诊断的挑战,谷歌研究团队提出利用大语言模型进行自动化诊断。集成测试日志具有海量、非结构化和异构的特点,导致诊断认知负荷高、信噪比低且耗时。该方法旨在解决开发者长期抱怨的这些问题,并显著减少在诊断上花费的大量时间。

🏷️ LLM, testing, debugging, automation


生成于 2026-04-15 22:29 | 扫描 133 源 → 获取 7439 篇 → 精选 15 篇
基于 Hacker News Popularity Contest 2025 RSS 源列表,由 Andrej Karpathy 推荐
由「懂点儿AI」制作,欢迎关注同名微信公众号获取更多 AI 实用技巧 💡