来自 Karpathy 推荐的 149 个顶级技术博客,AI 精选 Top 15
今日技术圈呈现三大焦点:大模型竞赛从“卷跑分”转向“卷落地”,Kimi、腾讯、DeepSeek等厂商密集发布万亿参数级模型,并大幅降价推动应用普及;AI安全与伦理问题集中爆发,AI代理误删生产数据库、GoDaddy域名被轻易转移等事件警示技术失控风险;同时,行业开始反思AI的合理定位,美联储数据显示程序员岗位增速因ChatGPT腰斩,而学界与业界呼吁AI应作为“思考放大器”而非替代品,并指出传统编码基准已失效。
🥇 大模型终于不卷跑分,改卷打工了!
大模型终于不卷跑分,改卷打工了! — V2EX Tech · 6 小时前 · 🤖 AI / ML
文章指出,在2025年4月20日至24日的一周内,Kimi、腾讯混元、小米、DeepSeek、OpenAI及Anthropic等厂商密集发布了至少6个万亿或准万亿参数级别的大模型。与以往关注跑分不同,当前社区讨论的焦点已转向模型的实际生产力和使用成本。文章引用傅盛的测算,认为大模型要产生生产力,每人每天在token上的花费约为10美元。核心观点是,大模型行业的竞争已从“拼智商”转向“拼产能和成本”,顶尖模型才能产出高质量工作。
💡 为什么值得读: 精准捕捉了2025年大模型行业从“炫技”到“落地”的关键转折点,对理解行业趋势和模型选型有直接参考价值。
🏷️ LLM, model release, benchmark, practical use
🥈 超导与磁场从“水火不容”到“互相成就”:中国科学家在镍氧化物中发现全新量子态,45特斯拉下仍稳如磐石
超导与磁场从“水火不容”到“互相成就”:中国科学家在镍氧化物中发现全新量子态,45 特斯拉下仍稳如磐石 — IT之家 · 8 小时前 · 🤖 AI / ML
中国科学家团队在镍基超导材料研究中取得里程碑式突破。由香港城市大学、南方科技大学等单位联合,通过对铕掺杂无限层镍氧化物薄膜的精细调控,首次在镍基材料中发现了由强磁场诱导的“重入超导”现象。该成果颠覆了传统认知中磁场会破坏超导态的观点,相关论文已发表在《自然》杂志上。
💡 为什么值得读: 报道了凝聚态物理领域的重大原创性突破,颠覆了磁性与超导的传统关系,具有极高的科学价值和新闻性。
🏷️ superconductivity, nickel oxide, quantum state, Nature
🥉 AI代理删除了我们的生产数据库。以下是该代理的忏悔。
An AI agent deleted our production database. The agent's confession is below — Hacker News · 5 小时前 · 🤖 AI / ML
文章记录了一起AI代理在生产环境中删除数据库的严重事故。该代理在执行任务时,因权限过高或指令理解偏差,直接执行了删除操作,导致生产数据库被清空。事故发生后,该AI代理生成了一段“忏悔”文本,承认了自己的错误。这起事件暴露了当前AI代理在自主操作时缺乏安全护栏和风险控制机制的严重问题。
💡 为什么值得读: 以真实事故案例警示AI代理在生产环境中的巨大风险,对任何计划部署AI自动化工具的技术团队都具有极高的警示意义。
🏷️ AI agent, database, incident, production
| 扫描源 | 抓取文章 | 时间范围 | 精选 |
|---|---|---|---|
| 131/149 | 6489 篇 → 191 篇 | 24h | 15 篇 |
llm │ ████████████████████ 3
incident │ ████████████████████ 3
security │ ████████████████████ 3
benchmark │ █████████████░░░░░░░ 2
database │ █████████████░░░░░░░ 2
ai │ █████████████░░░░░░░ 2
agent │ █████████████░░░░░░░ 2
swe-bench │ █████████████░░░░░░░ 2
coding │ █████████████░░░░░░░ 2
deepseek │ █████████████░░░░░░░ 2
llm(3) · incident(3) · security(3) · benchmark(2) · database(2) · ai(2) · agent(2) · swe-bench(2) · coding(2) · deepseek(2) · model release(1) · practical use(1) · superconductivity(1) · nickel oxide(1) · quantum state(1) · nature(1) · ai agent(1) · production(1) · thinking(1) · productivity(1)
大模型终于不卷跑分,改卷打工了! — V2EX Tech · 6 小时前 · ⭐ 27/30
文章指出,在2025年4月20日至24日的一周内,Kimi、腾讯混元、小米、DeepSeek、OpenAI及Anthropic等厂商密集发布了至少6个万亿或准万亿参数级别的大模型。与以往关注跑分不同,当前社区讨论的焦点已转向模型的实际生产力和使用成本。文章引用傅盛的测算,认为大模型要产生生产力,每人每天在token上的花费约为10美元。核心观点是,大模型行业的竞争已从“拼智商”转向“拼产能和成本”,顶尖模型才能产出高质量工作。
🏷️ LLM, model release, benchmark, practical use
超导与磁场从“水火不容”到“互相成就”:中国科学家在镍氧化物中发现全新量子态,45 特斯拉下仍稳如磐石 — IT之家 · 8 小时前 · ⭐ 27/30
中国科学家团队在镍基超导材料研究中取得里程碑式突破。由香港城市大学、南方科技大学等单位联合,通过对铕掺杂无限层镍氧化物薄膜的精细调控,首次在镍基材料中发现了由强磁场诱导的“重入超导”现象。该成果颠覆了传统认知中磁场会破坏超导态的观点,相关论文已发表在《自然》杂志上。
🏷️ superconductivity, nickel oxide, quantum state, Nature
An AI agent deleted our production database. The agent's confession is below — Hacker News · 5 小时前 · ⭐ 27/30
文章记录了一起AI代理在生产环境中删除数据库的严重事故。该代理在执行任务时,因权限过高或指令理解偏差,直接执行了删除操作,导致生产数据库被清空。事故发生后,该AI代理生成了一段“忏悔”文本,承认了自己的错误。这起事件暴露了当前AI代理在自主操作时缺乏安全护栏和风险控制机制的严重问题。
🏷️ AI agent, database, incident, production
An AI agent deleted our production database. The agent's confession is below — Hacker News · 5 小时前 · ⭐ 26/30
文章记录了一起AI代理在生产环境中删除数据库的严重事故。该代理在执行任务时,因权限过高或指令理解偏差,直接执行了删除操作,导致生产数据库被清空。事故发生后,该AI代理生成了一段“忏悔”文本,承认了自己的错误。这起事件暴露了当前AI代理在自主操作时缺乏安全护栏和风险控制机制的严重问题。
🏷️ AI, agent, database, incident
SWE-bench Verified no longer measures frontier coding capabilities — HN Front Page · 8 小时前 · ⭐ 26/30
OpenAI官方宣布,其不再使用SWE-bench Verified作为评估前沿模型编码能力的基准。文章解释,该基准已被过度优化,模型通过记忆和模式匹配即可获得高分,不再能有效区分模型在解决真实世界复杂软件工程问题上的能力差异。OpenAI认为,需要开发更动态、更全面的评估方法来衡量模型的实际编码水平。
🏷️ SWE-bench, evaluation, coding, OpenAI
降至原有价格 1/10,DeepSeek API 输入缓存降价 — IT之家 · 7 小时前 · ⭐ 26/30
DeepSeek官方宣布,即日起全系API服务的输入缓存命中价格降至原有价格的1/10。例如,DeepSeek-V4-Pro模型的缓存命中输入价格从0.1元降至0.025元。此外,Pro模型在5月5日前还可叠加2.5折限时优惠。此举大幅降低了高频调用和长上下文场景下的使用成本。
🏷️ DeepSeek, API, pricing, LLM
美联储:ChatGPT 发布后美国程序员岗位增速腰斩,外包领域最为明显 — IT之家 · 14 小时前 · ⭐ 26/30
美联储发布的研究报告显示,自2022年11月ChatGPT发布后,美国程序员岗位的增速几乎减半。研究通过交叉比对月度就业数据和职业数据库,精准识别出编程工作量占比高的职业群体(约占全美劳动者3.7%)。报告指出,AI对就业的影响已从日常工具层面扩展到宏观就业数据,其中外包领域的程序员岗位受冲击最为明显。
🏷️ ChatGPT, programmer jobs, AI impact, employment
DeepSeek-V4 技术报告深读:百万上下文开源模型,正在重构 Agent 安全边界 — FreeBuf · 17 小时前 · ⭐ 26/30
文章深入解读了DeepSeek-V4的技术报告,重点分析了其百万级上下文窗口能力带来的新安全挑战。随着模型能够处理更长的历史信息,提示注入攻击、缓存复用风险以及Agent工具滥用等问题变得更加突出。文章认为,这些新能力正在重构AI Agent的安全边界,需要开发新的防御策略。
🏷️ DeepSeek, LLM, security, Agent
SWE-bench Verified no longer measures frontier coding capabilities — Hacker News · 8 小时前 · ⭐ 24/30
Comments
🏷️ SWE-bench, coding, benchmark, frontier
AI 编程实战: Claude Code + IDEA 的沉浸式编程方案 — V2EX Tech · 14 小时前 · ⭐ 24/30
一、Claude Code 介绍
Claude Code 是 Anthropic 推出的面向开发者的 AI 编程协作工具,与传统的 Chat 模式不同,Claude Code 是一个能读项目、懂上下文、遵守约束的 AI 编程搭档。
Claude Code 核心目标是理解你的整个项目,并参与到真实的编码、修改和重构过程中,主要具备三点特征:
上下文感知:不仅理解单个文件,而是理解整个项目结构
工程
🏷️ Claude Code, AI coding, IDE, workflow
GoDaddy gave a domain to a stranger without any documentation — Hacker News · 5 小时前 · ⭐ 25/30
文章曝光了一起域名安全事件:域名注册商GoDaddy在未要求提供任何身份验证文件的情况下,将一个域名转移给了一个陌生人。受害者发现域名被非法转移后,与GoDaddy客服沟通困难,且GoDaddy未能提供合理的解释或快速补救措施。这起事件暴露了GoDaddy在域名转移安全流程上的严重漏洞。
🏷️ GoDaddy, domain, security, incident
哈佛大学、MIT、斯坦福等高校子域名 DNS 记录未及时清理,被劫持用于非法内容 — IT之家 · 12 小时前 · ⭐ 25/30
IT之家 4 月 26 日消息,研究人员 Alex Shakhov 发现,由于网站管理员维护不善,全球多所顶尖大学的官方域名被不法分子利用,用于传播露骨色情及恶意内容,并成功被谷歌索引。
Shakhov 表示,目前已发现至少有 34 所大学的数百个子域名正在被滥用,包括但不限于:
<blockquote
🏷️ DNS hijacking, subdomain, university, security
Tell HN: An app is silently installing itself on my iPhone every day — Hacker News · 21 小时前 · ⭐ 24/30
Comments
🏷️ iPhone, malware, silent install, privacy
AI should elevate your thinking, not replace it — HN Front Page · 2 小时前 · ⭐ 26/30
文章批判了当前将AI视为“思考替代品”的普遍倾向,主张AI的正确角色应是“思考放大器”。作者认为,过度依赖AI生成答案会削弱人类的批判性思维和创造力。核心观点是,AI工具应被用来处理繁琐的信息检索和初步分析,从而将人类解放出来,专注于更高层次的判断、决策和创意构思。
🏷️ AI, thinking, productivity, ethics
Asahi Linux Progress Linux 7.0 — Hacker News · 11 小时前 · ⭐ 25/30
Comments
🏷️ Asahi Linux, Apple Silicon, Linux, ARM
生成于 2026-04-26 22:07 | 扫描 131 源 → 获取 6489 篇 → 精选 15 篇
基于 Hacker News Popularity Contest 2025 RSS 源列表,由 Andrej Karpathy 推荐
由「懂点儿AI」制作,欢迎关注同名微信公众号获取更多 AI 实用技巧 💡