中国高端芯片性能仍远落后于英伟达
中国现有的高性能芯片性能仍只是英伟达领先芯片的一小部分。 而且,建立规模化且复杂的半导体供应链实际上非常、非常困难。 --Paulina McPadden,Baillie Gifford 投资经理
中国现有的高性能芯片性能仍只是英伟达领先芯片的一小部分。 而且,建立规模化且复杂的半导体供应链实际上非常、非常困难。 --Paulina McPadden,Baillie Gifford 投资经理
据彭博社报道,AI编程软件Cursor年销售额已突破30亿美元,并正与SpaceX洽谈一项约600亿美元的收购交易。这笔交易的战略意义远超财务投资:对于正准备启动史上最大规模IPO之一的SpaceX而言,收购Cursor能将其对AI算力的巨额投资故事变得完整。它向投资者证明,SpaceX不仅能建设算力,更能将其转化为面向企业开发者的软件产品和收入流,这与其从航天承包商转型为"平台公司"的IPO叙事高度契合。交易结构特殊,包含高达10亿美元的潜在分手费,显示了双方的严肃态度。
VSCode团队提出Agent-First Development框架,核心理念是开发主体从"人+编辑器"转向"人+Agent+编辑器",人的角色转变为选择模型、提供上下文、定义意图和设定边界。五大支柱为:模型(匹配任务深度,按需选择思考档位)、执行边界(从问答到自主规划的渐进信任模式)、上下文(显式提供关键信息以避免错误)、提示(需清晰包含目标、范围与约束)与工具(能力需可控、可审计)。该框架旨在系统化指导人与AI代理高效协作开发。
Agent-Native Infra Forum | Qwen Conference 2026 为自主智能重构云技术栈。加入在新加坡金沙会展中心举办的会议,探索专为智能体打造的硬件、内存与扩展基础设施。 👉 立即预约席位:https://click.qwencloud.com/m/20000000190/
推文批评X平台产品经理能力不足,发布文章体验糟糕。引用推文显示,开发者利用ChatGPT(通过codex/goal)开发了Markdown转换插件,允许用户拖拽文件快速生成X文章格式,以改善发布流程。该插件开源并提供谷歌插件版本,旨在解决原生体验的痛点。
Grok 进展 Grok Imagine Agent Mode 现已在 Grok iOS 应用上推出。 借助 Agent Mode,你可以生成: • 跨代际一致的角色 • 同一角色的多场景画面 • 不同的镜头角度和环境 • 更具电影感和连贯性的叙事视觉效果 这是角色一致性和 AI 生成叙事方面的一次重大升级。 现在就在 Grok iOS 应用中尝试吧。
一篇关于多流大型语言模型的新研究论文提出了将提示处理、推理计算以及输入输出过程进行分离与并行化的架构设计。该方法旨在提升大型语言模型在处理复杂任务时的效率与可扩展性,为构建更灵活、高效的AI系统提供了新的技术思路。
@deepseek_ai V4 Flash 刚刚登顶 @OpenRouter 榜首--3.02T tokens,本周增长109%。 如果你还没试过,现在是个好时机。 更多信息⬇️
本次分享开源了8套被称作"神级"的Prompt模板,宣称总价值超过万元。这些模板覆盖了工作、生活、学习、副业等多领域场景,包括KERNEL-X、AI工作流专家、深度研究等具体系统,旨在帮助用户提升效率、解决实际问题,实现从焦虑到豁然开朗的状态转变。
HMD 在印度推出首款智能手机 Vibe 2 5G,首次预装印度 AI 公司 Sarvam 开发的聊天机器人 Indus。Indus 基于 1050 亿参数大模型构建,支持 22 种印度语言,并允许在同一句话中混合使用印地语与英语。目前,Indus 仅支持在线使用,且尚未与手机系统进行深度整合。这款手机定位中端,配备 6000 毫安时电池,售价为 10999 卢比(约合 772.6 元人民币)。HMD 计划未来将 Indus 预装至更多 Vibe 系列机型,并计划推出整合该 AI 功能的功能机,旨在通过低价硬件推动本土 AI 助手在印度市场的普及。
针对网络流传的腾讯文档裁员信息,知情人士回应称,这是以深圳为核心对部分区域职场团队进行的调整,并非整体裁员。调整原因为进一步聚焦AI业务战略、加快产品团队协同效率。公司已与受影响员工充分沟通,并开放深圳、北京等地的内部活水转岗机会,将征求并尊重员工个人意愿。腾讯文档于2018年推出,并于2025年3月与腾讯元宝打通实现功能集成。
科大讯飞智能体耳机 Air 发售:一键录音转文字、支持 AI 翻译,1051 元
小红书可以直接上传 Skill 了,这个太屌了,感觉是个很大的事件。
网易有道开源Confucius4双模型,包括一个专注数学视觉推理的多模态模型,以及一个用于语音克隆的TTS模型。此次开源直接提供完整权重,而非仅提供API,强调在工程精度和实际部署成本上的投入,而非单纯追求参数规模。模型已发布于HuggingFace和GitHub平台。
OWC发布雷电5 AI加速器与存储中心Stack AI,该产品可通过高速闪存扩展本机GPU可用工作内存,使本地设备能够运行参数规模超出板载显存容量的AI模型。接口方面配备1个60W输出雷电5上行口、3个雷电5下行口和3个USB-A 10Gbps。产品将于COMPUTEX 2026首次实物展示,并计划在2026年第四季度发售。
美团技术团队开源了数字人视频生成模型 LongCat-Video-Avatar 1.5。该版本在唇形同步、物理合理性、长视频稳定性和多人互动方面全面升级,支持复杂语音输入与多种主体。通过 DMD 蒸馏技术,推理效率提升约 15 倍,生成 10 秒视频仅需约 1 分钟。在性能评测中,模型在四个关键维度表现领先,用户偏好对比中胜率均超 54%,旨在推动数字人视频从技术演示走向商业应用。
据泄露的VLSI 2026摘要,英特尔、力积电与软银旗下SAIMEMORY将联合展示Via-in-One TSV新型3D DRAM堆叠方案。该架构目标是实现约0.25 Tb/s/mm2的高带宽,同时将数据传输功耗控制在0.35 W/mm2以下,以解决AI和高性能计算中显存带宽与功耗的矛盾。据称,完整的9层DRAM堆叠已完成功能验证与可靠性测试。
试图回忆在Codex出现之前编程是什么感觉
说个热知识吧~ 很多海外的功能免费,国内收费😂 记得当年做TikTok的时候就天天拿CapCut来剪视频。 并且看到CapCut & Google 合作也是证明这几年做的东西得到国际市场和用户的认可。
DeepSeek V4 Flash已登顶周排行榜
字节跳动开源了轻量级多模态模型Lance,其激活参数量为3B。该模型采用原生统一架构,在训练阶段即整合图像与视频的理解、生成及跨模态编辑功能。Lance通过双流专家设计和模态感知旋转位置编码等技术,平衡了理解任务所需的高层语义与生成任务所需的低层连续表示。模型训练共分四阶段,数据规模约1.9T标记,计算预算控制在128张GPU内。基准测试表明,Lance在图像生成、视频生成、图像编辑及视频理解等多项任务中表现突出。该模型权重已依据Apache 2.0协议开源。
LUCIUS是一款AI工具,旨在解决Agent因上下文组织无序产生的问题。它通过三大核心功能:记忆(整合成员跨平台完整历史)、上下文应用(自动应用企业简报知识)与自主判断(权限内自主互动或交由人工决策),将"首席上下文官"概念产品化。该工具能实现7x24小时社区管理,显著降低人力成本,将"上下文是AI时代组织间最大差距"这一观点落地为实际产品。
探讨了墨水屏硬件作为低功耗副屏的创新应用场景。设备开机时,可作为AI信息显示终端,自动接收并展示待办事项、日历等推送信息,便于用户快速查阅;关机后则转变为电子名片,利用墨水屏的静态显示特性方便线下社交扫码。该方案通过"磁吸"方式灵活部署,旨在将硬件功能打包为可复用的技能模块。
Codex是我们的WorkGPT。
安克影音推出 Nebula SpaceFlow 配件,配合 AI 生成 3D 投影场景
岚图汽车发布了全新纯电轿跑SUV"追光S"的官方图片,计划于2026年年中上市。新车尺寸为5050/1998/1656毫米,轴距达3000毫米,设计主打运动风格,配备无框车门与21英寸轮圈。智能驾驶搭载华为乾崑ADS 5系统,其配备的华为896线激光雷达具备120米外识别14厘米高障碍物的能力。动力提供单电机(300千瓦)与双电机四驱(综合475千瓦)版本,零百加速有望进入3秒级,全系采用800V高压平台与磷酸铁锂电池。
本文指出当前AI应用存在一个"生产力悖论":个人使用AI工具效率大幅提升,但组织整体效能却未同步增长。核心原因在于,组织普遍缺乏有效的"记忆系统",导致大量时间(据MIT报告超30%)被消耗在重复构建上下文中,使个体提升的效率无法在组织层面累加与沉淀。MIT报告显示,高达95%的企业AI投入未产生可衡量回报。作者认为,未来竞争的关键不在于使用最强的AI模型,而在于构建最深厚的"组织记忆",将对话、决策等资产系统化沉淀,这比单纯追求工具本身更为重要。
谷歌在 I/O 开发者大会后调整了 Gemini 的计费规则,自5月17日起,原先按"每日提示词次数"计量的配额改为"按算力消耗"计算,并将请求复杂度、功能调用和聊天历史长度纳入计量范围。此举引发大量 Pro 和 Ultra 付费用户投诉,称在处理密集任务时更易触及配额限制。谷歌随后回应,已为付费用户重置本周配额,并宣布将永久上调配额至原来的3倍。该调整目前已开始分批生效。
有趣的是,整个"草莓"事件(后来证实是o1-preview)在发布时被斥为过度炒作,但事后看来,它其实被严重低估了。 从模型连基础数学都不会,到18个月内解决未解数学问题,这是一条清晰的进化路径。
美国联邦贸易委员会(FTC)宣布,Cox Media Group、MindSift和1010 Digital Works三家公司因虚假宣传其"Active Listening" AI营销服务,将支付近100万美元罚款以和解指控。这些公司声称该服务能通过智能设备实时监听用户对话,并结合行为数据进行精准广告投放。然而,FTC调查发现,该服务实际上从未监听对话或使用语音数据,也未能准确投放广告。其真实操作仅为加价转售从其他数据经纪商处购买的电子邮件列表。
Codex 发布了史诗级更新,显著提升了开发体验。核心新功能包括:快捷截图通过组合键自动捕获窗口并添加上下文,内置浏览器支持高级注释模式可直接编辑页面元素,/goal 功能允许设定目标后持续执行任务数小时至数天,以及团队共享插件实现批量安装。这些更新优化了工具效率,使得藏师傅的 PPT Skills 能高效一键直出 3:4 介绍图片。
第四届中国国际供应链促进博览会将于6月22日至26日在北京举行,主题为"链接世界,共创未来"。本届首次设立人工智能专区,集聚多家领军企业。澳大利亚首次担任主宾国。以杭州"六小龙"为代表的浙江企业将展示前沿成果,安徽重点展示"人工智能+制造",湖北将呈现具身智能产业链。优必选人形机器人成为官方首个"硅基代言人"。雄安新区首次独立参展,预计首发首展首秀超过160项。
我想稍微反驳一下:因为模型如此出色且不断进步,它们不必成为产品本身。 但模型才是主要的驱动力。如果它们没有如此全面的能力,实验室围绕它们构建的框架和应用程序将难以构建,也无法正常工作。
时间到了 Claude 又炸了
DeepSeek正推进700亿元人民币的巨额融资,估值约450亿美元。创始人梁文锋承诺将继续开源开发AI模型,不追求短期商业化,目标是技术升级与通用人工智能。腾讯、IDG资本等接近参投,梁文锋个人可能注资200亿元。若成功将创下中国科技初创公司首轮融资纪录。
为回应用户对每周配额用尽的担忧,Antigravity平台已将所有付费层级的Gemini每周配额再次提升至三倍,并已完成配额重置。此前该平台曾三倍提高限制以支持用户更持续地开发,此次更新旨在进一步保障用户的使用空间。
更新:所有付费@Antigravity层级的*每周*Gemini配额已再次提升至三倍,且配额已正式重置。
Codex发布重要更新,核心提升在于上下文获取与任务自动化。新推出的"Appshots"功能,通过同时按住左右Command键,即可截取当前窗口并将屏幕内外的可见与不可见文本一并自动填入对话,极大简化背景提供流程。已正式上线的"/goal"功能支持设定长期目标,Codex可持续自主执行数小时至数天,且允许中途调整与暂停。此外,应用内浏览器速度提升,并新增可直接编辑页面元素的高级注释模式。团队版本则新增了批量安装插件的功能,提升了协作效率。
Comscore报告显示,2026年3月美国桌面端AI聊天机器人总用户达4440万,环比增长超21%。ChatGPT以3386万独立访客稳居第一,环比增18.9%。Anthropic的Claude增长迅猛,环比猛增130.1%至266万访客,跃升至第四名。Google Gemini、Microsoft Copilot分别以1066万和502万访问量位列第二、三位。
OpenAI宣布Codex的/goal模式已结束实验,成为稳定功能。用户可在Codex应用、IDE扩展或CLI中使用,通过设定具体里程碑,让AI持续工作直至完成,任务可运行数小时甚至数天。过程中支持随时检查、调整方向及暂停。使用前需升级应用并启用该功能(可通过命令行指令或手动修改配置文件实现)。开启后,可在输入框管理任务,并利用侧边对话查看进度而不中断主任务。该功能旨在高效处理各类复杂任务。
模型本身已不再是产品
江苏镇江网友使用豆包App预约餐厅后到店被拒,引发对AI"幻觉"现象的讨论。豆包官方回应称其App暂不支持实际餐厅预约。努比亚总裁倪飞发布视频回应,指出豆包App可能尚不支持真实预约功能,但搭载豆包手机助手的努比亚M153(豆包手机)可执行此类操作。在演示中,该手机通过系统级集成,根据用户语音指令自动完成餐厅筛选与预订,体现了AI指令直达服务终点的能力。努比亚M153是与字节跳动合作的工程样机,此前曾限量发售。
国家发改委政策研究室副主任李超在新闻发布会上明确指导方向:针对人工智能领域技术与需求的快速增长,发改委将指导国产大模型加大力度适配国产算力芯片。此举旨在推动人工智能与经济社会各领域深度融合的同时,确保我国AI发展的自主可控与向善发展。此前,发改委已联合国家能源局发布相关指导意见,推动AI在电网等关键领域的深度应用。
海康存储发布五盘位AI私有云NAS MAGE50X,到手价1495.12元。该产品搭载8nm制程集成NPU的8核处理器,支持8K 30FPS解码与4K 60FPS编码。配备4GB内存、64GB eMMC闪存及铝制机身,提供包括2.5GbE在内的多种接口。支持多种RAID模式,并集成了AI智能监控、智能相册、智能搜索等丰富的AI功能。
一篇博客文章发布在zeroshot.bearblog.dev,题为"谷歌的'IBM化'?",探讨谷歌是否正经历类似IBM的官僚化转型。该文在黑客新闻平台以102点的热度引发讨论,聚焦于谷歌从高速创新向稳定企业结构的潜在转变,并分析数字指标显示科技巨头在规模扩张中可能面临的共性挑战,如创新瓶颈和战略调整。文章通过对比分析,预示了谷歌未来发展的不确定性和行业影响。
全球首款眼神交互仿生人"小月"(型号X-Head 1)于5月22日上架京东拍卖,起拍价1元,需缴纳500元保证金,将于当晚8点开拍。该产品由松延动力推出,重7.5公斤,拥有24个自由度,可实现交互对话,并具备口型、眼神及情绪等多模态交互能力,其核心仿生技术承袭自春晚亮相的同款机器人"蔡明"。官方标价为9.9万元。
该通知宣布Antigravity的限额再次提升至原有标准的三倍,此次调整覆盖每周配额上限。同时,针对用户反馈的"几轮工作后可能触及每周配额上限"的顾虑,平台已为所有付费计划进一步三倍提升每周Gemini配额,并同步重置了当前配额。此举旨在为开发者提供更充足的使用空间,鼓励其持续投入项目构建。
英特尔已确认其基于 Intel 18A 制程的下一代数据中心处理器 Clearwater Forest(Xeon 6+)全面投产,目标于今年内推出。该处理器面向 6G 与边缘 AI 负载,采用 Darkmont E-Core 架构,最高支持 288 核并配备 576MB 封装内 L3 缓存。在性能方面,与上一代双路平台相比,其单颗处理器可使机架功耗降低 38%,每瓦性能提升超过 60%,整体性能提升 30%。它最高支持 12 通道 DDR5 内存和 96 条 PCIe 5.0 通道。
智谱近期推出GLM-5.1-Highspeed模型,实测输出速度达300+ tokens/s,首token延迟约1秒,相较于标准版GLM-5.1的35 tps和9秒延迟,性能提升约10倍。技术上,智谱联合TileRT团队重构了推理链路,通过将整个推理流程编译为常驻GPU的大kernel,大幅减少CPU调度与数据搬运开销,并优化单卡内的计算、IO分配及多卡间任务协作,显著提升GPU利用效率。该模型单次激活40B参数,高性能运行需依托多卡并行,建议现有用户切换使用以获得更实时的生成体验。
阿里云与Novita AI达成合作,在Novita AI平台首发推出Qwen3.7-Max模型,标志着双方共同推进Agent时代的发展。该模型专为智能体时代设计,强调从"回答"到"执行"的能力跃升。核心优势包括:强大的代码生成与软件工程工作流能力;可靠的智能体编排与多智能体系统协作能力;支持长周期、自主化的复杂任务执行;且具备框架与技术栈无关的兼容性,可适配多种主流开发环境。