26/06/10-26/06/18-比特栈

DeepSeek 识图模式全量上线 App 和网页端

DeepSeek多模态研究员Xiaokang Chen宣布，DeepSeek识图模式已在网页端和App端正式上线。该模式与快速模式、专家模式并列，开启后，用户可直接上传图片让DeepSeek进行深度理解，能力边界远超简单的文字提取。来源：IT之家

豆包实时语音模型3.0 API 服务正式上线

火山引擎正式上线豆包实时语音模型 3.0（Seeduplex）API 服务并开启邀测。作为原生全双工端到端语音大模型，模型具备精准遵循、抗干扰、动态判停三大优势，支持在实时对话中调用工具完成任务，实现边听边说边办事。判停延迟缩短约 250ms，复杂场景抢话比例下降 40%。来源：火山引擎

OpenAI 为 ChatGPT 推出全新定时任务功能

OpenAI 为ChatGPT逐步推送全新定时任务功能，替代现有的Pulse功能。新功能支持发送提醒、处理周期性工作及监测事项，新增侧边栏专属页面统一管理任务，运行速度与稳定性均获提升。用户可指定精确时间或宽泛时段，监测类任务支持联网检索与应用数据读取。新功能每小时最多运行一次，长时间无交互可能自动暂停。来源：IT之家

SpaceX 600亿美元收购 Cursor

SpaceX宣布以全股权交易600亿美元收购AI编程工具Cursor母公司Anysphere，Cursor将成为SpaceX全资子公司，预计2026年Q3完成交割。SpaceX刚完成纳斯达克上市，市值达2.5万亿美元。Cursor年度B2B收入约26亿美元，此前底层模型依赖Anthropic和OpenAI，面临断供风险；并入后可用xAI超算训练自有代码模型。来源：机器之心

DeepSeek首次融资落地，募集超500亿，估值超3300亿元

DeepSeek 完成首次对外融资，募资超 500 亿元（约 74 亿美元），估值超 500 亿美元（约 3380 亿元），创国内 AI 行业最大单笔融资纪录。交易结构特殊：资金需投入梁文锋管理的有限合伙企业，外部投资者股份锁定五年且无投票权；国家 AI 产业投资基金例外，直接投资 10 亿元。梁文锋个人出资 200 亿元，腾讯、宁德时代等参投。来源：机器之心

智谱上线并开源 GLM-5.2 ，专注Coding与长程任务

智谱科技上线并开源 GLM-5.2 模型，在 Code Arena 前端评估中位列全球可用模型第一。模型专为长程任务设计，支持 1M 无损上下文，在 FrontierSWE 等基准上表现接近 Claude Opus 4.8。GLM-5.2 引入 effort level 控制，通过 IndexShare 架构优化降低 FLOPs，原生适配华为昇腾等国产算力。来源：智谱

微信支付「AI 专属卡」上线

微信支付正式推出AI专属卡，WorkBuddy率先接入。用户只需一句话，AI可代为查找餐厅、领取优惠券、团购下单并完成支付。资金安全采用专款专用+笔笔确认机制，每笔支付需用户手机端亲自授权。目前仅支持WorkBuddy mac电脑版5.1.1及以上版本，用户可在专家页面召唤美团生活助手体验。来源：腾讯

蚂蚁支付宝推出超级生活 AI 助手「AI版支付宝」

支付宝推出AI版支付宝，用户右滑可进入清爽对话界面，用语音或文字指令办理政务、出行、生活等上万项服务，实现对话即服务。涉及资金变动需用户本人确认，保障安全。AI版已开启邀测，与经典版可自由切换，平台同步开放服务生态，面向10亿用户推进普惠AI。来源：支付宝

智谱AI推出最新旗舰开源模型 GLM-5.2

智谱推出GLM-5.2模型，支持1M上下文，模型长程任务领先，定位最强国产Coding模型。GLM-5.2 将面向 GLM Coding Plan 全量用户开放，覆盖 Lite / Pro / Max / 团队版。GLM-5.2 API 本周将上线，同时模型也将开源，遵循 MIT 协议。来源：智谱

Kimi K2.7 Code 高速版上线 Kimi API 开放平台

Kimi K2.7 Code 高速版，模型ID：kimi-k2.7-code-highspeed已上线 Kimi API 开放平台，输出速度达普通版 5-6 倍，定价为普通版 2 倍。K2.7 Code 相比 K2.6 在长上下文编程、token 效率上显著提升，平均 token 消耗减少 30%，基准测试性能提升 11%-31.5%。来源：Kimi开放平台

大晓机器人完成天使+轮融资，已累计融资数亿美元

大晓机器人完成天使+轮融资，上半年累计融资数亿美元，达晨财智、深创投等参投。资金将投入世界模型及软硬一体解决方案。开悟世界模型3.0为全球首个开源量产世界模型，多项权威评测第一，支持7分钟长时序视频生成，已实现端侧部署。来源：商汤科技SenseTime

百度飞桨 PaddleOCR 开源第六代 OCR 模型 PP-OCRv6

百度飞桨正式推出PP-OCRv6，首次推出Tiny/Small/Medium三档模型。模型检测与识别精度较v5提升4.9%和5.1%，CPU推理速度最高达前代5.2倍。模型支持50种语言，新增电路板、数码管等工业场景，鲁棒性史上最高。模型现已上线官网并开源至GitHub和HuggingFace。来源：飞桨 PaddlePaddle

月之暗面开源新一代编程专用模型 Kimi K2.7 Code

月之暗面开源Kimi K2.7 Code编程模型，相比K2.6在长上下文编程、指令遵循及Agent自主执行能力上显著提升，代码基准测试提升11%-31.5%，token消耗减少30%，API定价与K2.6持平。模型须开启思考模式发挥最佳性能。来源：月之暗面 Kimi

OpenAI 收购初创公司 Ona

OpenAI 宣布收购初创公司 Ona，为编程助手 Codex 提供安全、预配置云环境。Ona 技术将帮助 Codex 执行更长时间任务，支持用户将 AI 智能体安全部署到生产环境，同时强化企业对基础设施、数据资产和安全边界的掌控。双方未公布交易金额，Ona 团队将加入 OpenAI 参与 Codex 项目研发。来源：IT之家

Visa 与 OpenAI 达成合作，探索 AI 智能体交易新模式

Visa 宣布与 OpenAI 达成战略合作，双方将推动智能体商业进入市场，探索 AI 智能体交易新模式。Visa 将把全球支付网络、支付标记化、授权机制、身份识别及欺诈检测技术引入 OpenAI 产品，确保 AI 发起的交易安全可控，最终决策权仍保留在用户手中。同时双方将探索把支付能力整合到开发者工具中。来源：IT之家

智象未来推出商用图像生成模型 HiDream-O1-Image-1.5

智象未来推出商用图像生成模型 HiDream-O1-Image-1.5，在 Artificial Analysis 文生图榜单上以 1265 ELO 位列全球第三、中国第一，仅次于 OpenAI 的 GPT Image 系列，超越 Google、NVIDIA 及字节跳动等主流模型。模型基于原生全模态架构 UiT，在语义遵循、文字渲染、复杂排版及多主体一致性上表现突出。来源：HiDream智象未来

科大讯飞推出智慧空间Agentic架构 SpaceMind

科大讯飞推出智慧空间Agentic架构SpaceMind，推动智能家居从被动响应进入L2.5主动智能时代。SpaceMind用毫米波雷达为核心感知源，实现5厘米级定位与呼吸级微动检测；采用双路由架构与本地语义模型+云端大模型协同，设备控制响应低至700毫秒。系统具备持久记忆、多Agent协作和主动服务能力，可基于用户习惯自动调节环境。来源：讯飞开放平台

AI短剧协作平台 AniShort 完成近亿元融资

专注数字人与AIGC视频生成的八点八数字公司宣布，旗下AI短剧协作平台AniShort完成近亿元融资，由北京泰中合领投。本轮资金将重点用于技术研发与创作者生态建设。平台通过打通短剧创作全流程，解决行业制作成本高、周期长等痛点。

目录CONTENT

26/06/10-26/06/18