DeepSeek 识图模式全量上线 App 和网页端
DeepSeek多模态研究员Xiaokang Chen宣布,DeepSeek识图模式已在网页端和App端正式上线。该模式与快速模式、专家模式并列,开启后,用户可直接上传图片让DeepSeek进行深度理解,能力边界远超简单的文字提取。来源:IT之家
豆包实时语音模型3.0 API 服务正式上线
火山引擎正式上线豆包实时语音模型 3.0(Seeduplex)API 服务并开启邀测。作为原生全双工端到端语音大模型,模型具备精准遵循、抗干扰、动态判停三大优势,支持在实时对话中调用工具完成任务,实现边听边说边办事。判停延迟缩短约 250ms,复杂场景抢话比例下降 40%。来源:火山引擎
OpenAI 为 ChatGPT 推出全新定时任务功能
OpenAI 为ChatGPT逐步推送全新定时任务功能,替代现有的Pulse功能。新功能支持发送提醒、处理周期性工作及监测事项,新增侧边栏专属页面统一管理任务,运行速度与稳定性均获提升。用户可指定精确时间或宽泛时段,监测类任务支持联网检索与应用数据读取。新功能每小时最多运行一次,长时间无交互可能自动暂停。来源:IT之家
SpaceX 600亿美元收购 Cursor
SpaceX宣布以全股权交易600亿美元收购AI编程工具Cursor母公司Anysphere,Cursor将成为SpaceX全资子公司,预计2026年Q3完成交割。SpaceX刚完成纳斯达克上市,市值达2.5万亿美元。Cursor年度B2B收入约26亿美元,此前底层模型依赖Anthropic和OpenAI,面临断供风险;并入后可用xAI超算训练自有代码模型。来源:机器之心
DeepSeek首次融资落地,募集超500亿,估值超3300亿元
DeepSeek 完成首次对外融资,募资超 500 亿元(约 74 亿美元),估值超 500 亿美元(约 3380 亿元),创国内 AI 行业最大单笔融资纪录。交易结构特殊:资金需投入梁文锋管理的有限合伙企业,外部投资者股份锁定五年且无投票权;国家 AI 产业投资基金例外,直接投资 10 亿元。梁文锋个人出资 200 亿元,腾讯、宁德时代等参投。来源:机器之心
智谱上线并开源 GLM-5.2 ,专注Coding与长程任务
智谱科技上线并开源 GLM-5.2 模型,在 Code Arena 前端评估中位列全球可用模型第一。模型专为长程任务设计,支持 1M 无损上下文,在 FrontierSWE 等基准上表现接近 Claude Opus 4.8。GLM-5.2 引入 effort level 控制,通过 IndexShare 架构优化降低 FLOPs,原生适配华为昇腾等国产算力。来源:智谱
微信支付 「AI 专属卡」上线
微信支付正式推出AI专属卡,WorkBuddy率先接入。用户只需一句话,AI可代为查找餐厅、领取优惠券、团购下单并完成支付。资金安全采用专款专用+笔笔确认机制,每笔支付需用户手机端亲自授权。目前仅支持WorkBuddy mac电脑版5.1.1及以上版本,用户可在专家页面召唤美团生活助手体验。来源:腾讯
蚂蚁支付宝推出超级生活 AI 助手「AI版支付宝」
支付宝推出AI版支付宝,用户右滑可进入清爽对话界面,用语音或文字指令办理政务、出行、生活等上万项服务,实现对话即服务。涉及资金变动需用户本人确认,保障安全。AI版已开启邀测,与经典版可自由切换,平台同步开放服务生态,面向10亿用户推进普惠AI。来源:支付宝
智谱AI推出最新旗舰开源模型 GLM-5.2
智谱推出GLM-5.2模型,支持1M上下文,模型长程任务领先,定位最强国产Coding模型。GLM-5.2 将面向 GLM Coding Plan 全量用户开放,覆盖 Lite / Pro / Max / 团队版。GLM-5.2 API 本周将上线,同时模型也将开源,遵循 MIT 协议。来源:智谱
Kimi K2.7 Code 高速版上线 Kimi API 开放平台
Kimi K2.7 Code 高速版,模型ID:kimi-k2.7-code-highspeed已上线 Kimi API 开放平台,输出速度达普通版 5-6 倍,定价为普通版 2 倍。K2.7 Code 相比 K2.6 在长上下文编程、token 效率上显著提升,平均 token 消耗减少 30%,基准测试性能提升 11%-31.5%。来源:Kimi开放平台
大晓机器人完成天使+轮融资,已累计融资数亿美元
大晓机器人完成天使+轮融资,上半年累计融资数亿美元,达晨财智、深创投等参投。资金将投入世界模型及软硬一体解决方案。开悟世界模型3.0为全球首个开源量产世界模型,多项权威评测第一,支持7分钟长时序视频生成,已实现端侧部署。来源:商汤科技SenseTime
百度飞桨 PaddleOCR 开源第六代 OCR 模型 PP-OCRv6
百度飞桨正式推出PP-OCRv6,首次推出Tiny/Small/Medium三档模型。模型检测与识别精度较v5提升4.9%和5.1%,CPU推理速度最高达前代5.2倍。模型支持50种语言,新增电路板、数码管等工业场景,鲁棒性史上最高。模型现已上线官网并开源至GitHub和HuggingFace。来源:飞桨 PaddlePaddle
月之暗面开源新一代编程专用模型 Kimi K2.7 Code
月之暗面开源Kimi K2.7 Code编程模型,相比K2.6在长上下文编程、指令遵循及Agent自主执行能力上显著提升,代码基准测试提升11%-31.5%,token消耗减少30%,API定价与K2.6持平。模型须开启思考模式发挥最佳性能。来源:月之暗面 Kimi
OpenAI 收购初创公司 Ona
OpenAI 宣布收购初创公司 Ona,为编程助手 Codex 提供安全、预配置云环境。Ona 技术将帮助 Codex 执行更长时间任务,支持用户将 AI 智能体安全部署到生产环境,同时强化企业对基础设施、数据资产和安全边界的掌控。双方未公布交易金额,Ona 团队将加入 OpenAI 参与 Codex 项目研发。来源:IT之家
Visa 与 OpenAI 达成合作,探索 AI 智能体交易新模式
Visa 宣布与 OpenAI 达成战略合作,双方将推动智能体商业进入市场,探索 AI 智能体交易新模式。Visa 将把全球支付网络、支付标记化、授权机制、身份识别及欺诈检测技术引入 OpenAI 产品,确保 AI 发起的交易安全可控,最终决策权仍保留在用户手中。同时双方将探索把支付能力整合到开发者工具中。来源:IT之家
智象未来推出商用图像生成模型 HiDream-O1-Image-1.5
智象未来推出商用图像生成模型 HiDream-O1-Image-1.5,在 Artificial Analysis 文生图榜单上以 1265 ELO 位列全球第三、中国第一,仅次于 OpenAI 的 GPT Image 系列,超越 Google、NVIDIA 及字节跳动等主流模型。模型基于原生全模态架构 UiT,在语义遵循、文字渲染、复杂排版及多主体一致性上表现突出。来源:HiDream智象未来
科大讯飞推出智慧空间Agentic架构 SpaceMind
科大讯飞推出智慧空间Agentic架构SpaceMind,推动智能家居从被动响应进入L2.5主动智能时代。SpaceMind用毫米波雷达为核心感知源,实现5厘米级定位与呼吸级微动检测;采用双路由架构与本地语义模型+云端大模型协同,设备控制响应低至700毫秒。系统具备持久记忆、多Agent协作和主动服务能力,可基于用户习惯自动调节环境。来源:讯飞开放平台
AI短剧协作平台 AniShort 完成近亿元融资
专注数字人与AIGC视频生成的八点八数字公司宣布,旗下AI短剧协作平台AniShort完成近亿元融资,由北京泰中合领投。本轮资金将重点用于技术研发与创作者生态建设。平台通过打通短剧创作全流程,解决行业制作成本高、周期长等痛点。
评论区