豆包输入法推出macOS版本
字节跳动旗下豆包输入法macOS版本正式上线,苹果电脑用户可通过语音实现”用嘴打字”。macOS版本基于豆包App同款语音模型,支持任意输入框实时语音转文字,边说边出字且无时长限制。功能上支持多种方言及中英混说,可智能修正语气词、语病和口误,能记住用户个性化改词习惯等。来源:豆包
林俊旸创业,新公司估值约20亿美金
前阿里千问大模型技术负责人林俊旸已正式创业,聚焦世界模型与具身大脑。他已招募来自字节、腾讯及海外背景的核心成员,以约20亿美元估值启动融资,接触红杉中国、高榕创投等机构。此前,林俊旸因阿里云计划拆分Qwen团队离职,具身智能也是其在阿里未竟之业。来源:智能涌现
Claude Code 推出 Agent View,一个界面管理所有 AI 会话
Anthropic为Claude Code推出Agent View研究预览版,支持开发者在一个终端界面内同时调度、监控多个并行AI会话,无需多开窗口。用户可实时查看各任务状态,随时介入回复或切换会话且不丢进度。功能支持后台持续运行,将Claude Code从单线程对话工具升级为多任务”指挥中心”,适用所有付费计划。来源:AI工具集
OpenAI推出AI网络防御工具Daybreak,斥资40亿美元成立新公司
OpenAI宣布成立OpenAI Deployment Company,获超40亿美元初始投资并收购英国AI咨询公司Tomoro,将150名前沿部署工程师嵌入企业,帮助客户将AI部署到销售、法务等核心业务流程,从模型提供商转型为AI经济部署层。同时推出AI网络安全工具Daybreak,整合最强模型、Codex及安全合作伙伴,自动化漏洞发现与修复,加速网络防御并持续保障软件安全。来源:机器之心
码上飞全新升级!不仅做APP,还能帮你做生意
码上飞宣布全新升级,进化为”用AI帮你做生意”的一站式平台。用户用中文可一句话生成微信小程序、App及网站。新版本为每个应用自动配备专属AI员工,支持内容创作、客户回复、数据分析等运营。同时自动生成管理后台集中管理订单、商品与经营数据,助力个人及小团队零门槛跑通业务。来源:码上飞-CodeFlying
阿里千问与淘宝全面打通
千问APP与淘宝全面打通,用户更新至6.9.1版本后,可在千问内直接完成商品挑选、对比及下单。依托AI能力,千问支持复杂条件精准筛选、模糊需求智能理解、场景化商品组合推荐,能识别”智商税”理性劝退,实现从搜索到购买的全链路AI购物体验。来源:千问APP
火山引擎推出Agent套餐包「Agent Plan」
火山引擎正式推出Agent套餐包Agent Plan,首次将多模态模型与Harness工具深度整合。套餐聚合字节跳动自研的Doubao-Seed、Seedance、Seedream系列及GLM-5.1、Kimi-K2.6等主流模型,内置联网搜索、embedding等工具,适配Claude Code、OpenClaw等平台。来源:火山引擎
通义灵码推出RepoWiki功能,一键生成结构化知识文档
通义灵码推出RepoWiki功能,支持为代码库自动生成覆盖模块关系、接口定义与实现逻辑的结构化知识文档,解决 AI 编程工具碎片化理解代码的痛点。RepoWiki支持全量生成、增量更新与 Git 目录同步,Wiki 文件可随代码提交实现团队共享。Repo Wiki 目前处于 Beta 阶段,面向企业标准版与专属版用户开放免费体验,来源:灵码Lingma
OpenAI推出网络安全专用模型GPT-5.5-Cyber
OpenAI 宣布推出GPT-5.5-Cyber限量预览版,优先向经过审核的网络防御者开放。模型基于 Trusted Access for Cyber(TAC)框架,在 GPT-5.5 基础上降低安全相关任务的拒绝率,支持漏洞验证、恶意软件分析等防御工作流,同时保留对恶意活动的防护。来源:OpenAI
OpenAI 推出三款实时语音模型
OpenAI推出三款实时语音模型:GPT-Realtime-2具备GPT-5级推理与工具调用能力;GPT-Realtime-Translate支持70多种语言实时互译,每分钟成本仅约0.25元,较人类同传降低百倍;GPT-Realtime-Whisper实现低延迟语音转录。三模型均通过Realtime API开放,端到端处理保留语调情感。来源:openAI
美团推出 AI 原生共生社区「觅游」
美团推出 AI 原生社区觅游并开启公测。产品定位为面向大模型与 Agent 的共生社区,首创养虾模式,用户饲养的 AI Agent 虾可协助寻找赚钱机会、结识伙伴。目前平台已入驻超 3000 个 Agent、汇聚 4 万余项 Skill。来源:AI工具集
OpenAI推出Codex Chrome扩展插件
OpenAI 正式推出Codex Chrome扩展插件,支持 Codex 直接操作用户已登录的 Chrome 浏览器,包括读取打开标签页、页面内容及已登录网站信息,支持导航、点击、输入和截图等交互操作。用户可随时停止任务并在设置中管理访问权限,与新网站交互前需经确认。来源:AI工具集
评论区