AI 版支付宝开放公测,无需邀请码即可体验
支付宝AI智能体”阿宝“结束内测,正式面向iOS和安卓用户开放公测,无需邀请码即可体验。用户可在应用商店或支付宝App内搜索”阿宝”或”蚂蚁阿宝”可直接使用。阿宝从海量办事服务中整理出72项技能,涵盖居家保洁、出行订票、购物优惠、社保查询、账单分析等72项生活服务,支持模糊口语理解、全场景服务覆盖及长期陪伴互动。来源:支付宝
Meta 开源 React 设计系统 Astryx
Meta正式开源React设计系统Astryx,目前处于Beta阶段。系统基于React与StyleX构建,历经8年内部打磨,支撑Facebook、Instagram等超1.3万个应用。系统提供150+可访问组件、品牌级主题、暗黑模式、即用型模板及CLI工具集,开发者无需额外构建插件,导入预编译CSS即可使用。来源:AI工具集
Anthropic推出最强智能体模型 Claude Sonnet 5
Anthropic推出Claude Sonnet 5,定位为其最具Agent能力的Sonnet模型,支持制定计划、调用浏览器和终端等工具自主执行复杂任务,整体能力接近Opus 4.8但价格更低。模型已面向所有套餐开放,成为Free和Pro用户默认模型,支持Claude Code和Platform调用。来源:APPSO
谷歌推出轻量级 AI 图像生成模型 Nano Banana 2 Lite
谷歌推出AI图像模型Nano Banana 2 Lite,4秒可生成一张图像,每1000张收费0.034美元,主打速度与批量处理能力,适合高频内容生产场景。模型已上线谷歌AI Studio、Gemini API及企业平台,将取代初代Nano Banana。来源:IT之家
OpenAI 推出最新一代大语言模型系列 GPT-5.6
OpenAI 推出 GPT-5.6 系列限量预览版,包含旗舰 Sol、平衡 Terra 和性价比 Luna 三款模型。Sol 在编程、网络安全和生物学领域表现突出,新增 max 深度推理和 ultra 多 Agent 协同模式;Terra 以 GPT-5.5 一半价格提供同等性能;Luna 主打轻量高速。模型因应美国政府要求改为限量预览,原计划为开放访问。来源:机器之心
DeepSeek 联合北大开源推测解码加速框架 DSpark
DeepSeek 与北京大学联合推出大模型推理加速框架 DSpark,已进入 DeepSeek-V4 系列生产系统。在总吞吐不变的情况下,DeepSeek-V4-Flash 单用户生成速度提升 60%–85%,DeepSeek-V4-Pro 提升 57%–78%。DSpark 采用半自回归架构与置信度调度验证机制,兼顾草稿生成速度与连贯性,能根据系统负载动态调整验证长度。来源:APPSO
高德推出 AI 应用生成平台「袋马」
高德内测Vibe Coding产品「袋马」,主打自然语言驱动零门槛构建应用,聚焦微信小程序与iOS原生场景,可快速生成可直接上线、真机可用的应用。产品面向无专业研发团队的个人从业者与中小主体,用户无需编程知识,通过自然语言描述需求可生成完整App,支持获取真机二维码测试与持续迭代。来源:IT之家
阿里通义千问推出独立AI语音输入法「千问输入法」
阿里巴巴通义千问团队推出独立AI语音输入法「千问输入法」,主打”说得随意,写得漂亮”。产品底层接入千问大模型CosyVoice能力,能语音转文字,更能理解语义、自动去除语气词、纠正口误,将散装口语整理为结构化书面文本。千问输入法支持最快300字/分钟输入、9种方言识别与中英混说。来源:AI工具集
生数科技推出的 AI 陪伴应用 Vidy
生数科技推出AI陪伴应用 Vidy,定位”AI Vibe Buddy”,支持文字、语音及实时通话互动。产品内置Humi等差异化AI角色,搭载关系成长记忆系统,可随对话积累理解用户习惯与情绪。依托自研U-ViT架构和Vidu视频大模型,Vidy计划实现AI形象实时表情动作生成,将陪伴从文字语音推向面对面视频通话层级。来源:AI工具集
腾讯混元开源 4B 参数手机 Agent 模型 PhoneBuddy
腾讯混元开源PhoneBuddy 4B手机Agent模型,同步推出PhoneWorld、PhoneHarness等5篇论文,系统覆盖环境、训练、执行、隐私与安全全链路。模型核心创新采用Real+Mock混合RL训练,将真实App与自建PhoneWorld mock环境结合,使4B模型在150项真机评测中多项指标超越GPT-5.4。来源:量子位
Mistral AI 推出新一代文档识别模型 Mistral OCR 4
Mistral AI 推出最新文档识别模型 Mistral OCR 4,支持横跨10个语族的170种语言,在OmniDocBench基准上获得93.07分。相比GPT 5.5 Pro、Gemini 3.1 Pro Preview等竞品,模型输出更受人类青睐。模型在输出文本的同时可提供边框、区域分类和置信度评分,支持RAG语义分块等下游工作负载。来源:IT之家
阿里云推出 AI 语音输入法 CosyVoice
阿里云推出新一代AI语音输入法CosyVoice,搭载千问大模型,支持语音实时转写、自动过滤口语冗余、识别自我修正及结构化整理。工具可理解用户意图生成制式文稿,支持上海话、粤语、四川话等多种方言转普通话。工具主打大模型深度赋能的语义级理解与文本再生成能力,区别于传统语音输入法仅做声学转写。来源:AI工具集
阿里云推出 AI 互动故事创作与阅读平台「向尾」
阿里云推出AI互动故事创作与阅读平台「向尾」,支持从零起稿、文稿续写及长篇小说分章规划三种模式,覆盖网文、剧本、儿童故事等场景。阅读时AI实时生成场景背景图,读者可在关键节点选择剧情走向或自定义输入,平台即时续写并保持人设一致。来源:AI工具集
网易有道开源 TTS 语音合成引擎 Confucius4-TTS
网易有道开源TTS模型 Confucius4-TTS。模型实现三大突破:3秒零样本语音克隆、14种语言跨语种无口音合成,以及情感韵律迁移。模型底层采用语音编码器+大语言模型+流匹配生成的端到端架构,完整54G权重支持本地离线部署。来源:网易有道
豆包正式推出专业版
豆包专业版正式上线,基于豆包2.1系列大模型推出全新办公任务模式,支持本地电脑操作、浏览器、Skills技能调用、定时任务及内置Office套件,可完成文档处理、应用开发、数据分析等专业工作。订阅采用三级阶梯定价:标准套餐68元/月、加强套餐200元/月、高级套餐500元/月;大学生认证可享38元/月专属优惠。来源:豆包
火山引擎推出音频创作模型「豆包音频生成模型1.0」
火山引擎推出豆包音频生成模型1.0,首次支持文本或音频参考输入,可端到端生成目标音频。模型能在单条Prompt中编排多角色对白、情绪语气、背景音乐与环境氛围,直接产出完整音频作品,可在长时生成中保持音色一致性。来源:火山引擎
TRAE Work 推出 Design 模式,对话即设计、画布即原型
TRAE Work 推出全新 Design 模式,桌面端与网页端同步全量上线。用户可通过自然语言对话生成设计方案,在画布中实时修改并生成可交互原型。该模式支持导入 Figma 等已有设计资产,能一键将设计稿导出至 Code 模式,实现从设计到开发的一站式衔接。来源:TRAE.ai
百川智能推出医疗增强大模型 Baichuan-M4
百川智能联合清华大学推出新一代医疗增强大模型 Baichuan-M4,在 HealthBench 三项榜单登顶世界第一,幻觉率仅3.3%为行业最低。Baichuan-M4具备深度主动问诊、全病程记忆、证据锚定及 Agent 调度四大核心能力,由 Baichuan-Harness 自主编排诊疗流程,实现从会答题到会看病的跨越。来源:百川智能
字节跳动推出最新视频生成模型 Seedance 2.5
2026火山引擎FORCE原动力大会上,正式推出豆包视频生成模型Seedance 2.5。模型处于内测尾声,预计7月初上线,模型实现三大全球突破:单段原生视频直出30秒,支持50个全模态参考素材联合输入,并支持局部可控编辑。Seedance 2.5可稳定承接专业3D资产创作,输入近10万面白模可生成稳定渲染视频。来源:APPSO
百度开源端到端长文档 OCR 模型 Unlimited-OCR
百度开源全新OCR模型 Unlimited OCR,主打一次性解析数十页长文档,在 OmniDocBench 上刷新 SOTA,综合得分 93.23%,超越 DeepSeek OCR。模型核心创新为参考滑动窗口注意力(R-SWA)机制,通过”软遗忘”策略使 KV Cache 保持恒定,推理速度不随文档长度增长,6000 Token 时 TPS 提升约 35%。来源:量子位
微信小范围内测原生AI助手「小微」
微信「小微」AI助手启动小范围内测,用户可在主界面左上角通过绿色眼睛图标进入。小微支持文字或语音对话操作微信原生功能,包括调整设置、发送消息、调起小程序、生成图片等,主模型为微信自研WeLM,部分回答调用DeepSeek。同时,小微具备一句话生成小程序能力。来源:财联社
港股智谱总市值突破 1 万亿港元
港股智谱总市值首次突破1万亿港元,年内涨超2000%,总市值达1.27万亿港元。此前智谱开源的GLM-5.2模型在全球百万用户盲测的Code Arena前端开发评估中位列可用模型第一。来源:IT之家
腾讯QQ邮箱推出 AI Agent专属邮箱服务 Agently Mail
腾讯QQ邮箱推出 Agently Mail,专为 AI Agent 打造的独立邮箱服务。Agent 可通过微信扫码授权获得专属邮箱地址,与个人邮箱完全隔离,支持收发邮件、管理附件、搜索过滤等完整功能。目前服务已上架腾讯 SkillHub,三步安装即可使用。来源:AI工具集
阿里 HappyHorse 1.1视频模型上线堆友
堆友平台正式上线HappyHorse 1.1视频生成模型,新版本模型在动态表现力、生成一致性、视觉质感、指令遵循、文字稳定性及镜头语言五大维度实现系统性优化。用户可通过堆友官网直接体验。来源:堆友
Claude Code 上线 Artifacts,可将会话过程实时变成网页
Anthropic宣布Claude Code支持Artifacts功能,可将代码修改、故障排查等会话内容实时生成为可共享的交互式网页,支持团队同步查看进展。该功能基于完整会话上下文自动生成,页面随工作持续刷新,默认私有且仅限组织内分享。目前Artifacts以Beta形式向Team和Enterprise用户开放。来源:APPSO
评论区