26/03/27-26/04/02-比特栈

智谱推出GLM-5V-Turbo：多模态Coding基座模型

智谱推出GLM-5V-Turbo多模态Coding基座模型。模型原生融合视觉与文本能力，支持从设计稿、截图直接生成可运行代码，上下文窗口达200k。模型在多模态Coding、GUI Agent等基准测试中表现领先，深度适配Claude Code与AutoClaw等Agent框架，让AI Agent具备”视觉”能力。来源：智谱

阿里通义推出Qwen3.6-Plus：编码智能体能力全面跃升

通义实验室推出Qwen3.6-Plus模型，支持通过阿里云百炼 API 开放调用。模型聚焦编码智能体能力跃升，在代码生成、修复及终端自动化等场景表现更稳定，默认支持 100 万上下文窗口，多模态感知与推理能力同步增强。模型在国内同尺寸模型中编码智能体能力领先，前端开发、复杂文档理解等任务表现突出。来源：通义实验室

OpenClaw推出中国官方镜像站ClawHub镜像站

OpenClaw官方推出ClawHub镜像站，解决国内访问技能市场缓慢问题。镜像站由字节跳动BytePlus和火山引擎赞助基础设施，提供完整中文界面与数据同步，持续收录社区高质量Skill。用户可通过cn.clawhub-mirror.com直接访问，在OpenClaw中无缝调用各类Agent技能。来源：AI工具集

B 站推出 AI 视频创作工具updream

B站自研AI创作工具updream正式开启内测，面向UP主提供轻量化、智能化创作体验。产品采用定向邀请制，创作者需邀请码获得使用权限。updream具备三大核心能力：灵感生成与内容构思、智能剪辑与高效制作、个性化技能库与项目管理。来源：AI工具集

OpenAI获1220亿美元史上最大单笔融资纪录

OpenAI完成史上最大单轮融资1220亿美元，投后估值达8520亿美元，由亚马逊、英伟达、软银等领投。同时因日均成本高达100万美元且用户留存低迷，OpenAI关闭了视频生成产品Sora。标志着公司战略从惊艳Demo转向务实商业化，聚焦文本模型、代码生成和企业服务等稳定现金流业务，为IPO铺路，意图成为AI基础设施层。来源：APPSO

通义实验室推出AI图像生成与编辑模型Wan2.7-Image

通义实验室推出AI图像生成与编辑模型Wan2.7-Image ，主打”人更真、字更稳、色更准”。模型支持深度自定义虚拟形象，避免”AI标准脸”；支持4000超长字符及多语言、表格、公式稳定生成，解决乱码痛点；新增”色彩控制调色盘”，可通过Hex色值精确控制品牌色，确保设计符合VI规范。来源：通义实验室

昆仑万维推出AI短剧创作平台「天工短剧工作台」

昆仑万维推出「天工短剧工作台」，基于多智能体协同，融合Seedance、SkyReels、可灵、Vidu四大视频模型。平台提供传统分镜与智能分镜两种模式，支持资产提取、角色多视图推理、一键成片，实现”输入剧本→直达成片”的工业化流程，解决AI短剧创作周期长、成本高、一致性差等痛点。来源：昆仑万维集团

「Kimi 开放平台」官网域名更新了

Kimi开放平台官网域名更新，即日起用户可通过 platform.kimi.com 访问Kimi开放平台，使用Kimi API创建应用。用户可像之前一样正常登录和使用，无需额外操作。来源：Kimi开放平台

企业微信官方开源命令行工具wecom-cli

腾讯宣布企业微信CLI项目wecom-cli开源上架GitHub，开放消息、日程、文档、智能表、会议、待办、通讯录七大核心能力，支持Claude Code、QClaw等主流AI Agent调用。开发者可快速开发办公场景AI应用，实现消息收发、文档编辑、会议预定、待办管理等功能。来源：IT之家

阿里通义推出Qwen3.5-Omni全模态大模型，在215项音频及音视频任务中取得SOTA，全面超越Gemini-3.1-Pro。模型采用Thinker-Talker分工架构与Hybrid-MoE技术，原生支持文本、图像、音频及音视频输入，具备细粒度音视频Caption生成能力。新增语义打断、音色克隆、语音控制等实时交互功能，支持256K超长上下文、113种语言识别及10小时音频处理。来源：通义实验室

智谱GLM-5.1已面向所有Coding Plan用户开放

智谱宣布GLM-5.1模型已向所有Coding Plan用户（Lite/Pro/Max三档）开放。模型定位代码生成与编程辅助，覆盖从个人开发者到企业团队的多元需求。全面开放标志着智谱在AI编程助手领域的进一步布局，将与GitHub Copilot、Cursor等工具展开竞争。来源：智谱

谷歌推出Gemini 3.1 Flash Live实时语音模型

谷歌推出Gemini 3.1 Flash Live模型，是其最高质量的实时语音模型，已在Gemini App、Search Live及Google AI Studio开放。模型核心升级包括：语音可直接驱动应用开发（vibe coding），上下文窗口扩大2倍，支持200+国家多语言实时交互。在ComplexFuncBench音频测试中函数调用准确率达90.8%，显著优于前代。来源：智东西

商汤科技推出商汤输入法AudioClaw和SenseAudio AI语音开放平台

商汤科技于3月27-29日亮相上海全球开发者先锋大会，推出商汤输入法AudioClaw及SenseAudio AI语音开放平台。AudioClaw集成语音输入、AI会议助理、知识库等功能，支持微信接入和语音交互。SenseAudio提供70+精品音色及ASR、TTS、文生图/视频等能力。来源：商汤科技SenseTime

目录CONTENT

26/03/27-26/04/02