智谱推出GLM-5V-Turbo:多模态Coding基座模型
智谱推出GLM-5V-Turbo多模态Coding基座模型。模型原生融合视觉与文本能力,支持从设计稿、截图直接生成可运行代码,上下文窗口达200k。模型在多模态Coding、GUI Agent等基准测试中表现领先,深度适配Claude Code与AutoClaw等Agent框架,让AI Agent具备”视觉”能力。来源:智谱
阿里通义推出Qwen3.6-Plus:编码智能体能力全面跃升
通义实验室推出Qwen3.6-Plus模型,支持通过阿里云百炼 API 开放调用。模型聚焦编码智能体能力跃升,在代码生成、修复及终端自动化等场景表现更稳定,默认支持 100 万上下文窗口,多模态感知与推理能力同步增强。模型在国内同尺寸模型中编码智能体能力领先,前端开发、复杂文档理解等任务表现突出。来源:通义实验室
OpenClaw推出中国官方镜像站ClawHub镜像站
OpenClaw官方推出ClawHub镜像站 ,解决国内访问技能市场缓慢问题。镜像站由字节跳动BytePlus和火山引擎赞助基础设施,提供完整中文界面与数据同步,持续收录社区高质量Skill。用户可通过cn.clawhub-mirror.com直接访问,在OpenClaw中无缝调用各类Agent技能。来源:AI工具集
B 站推出 AI 视频创作工具updream
B站自研AI创作工具updream正式开启内测,面向UP主提供轻量化、智能化创作体验。产品采用定向邀请制,创作者需邀请码获得使用权限。updream具备三大核心能力:灵感生成与内容构思、智能剪辑与高效制作、个性化技能库与项目管理。来源:AI工具集
OpenAI获1220亿美元史上最大单笔融资纪录
OpenAI完成史上最大单轮融资1220亿美元,投后估值达8520亿美元,由亚马逊、英伟达、软银等领投。同时因日均成本高达100万美元且用户留存低迷,OpenAI关闭了视频生成产品Sora。标志着公司战略从惊艳Demo转向务实商业化,聚焦文本模型、代码生成和企业服务等稳定现金流业务,为IPO铺路,意图成为AI基础设施层。来源:APPSO
通义实验室推出AI图像生成与编辑模型Wan2.7-Image
通义实验室推出AI图像生成与编辑模型Wan2.7-Image ,主打”人更真、字更稳、色更准”。模型支持深度自定义虚拟形象,避免”AI标准脸”;支持4000超长字符及多语言、表格、公式稳定生成,解决乱码痛点;新增”色彩控制调色盘”,可通过Hex色值精确控制品牌色,确保设计符合VI规范。来源:通义实验室
昆仑万维推出AI短剧创作平台「天工短剧工作台」
昆仑万维推出「天工短剧工作台」 ,基于多智能体协同,融合Seedance、SkyReels、可灵、Vidu四大视频模型。平台提供传统分镜与智能分镜两种模式,支持资产提取、角色多视图推理、一键成片,实现”输入剧本→直达成片”的工业化流程,解决AI短剧创作周期长、成本高、一致性差等痛点。来源:昆仑万维集团
「Kimi 开放平台」官网域名更新了
Kimi开放平台官网域名更新,即日起用户可通过 platform.kimi.com 访问Kimi开放平台,使用Kimi API创建应用。用户可像之前一样正常登录和使用,无需额外操作。来源:Kimi开放平台
企业微信官方开源命令行工具wecom-cli
腾讯宣布企业微信CLI项目wecom-cli开源上架GitHub,开放消息、日程、文档、智能表、会议、待办、通讯录七大核心能力,支持Claude Code、QClaw等主流AI Agent调用。开发者可快速开发办公场景AI应用,实现消息收发、文档编辑、会议预定、待办管理等功能。来源:IT之家
阿里通义推出全模态大模型Qwen3.5-Omni
阿里通义推出Qwen3.5-Omni全模态大模型,在215项音频及音视频任务中取得SOTA,全面超越Gemini-3.1-Pro。模型采用Thinker-Talker分工架构与Hybrid-MoE技术,原生支持文本、图像、音频及音视频输入,具备细粒度音视频Caption生成能力。新增语义打断、音色克隆、语音控制等实时交互功能,支持256K超长上下文、113种语言识别及10小时音频处理。来源:通义实验室
智谱GLM-5.1已面向所有Coding Plan用户开放
智谱宣布GLM-5.1模型已向所有Coding Plan用户(Lite/Pro/Max三档)开放。模型定位代码生成与编程辅助,覆盖从个人开发者到企业团队的多元需求。全面开放标志着智谱在AI编程助手领域的进一步布局,将与GitHub Copilot、Cursor等工具展开竞争。来源:智谱
谷歌推出Gemini 3.1 Flash Live实时语音模型
谷歌推出Gemini 3.1 Flash Live模型,是其最高质量的实时语音模型,已在Gemini App、Search Live及Google AI Studio开放。模型核心升级包括:语音可直接驱动应用开发(vibe coding),上下文窗口扩大2倍,支持200+国家多语言实时交互。在ComplexFuncBench音频测试中函数调用准确率达90.8%,显著优于前代。来源:智东西
商汤科技推出商汤输入法AudioClaw和SenseAudio AI语音开放平台
商汤科技于3月27-29日亮相上海全球开发者先锋大会,推出商汤输入法AudioClaw及SenseAudio AI语音开放平台。AudioClaw集成语音输入、AI会议助理、知识库等功能,支持微信接入和语音交互。SenseAudio提供70+精品音色及ASR、TTS、文生图/视频等能力。来源:商汤科技SenseTime
评论区