4月20·周一
Anthropic推出AI原生视觉设计协作平台Claude Design
Anthropic推出AI原生视觉设计平台Claude Design,由Claude Opus 4.7驱动,直接挑战Adobe、Figma等传统设计软件。产品具备三大核心能力:自动提取品牌设计系统、支持文档/截图/代码库等多模态输入、设计稿一键生成可运行代码。消息发布后,Adobe、Figma、Wix等设计软件巨头股价集体闪崩。来源:量子位
阿里通义推出下一代旗舰模型Qwen3.6-Max-Preview
阿里通义千问推出下一代旗舰模型的早期预览版 Qwen3.6-Max-Preview。相比前代,模型在智能体编程、世界知识和指令遵循方面显著提升,斩获六项编程基准最高分。用户可通过 Qwen Studio 在线体验,或经阿里云百炼 API 调用,兼容 OpenAI 与 Anthropic 协议。来源:千问大模型
阿里通义推出端到端语音识别大模型Fun-ASR1.5
阿里推出端到端语音识别大模型Fun-ASR 1.5,单模型覆盖30种语言,支持自动语种切换与跨语言混说。模型覆盖中文七大方言体系,字错误率较上版下降56.2%,新增古诗词专项识别准确率达97%。Fun-ASR 1.5采用MoE架构,支持智能标点预测与数字、日期等文本归一化,现已上线阿里云百炼及魔搭社区。来源:千问大模型
Anthropic 推出最新旗舰大模型 Claude Opus 4.7
Anthropic正式推出Claude Opus 4.7,定位为当前最强可广泛使用的大模型。核心升级聚焦复杂任务执行、高清视觉理解和长链路工作流稳定性。视觉能力实现质的飞跃,在XBOW测试中从54.5%跃升至98.5%接近满分;编程能力达SWE-bench 80.5%;百万Token长上下文BFS测试从41.2%提升至58.6%。来源:新智元
阿里通义开源Qwen3.6-35B-A3B,智能体编程“小钢炮”
阿里通义千问团队开源Qwen3.6-35B-A3B稀疏MoE模型,总参数350亿但激活仅30亿,专为智能体编程优化,性能大幅超越前代同时可媲美更大稠密模型。模型支持多模态推理、思考与非思考双模式,在代码生成、工具调用等基准测试中表现突出。来源:千问大模型
Seedance 2.0全面开放API服务
火山引擎正式上线 Seedance 2.0 API 服务,面向企业和个人开放视频生成能力。模型支持文、图、音、视频四模态输入,具备多模态内容参考与编辑能力,并建立肖像版权安全标准。目前已应用于影视文娱(如贾樟柯导演短片、春晚)、漫短剧、广告营销、AI工具、具身智能、自动驾驶等行业,助力创作效率提升。来源:火山引擎
MiniMax Agent 更新,重新设计 Agent 操作电脑的方式
MiniMax Agent 桌面端推出两项更新:Pocket 功能(Beta版)支持接入飞书、微信等主流 IM,用户可在聊天中直接指挥电脑执行任务并回传结果;Computer Use 功能让 Agent 可像人一样看屏幕、操作鼠标键盘,直接操控本地软件和系统设置。来源:MiniMax 稀宇科技
MiniMax开源新一代自我进化AI模型 MiniMax M2.7
MiniMax正式开源MiniMax M2.7,成为首个由AI深度参与自我迭代的模型,支持构建复杂Agent Harness及Agent Teams等能力,在软件工程与办公场景表现优异。开源首日与华为昇腾、摩尔线程、沐曦、昆仑芯、NVIDIA及Together AI、Fireworks等国内外芯片与推理平台完成适配。来源:MiniMax 稀宇科技
MiniMax推出全新AI音乐生成模型 MiniMax Music 2.6
MiniMax推出Music 2.6音乐生成模型,新增Cover功能可基于现有歌曲改编风格与编曲,同时优化国风乐器时序演进、中低频表现及人声自然度。模型首包延迟降至20秒内,支持BPM、调性、段落结构等精准指令控制。同步开源三款Music Skill供Agent调用。来源:MiniMax 稀宇科技
米哈游蔡浩宇AI公司推出首个AI视频模型LPM 1.0
米哈游创始人蔡浩宇的AI公司Anuttacon推出首个视频模型LPM 1.0。模型拥有170亿参数,支持实时生成能说话、唱歌、倾听并表达情绪的AI角色视频,可保持长时间身份一致性生成(支持22-48分钟视频)。技术上采用扩散Transformer架构与因果式流生成器,解决表现力、实时性与长视频一致性难题。来源:量子位
评论区