11.18-11.25-比特栈

Anthropic发布新一代大模型Claude Opus 4.5

Anthropic发布新一代大模型Claude Opus 4.5，在编程能力上实现重大突破，成为首个在SWE-Bench Verified真实软件工程测试中得分超过80%的模型，并在八种编程语言的七种中排名第一。核心升级包括对模糊需求的精准理解、复杂Bug自主定位能力，以及创新的”effort”参数控制系统，可在保证性能的同时大幅降低token消耗。来源：APPSO

混元OCR模型宣布开源，参数仅1B，多项核心能力SOTA

腾讯混元开源轻量级OCR模型HunyuanOCR，参数仅1B却在多项核心能力上达到SOTA水平。模型基于混元原生多模态架构，采用端到端设计，在复杂文档解析基准OmniDocBench中获得94.1分，超越Gemini 3 Pro等主流模型。来源：腾讯混元

腾讯混元发布全新视频生成模型：HunyuanVideo 1.5

腾讯混元开源视频生成模型HunyuanVideo 1.5，参数仅8.3B却可生成5-10秒高清视频。模型基于DiT架构，支持中英文文生视频与图生视频，具备强指令理解能力，可精准控制运镜、人物表情及物理运动。原生支持480p/720p输出，经超分可提升至1080p，并在14G显存消费级显卡即可流畅运行，大幅降低使用门槛。来源：腾讯混元

OpenAI 发布最强编程模型 GPT-5.1-Codex-Max

OpenAI发布GPT-5.1-Codex-Max编程模型，取代GPT-5.1-Codex，成为Codex集成界面上默认模型。模型在多个编程基准测试中超越谷歌Gemini 3 Pro，如SWE-Bench Verified测试中准确率77.9%，领先对方1.7个百分点。其引入“压缩”机制，可连续工作超24小时，token效率提升约30%。来源：IT之家

Gemini 3正式发布：谷歌推出最强AI模型

谷歌正式发布新一代多模态大模型Gemini 3，在多项基准测试中表现卓越，以1501 Elo得分位列LMArena竞技场第一。模型具备原生多模态理解、高级推理及Agent编程能力，支持100万token上下文窗口，在学术推理、数学、代码开发等任务上显著领先前代及竞品。来源：智东西

AiPPT Agent版上线，AI「深度研究」功能开启内测

AiPPT正式推出Agent版的「深度研究」功能并邀请用户内测。功能模拟真人分析师工作流程，通过“理解-反思-追问”循环，自动完成从全网深度搜索、逻辑梳理到生成图文并茂研究报告和PPT的全过程。来源：AIPPT

马斯克Grok 4.1低调发布！通用能力碾压其他一切模型

马斯克旗下xAI公司发布的最新AI对话模型Grok 4.1，主打情感智能与实用性能的突破。模型在LMArena排行榜以1483分登顶，比第二名高出31分，并首创”思考模式”与”即时模式”双轨设计——即使不启动深度推理，基础版本仍能超越其他模型的完整配置。来源：机器之心

目录CONTENT

11.18-11.25