侧边栏壁纸
博主头像
比特栈 博主等级

行动起来,活在当下

  • 累计撰写 111 篇文章
  • 累计创建 3 个标签
  • 累计收到 0 条评论

目 录CONTENT

文章目录

12.22-12.31

Administrator
2026-01-03 / 0 评论 / 2 点赞 / 7 阅读 / 0 字

Vidu Agent全球正式上线,商业广告一键成片

Vidu推出AI视频创作工具Vidu Agent,支持20多种语言和200多种音色,覆盖商业广告、产品TVC、剧情片等多种创作场景,能一键生成高质量视频。其分镜编辑功能让创作者可以轻松调整镜头顺序、时长和转场效果,实时预览修改后的视频。来源:Vidu AI

腾讯混元开源翻译模型Tencent-HY-MT1.5版本,端侧可部署

腾讯混元开源翻译模型Tencent-HY-MT1.5系列版本,包含1.8B和7B两个模型,支持33种语种互译及5种民汉/方言。1.8B模型专为端侧部署优化,仅需1GB内存即可流畅运行,在翻译质量上超越多数商用API,平均响应时间仅0.18秒。7B模型为WMT25比赛冠军升级版,准确率显著提升。来源:腾讯混元

Z.ai新突破:GLM-4.7登顶Artificial Analysis全球开源榜首

智谱AI宣布GLM-4.7模型在全球权威评测平台Artificial Analysis Intelligence Index中取得突破性成绩,以68分的综合得分荣登全球开源模型与国产模型双料榜首,并位列全球总榜第六。该榜单重点评估模型的知识、推理、代码及智能体等核心能力,被业界视为衡量大模型综合实力的重要风向标。来源:智谱

腾讯元宝“任务”功能上线:一句话安排时间,到点就提醒

腾讯元宝AI助手正式上线“任务”功能,用户只需将时间安排或计划用一句话告知元宝,即可获得准时提醒服务。功能支持提前测试、手动管理和自定义提醒,需更新至最新版本使用。来源:IT之家

Qwen Code 重磅更新:让 AI 编程跳出命令行

通义千问Qwen Code发布v0.5.0版本,实现从命令行工具向开发生态的关键升级。本次更新重磅推出VSCode插件,开发者可在IDE内直接唤出AI对话界面进行编程。同时发布的TypeScript SDK允许开发者以编程方式集成其智能能力,便于构建Web或移动应用。来源:通义千问Qwen

阿里最强“PS模型”开源:Qwen-Image-Edit-2511

阿里开源图像编辑模型Qwen-Image-Edit-2511,显著提升人物一致性与风格稳定性,集成LoRA模块实现光照、材质及视角控制。实测显示其人像融合、文字渲染效果自然,但几何推理与精细镜头控制仍有不足。来源:智东西

GLM-4.7上线并开源:更强的编码

智谱AI正式上线并开源新一代大模型GLM-4.7,该版本在编码、推理与智能体能力上实现显著提升。在多项主流基准测试中,编程能力达到开源模型领先水平,在SWE-bench Verified中获得73.8%的SOTA分数,工具调用任务τ²-Bench得分87.4分,超越Claude Sonnet 4.5。来源:智谱

阿里发布新一代端到端语音交互模型:Fun-Audio-Chat

阿里通义发布新一代端到端语音交互模型Fun-Audio-Chat,模型采用创新的端到端序列到序列架构,实现从语音输入直接生成语音输出,无需传统ASR+LLM+TTS多模块拼接,显著降低延迟。在OpenAudioBench、MMAU等多个权威评测中,模型在同尺寸模型中排名第一,综合性能超越GLM4-Voice、Kimi-Audio等主流产品。来源:通义大模型

2

评论区