侧边栏壁纸
博主头像
比特栈 博主等级

行动起来,活在当下

  • 累计撰写 104 篇文章
  • 累计创建 3 个标签
  • 累计收到 0 条评论

目 录CONTENT

文章目录

8-4,AI事件

Administrator
2025-08-05 / 0 评论 / 2 点赞 / 3 阅读 / 0 字

继续开源:腾讯混元 0.5B、1.8B、4B、7B模型发布

腾讯宣布开源四款小尺寸混元模型,参数分别为0.5B、1.8B、48、78,可在消费级显卡上运行,适用于低功耗场景,支持垂直领域低成本微调。这些模型在语言理解、数学、推理等领域表现优异,具备agent能力和超长上下文窗口(256k),可处理超长内容。

小米开源声音理解大模型 MiDashengLM-7B

小米开源了声音理解大模型MiDashengLM-7B。模型基于Xiaomi Dasheng音频编码器和Qwen2.5-0mni-7B解码器采用创新训练策略,实现语音、环境声和音乐的统一理解,性能在22个公开评测集上刷新最佳成绩。

全球首个纳米AI多智能体蜂群上线

360集团宣布纳米A1完成品牌焕新,升级为“多智能体蜂群”,成为全球首个迈入L4级别的智能体系统。实现了从“单兵作战"到“群体协同”的进化,突破以往智能体在跨领域复杂问题上的瓶颈。纳米A!独创的"蜂群协作框架”可让多个推理型智能体灵活拉群、多层嵌套、组队协作,完成超长复杂任务,如制作10分钟电影级大片仅需20分钟。

小红书推出首个社交大模型Redone

小红书推出首个社交大模型RedOne。模型采用“继续预训练一监督微调一偏好优化"的三阶段训练策略,针对社交网络服务(SNS)领域的复杂数据特征和多元场景进行优化。

谷歌推出 Gemini 2.5 Deep Think 模型

谷歌推出 Gemini 2.5 Deep Think,面向 Google Al Ultra 订阅者开放。模型基于在国际数学奥林匹克竟赛中获得金牌标准的版本改进,具备更快的推理速度和日常可用性,达到 2025 年IMO 铜牌水平。Deep Think 通过并行思考技术,延长推理时间,生成多种想法并逐步优化,适用于复杂问题解决、科学发现、算法开发等场景。

昆仑万维推出并开源全新推理大模型Skywork MindLink,基于Qwen3-32B和Qwen2.5-72B后训练而成。模型采用新的推理范式Plan-based Reasoning,去掉了"think“标签,能根据任务难度自适应整合推理和非推理生成回复,降低推理成本且提升多轮对话能力。

2

评论区