继续开源:腾讯混元 0.5B、1.8B、4B、7B模型发布
腾讯宣布开源四款小尺寸混元模型,参数分别为0.5B、1.8B、48、78,可在消费级显卡上运行,适用于低功耗场景,支持垂直领域低成本微调。这些模型在语言理解、数学、推理等领域表现优异,具备agent能力和超长上下文窗口(256k),可处理超长内容。
小米开源声音理解大模型 MiDashengLM-7B
小米开源了声音理解大模型MiDashengLM-7B。模型基于Xiaomi Dasheng音频编码器和Qwen2.5-0mni-7B解码器采用创新训练策略,实现语音、环境声和音乐的统一理解,性能在22个公开评测集上刷新最佳成绩。
全球首个纳米AI多智能体蜂群上线
360集团宣布纳米A1完成品牌焕新,升级为“多智能体蜂群”,成为全球首个迈入L4级别的智能体系统。实现了从“单兵作战"到“群体协同”的进化,突破以往智能体在跨领域复杂问题上的瓶颈。纳米A!独创的"蜂群协作框架”可让多个推理型智能体灵活拉群、多层嵌套、组队协作,完成超长复杂任务,如制作10分钟电影级大片仅需20分钟。
小红书推出首个社交大模型Redone
小红书推出首个社交大模型RedOne。模型采用“继续预训练一监督微调一偏好优化"的三阶段训练策略,针对社交网络服务(SNS)领域的复杂数据特征和多元场景进行优化。
谷歌推出 Gemini 2.5 Deep Think 模型
谷歌推出 Gemini 2.5 Deep Think,面向 Google Al Ultra 订阅者开放。模型基于在国际数学奥林匹克竟赛中获得金牌标准的版本改进,具备更快的推理速度和日常可用性,达到 2025 年IMO 铜牌水平。Deep Think 通过并行思考技术,延长推理时间,生成多种想法并逐步优化,适用于复杂问题解决、科学发现、算法开发等场景。
昆仑万维发布并开源全新推理大模型 MindLink
昆仑万维推出并开源全新推理大模型Skywork MindLink,基于Qwen3-32B和Qwen2.5-72B后训练而成。模型采用新的推理范式Plan-based Reasoning,去掉了"think“标签,能根据任务难度自适应整合推理和非推理生成回复,降低推理成本且提升多轮对话能力。
评论区