腾讯混元新成员--混元-A13B模型发布并开源
腾讯发布了混元-A13B模型并宣布开源。模型基于专家混合(MoE)架构,总参数800亿,激活参数130亿,推理效率高,仅需1张中低端GPU卡即可部署。在数学、科学和逻辑推理任务中表现出色,支持快思考和慢思考模式,兼顾速度与准确性。
快手可灵AI 上线“视频音效”功能,向用户限时免费开放
快手旗下可灵AI宣布上线"视频音效“功能,向用户限时免费开放。功能可在生成视频时同步生成高质量立体声音效,支持用户上传视频或调用历史作品,一键配精准同步音效。
Black Forest Labs 推出 FLUX.1 Kontext 图像生成与编辑模型
Black Forest Labs 推出 FLUX.1 Kontext 图像生成与编辑模型。模型基于文本和图像提示,支持上下文感知的图像处理,具备角色一致性保持、局部编辑、风格转换等功能。Pro 版本可快速迭代编辑,保持图像质量稳定;Max 版本在提示词遭循和排版生成方面表现出色;dev 开源版本适合定制化开发。
快手推出自主研发的多模态大语言模型 Kwai Keye-VL
快手推出自主研发的多模态大语言模型 Kwai Keye-VL,具备强大的视频理解与推理能力。该模型融合文本、图像视频等多模态信息,能快速解析复杂视觉内容,如精准计数图像中的草莓,并在短时间内为商品视频生成推销方案。
Hengbot 推出 sirius 机器狗:集成 OpenAl,可跳舞、踢足球
Hengbot推出 sirius 机器狗,主打敏捷运动,可跳舞、踢足球,集成了 OpenAl大语言模型,支持语音对话,能根据主人需求调整性格和声音。腿部和头部内置 14 个运动轴,配备“Neurocore"关节,动作自然流畅
评论区