字节跳动Seed开源Seed-OSS-36B模型,512k上下文
字节跳动Seed团队开源了Seed-OSS系列模型,包含360亿参数的Base和Instruct版本,支持最长512k上下文窗口,是目前开源模型中最长的。模型使用12万亿tokens训练,在多个基准测试中表现优异,如AIME24上达91.7%。其推理预算功能允许用户灵活调整推理长度,提升效率。
轻量级易开发,8B参数释放大实力!科学多模态模型Intern-S1-mini开源
上海人工智能实验室推出轻量化科学多模态模型Intern-S1-mini。模型参数为8B,兼具通用与专业科学能力,适合快速部署和二次开发。Intern-S1-mini在多项权威基准测试中表现卓越,尤其在化学、材料等领域显著领先,强大的跨领域泛化能力。轻量化设计降低了对高端计算设备的依赖,仅需24GB单卡即可完成微调。
vivo首款MR头显vivo Vision,硬刚苹果,全球最轻,眼手交互,预约名额秒空
vivo正式发布首款MR头显——vivo Vision探索版,正式进军XR赛道。该头显重量仅398克,比苹果AirPods Max耳机还轻,搭载双目8K Micro-OLED屏幕,支持眼动追踪和手势交互,VST全彩透视延迟低至13ms。vivo Vision探索版支持PC VR无线连接、多窗口办公等功能。
前美团硬件负责人创业,做了一款项链式的“AI相机”:Looki L1
前美团硬件负责人孙洋创立的「光智时空Looki」发布首款多模态AI穿戴设备——Looki L1。这是一款仅重30克的AI生活相机,可磁吸或佩戴于脖子上,具备视觉和听觉感知能力,结合云端大模型为用户提供主动式服务。
金数据发布 Jiri AI表单助手,把想法变成专业表单
金数据推出名为Jiri的AI表单助手。Jiri能根据用户描述秒懂需求,自动生成表单字段组合,自动撰写专业文案,智能匹配高清头图,能根据用户反馈随时修改调整。用户可以通过一句话描述、粘贴内容、上传图片或链接等多种方式生成表单。
百度推出蒸汽机MuseSteamer 2.0版本
百度将推出蒸汽机MuseSteamer 2.0版本,包括Turbo、Lite、Pro和有声版全系模型,具备多人音视频一体化生成、复杂运镜、电影级人物表演等能力,将在影视创作、客户营销等多场景应用。官方应用平台为绘想,自7月2日上线以来,注册用户超30万。
腾讯开源ToonComposer:能生成一部完整的动画短片
腾讯 ARC 实验室联合北京大学、香港中文大学开源了 ToonComposer。仅需 1 张关键帧草图和 1 张彩色参考图,能生成完整的上色动画,能通过文本、草图、图片混合输入,一键转换为多种卡通风格动画。
评论区