AI日报：MiniMax Music 2.5 发布；蚂蚁灵波开源世界模型LingBot-World；谷歌 Gemini 3.5 泄露 – 中国前沿资讯

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://app.aibase.com/zh

1、MiniMax Music 2.5 正式发布：攻克 AI 音乐“控”与“真”两大难题

MiniMax Music 2.5 的发布标志着 AI 音乐创作在可控性和真实度上取得了重大突破。通过段落级强控制和物理级高保真技术，该版本为创作者提供了更精准的音乐制作工具，同时针对华语市场进行了深度优化，提升了中文音乐的表现力和流畅性。

【AiBase提要:】

🎵 全段落掌控 :支持14种音乐结构标签，让 AI 创作从“随机生成”转向“精准指挥”。

🎤 真实人声质感 :具备细腻的转音与颤音表现，支持男女对唱中的自然协同感与和声层次。

🎹 专业级混音 :内置百余种乐器音色，具备自动适配风格的混音能力，实现录音室级音频交付。

2、蚂蚁灵波开源世界模型LingBot-World，高保真高动态，毫秒级实时交互

蚂蚁灵波科技开源了世界模型LingBot-World，该模型在视频质量、动态程度、长时一致性及交互能力等方面表现优异，可为具身智能、自动驾驶和游戏开发提供高保真的数字演练场。

【AiBase提要:】

🌍 LingBot-World具备高保真与高动态特性，支持10分钟连续稳定生成。

🕹️ 实现16FPS生成吞吐与1秒内端到端交互延迟，支持实时控制。

🔄 支持Zero-shot泛化能力，仅需输入真实照片或游戏截图即可生成可交互视频流。

3、谷歌 Gemini 3.5 泄露：代号 Snow Bunny，单次提示可生成三千行代码

谷歌 Gemini 3.5 的泄露信息揭示了其在编程领域的重大突破，包括单次提示生成3000行代码的能力以及引入深度推理架构。此外，还提到了多个专项模型以应对不同使用场景，显示出该模型的强大功能和潜在影响力。

【AiBase提要:】

🐰 Snow Bunny 计划 : 内部模型 Snow Bunny 具备极强的应用构建能力，单次可产出3000行代码。

🧠 深度推理架构 : 引入“系统2”思维和 Deep Think 切换开关，显著提升复杂逻辑问题的解决率。

🚀 多模型协同 : 泄露信息提及 Fierce Falcon（速度与逻辑）与 Ghost Falcon(多模态创作) 两款专项模型。

4、Kimi K2.5 Agent 助力高效办公：Excel、Word、PDF 全面升级

Kimi K2.5 的发布标志着月之暗面旗下的 Kimi Agent 在办公能力上实现了重大突破，能够深入处理 Excel、Word、PDF 和 PPT 的核心功能，提供专业级的工作成果。此次升级显著提升了效率，使原本需要数小时甚至数天的任务在几分钟内完成，同时解锁了多项高阶办公场景，如数据建模、智能审阅和视觉叙事等，让用户无需复杂操作即可高效完成工作。

【AiBase提要:】

📊 模型升级：依托最新 Kimi K2.5，Agent 办公能力从“阅读总结”进化为“核心创作与排版”。

💼 精通 Office：全面覆盖 Excel 数据建模、Word 审阅批注、PPT 逻辑生成及 PDF 视觉设计。

⚡ 效率平权：将数天的机械劳动缩减至分钟级，让非专业人士也能交付专业级办公文档。

5、工业AI新突破：蘑菇物联“灵知”垂直大模型通过国家网信办备案

蘑菇物联的‘灵知AI’垂直大模型通过国家网信办生成式人工智能服务备案，标志着其在工业公辅能源领域的领先地位。该模型聚焦四大核心能力场景，包括智能问答、精准预测、实时诊断和优化控制，展现了强大的专业性和实用性。

【AiBase提要:】

🧠 智能问答:为复杂工业场景提供即时的专业知识解答。

📈 精准预测:通过历史数据分析，预判设备运行趋势与能源消耗。

🔧 实时诊断:快速定位工业设备故障，提升维护效率。

6、昆仑万维 SkyReels-V3开源，实现多模态视频生成技术突破

昆仑万维SkyReels-V3开源，标志着视频生成技术进入高保真、多模态的新阶段，通过单一建模架构实现了参考图像转视频、视频延长以及音频驱动虚拟形象三大核心能力的深度集成。

【AiBase提要:】

🎥 参考图像转视频（I2V）功能支持1至4张参考图输入，精准保留主体身份特征与空间构图。

🎞 视频延长功能引入“镜头切换延长模式”，实现逻辑的“叙事扩展”。

🎙 音频驱动虚拟形象模块实现极高口型同步率，支持分钟级长视频生成及多角色交互。

详情链接:https://github.com/SkyworkAI/SkyReels-V3

7、昆仑天工发布音乐大模型 Mureka V8：实现从“可生成”到“可发布”的跃迁

昆仑天工音乐大模型 Mureka V8 的发布标志着 AI 音乐技术的重大进步。该模型基于 MusiCoT 技术体系，实现了更接近人类创作逻辑的音乐生成，提升了音乐性、编曲完成度、人声表达及音质质感，使 AI 音乐从“可生成”迈向“可发布”。

【AiBase提要:】

🎵 技术突破：依托 MusiCoT 技术体系，实现模拟人类创作逻辑的深度建模。

🎹 成品级质感：在旋律、人声和编曲等维度全面升级，使作品达到“可发布”级别。

🛠️ 创作协同：支持用户通过自然语言和参考素材进行反复调整迭代，而非随机生成。

详情链接:https://www.mureka.ai/ https://www.mureka.cn/

8、三星官宣：下一代 AR 眼镜将于 2026 年发布，主打多模态 AI

三星正式确认其下一代 AR 眼镜将于 2026 年发布，主打多模态 AI 体验，核心卖点包括智能辅助、轻便设计以及先进的硬件配置。

【AiBase提要:】

🧠 智能辅助：通过语音、视觉及多种交互输入，提供沉浸式智能辅助服务。

👓 轻便设计：外观接近普通眼镜，确保日常佩戴的舒适感。

⚙️ 硬件规格：搭载高通 AR1 芯片组，配备 1200 万像素自动对焦摄像头。

（举报）

相关文章

中国气象局：加快推动人工智能与�…

“中国方案”推动人工智能向善普惠发展

梁长玉对人工智能的观察与观点

李想回复雷军：欢迎加入增程赛道 预祝小米澎程大卖

华为新旗舰平板 MatePad Pro 2026 定档 8 月 5 日

小米澎程像在卖房上热搜 澎程N90 MaX预售定价29.99万

李想回复雷军：欢迎加入增程赛道预祝小米澎程大卖

小米澎程像在卖房上热搜澎程N90 MaX预售定价29.99万