新闻标题:OpenAI发布更新版Agents SDK,助力企业构建更安全的智能代理
-
新闻发生时间:2026年4月15日
-
新闻描述:OpenAI对其Agents SDK进行重大更新,核心新增沙箱隔离能力,允许智能代理在受控计算环境中运行,有效防范因行为不可预测带来的安全风险;同时新增前沿模型的分布内测试框架,支持代理在工作区内安全调用文件与经过审批的工具。OpenAI产品团队成员Karan Sharma表示,此次发布的核心是确保现有Agents SDK与各类沙箱服务提供商实现兼容,让用户可利用自有基础设施构建长周期智能体任务。新版SDK通过API向所有用户开放,采用标准定价,目前新功能率先在Python版本中上线,TypeScript支持将于后续推出。
新闻标题:腾讯发布并开源混元3D世界模型2.0,无缝对接游戏工作流
-
新闻发生时间:2026年4月16日
-
新闻描述:腾讯正式发布并开源混元3D世界模型2.0(HY-World 2.0)。该模型是一个多模态世界模型,能够根据文字、图片、视频等不同类型输入,自动生成、重建和模拟3D世界,同时支持多格式3D资产(Mesh/3DGS/点云等)导出,可与现有的游戏工作流无缝对接,用于快速生成游戏地图和关卡原型。相比上一代版本,模型架构全面升级,用户可自定义风格,生成后可将资产导入Unity、UE等引擎进行二次编辑。
新闻标题:阿里巴巴ATH推出开放世界模型Happy Oyster,开启实时交互体验申请
-
新闻发生时间:2026年4月16日
-
新闻描述:阿里巴巴ATH事业群正式推出开放式世界模型产品Happy Oyster,主打实时世界创建与交互。该产品可生成动态三维环境,支持影视制作、游戏开发等场景,基于原生多模态架构,背后是支持多模态输入与音视频联合生成的流式生成世界模型。区别于传统“写prompt→等渲染→收成片”的一次性流程,Happy Oyster在生成过程中持续接收用户指令,画面实时响应、持续演绎,交互性更强。目前产品已开启内测,用户可通过官网happyoyster.cn申请体验。
新闻标题:谷歌发布Gemini 3.1 Flash TTS文本转语音模型,支持近70种语言
-
新闻发生时间:2026年4月15日
-
新闻描述:谷歌发布新一代文本转语音模型Gemini 3.1 Flash TTS,被官方描述为“至今最富表现力的文本转语音解决方案”。该模型覆盖约70种语言,包括中文(普通话)、英语、西班牙语、德语、日语等主流语种,模型可自动检测输入文本语种,无须手动标注即可生成对应语音。用户可通过提示词精细控制语音的情感、节奏和风格。所有生成音频均嵌入SynthID水印,已在Gemini API、Google AI Studio、Vertex AI及Google Vids等平台同步上线。
二、AI安全与风险
新闻标题:超20万台AI服务器暴露在攻击风险下,MCP被曝存在严重设计缺陷
-
新闻发生时间:2026年4月15日(调查报告发布日期)
-
新闻描述:网络安全公司OX Security于4月15日发布调查报告,披露Anthropic的MCP(模型上下文协议)存在架构层面的设计缺陷,可导致远程代码执行,影响超过20万台AI服务器。MCP是Anthropic于2024年11月推出的开源开放标准,旨在让AI大模型无缝连接并操作各种外部数据和工具。漏洞根源潜伏在MCP SDK的STDIO接口中——本用于启动本地服务器进程,但底层执行逻辑会运行任何传入的操作系统命令,全程无校验、无警告。该漏洞波及Anthropic官方支持的全部11种编程语言,包括Python、TypeScript、Java、Go、Rust等。OX Security认为这不是代码笔误,而是架构层面的设计决策。目前LiteLLM、DocsGPT、Flowise等平台已发布补丁,但LangFlow、Agent Zero等仍待修复,协议层的根本问题依然敞开。
三、AI应用与商业化
新闻标题:芒果TV会员破7560万,自研大模型上岗30多档节目,湖南广电AI转型成绩单
-
新闻发生时间:2026年4月15日
-
新闻描述:在第十三届中国网络视听大会上,湖南广播电视台董事长龚政文透露,湖南广电旗下芒果TV有效会员已突破7560万。湖南广电自研的“芒果大模型”已孵化出80余款智能体,并实际应用于30多档节目的生产流程中,带来了30%以上的生产效率提升。这意味着AI已从概念真正跑进内容制作的日常,且具备一定的可复制性。
四、开源技术与机器人
新闻标题:蚂蚁灵波科技开源LingBot-Map:支持单摄像头实时流式三维重建
-
新闻发生时间:2026年4月16日
-
新闻描述:蚂蚁灵波科技正式宣布开源流式三维重建模型LingBot-Map。该模型无需复杂硬件,仅靠一颗普通RGB摄像头,即可在视频采集过程中实时完成相机位姿估计与场景三维结构重建。技术层面,LingBot-Map采用流式处理架构,改变了传统方法需预先采集完整序列再统一处理的局限,实现了边接收画面边输出定位与结构的实时交互。在国际主流评测中表现出色——在Oxford Spires数据集上,轨迹误差仅为此前最优流式方法的三分之一;推理速度可达约20FPS,支持10,000+帧长视频连续推理且精度几乎不衰减。目前,LingBot-Map的模型和代码已在Hugging Face和ModelScope开源。
结尾概述
2026年4月16日,全球AI领域密集释放多项重磅动态。OpenAI升级Agents SDK强化智能代理安全性,腾讯混元3D世界模型2.0开源降低游戏开发门槛,阿里ATH推出交互式世界模型Happy Oyster,谷歌发布Gemini 3.1 Flash TTS语音模型,各大厂商加速将AI能力从“生成”推向“交互”。然而,MCP协议被曝出架构级设计缺陷,超20万台AI服务器面临远程代码执行风险,给开源AI标准的安全性敲响警钟。与此同时,芒果TV交出了AI赋能传统内容生产的规模化成绩单——自研大模型孵化80余款智能体、赋能30多档节目、生产效率提升30%以上,蚂蚁灵波科技开源低成本三维重建技术,大幅降低了空间感知技术的硬件门槛。从模型能力到安全治理再到行业落地,AI正以前所未有的速度渗透进各行各业,但安全风险的暴露也提醒整个行业:技术创新与标准安全性的平衡,是下一阶段必须正视的核心命题。
关于文章版权的声明:
https://news.softunis.com/56307.html 文章来自软盟资讯
若非本站原创的文章,特别作如下声明:
本文刊载所有内容仅供提供信息交流和业务探讨而非提供法律建议目的使用,不代表任何监管机构的立场和观点。不承担任何由于内容的合法性及真实性所引起的争议和法律责任。
凡注明为其他媒体来源的信息,均为转载,版权归版权所有人所有。
如有未注明作者及出处的文章和资料等素材,请版权所有者联系我们,我们将及时补上或者删除,共同建设自媒体信息平台,感谢你的支持!
