(资料图片)
5月5日消息,据外媒报道,英伟达正在将其面向提高自动驾驶汽车的安全性能所开发的“护栏技术”应用到当前大热的“语言大模型”(GPT)之中,用以解决当下语言大模型面对垃圾数据所产生的“垃圾输入,垃圾输出”的问题。
据悉,“护栏技术”可以帮助大模型控制它的输出,以及过滤它的输入内容。当用户诱导大模型生成攻击性代码,输出不道德内容的时候,护栏技术在一定程度上可以限制输出不安全的内容。同时,护栏技术还能保护大模型不受用户的攻击,帮它挡住来自外界的恶意输入。
目前,英伟达正在将护栏技术整合进他们的 AI 框架 NeMo 中,这是个方便用户创建各种 AI 模型、并在英伟达 GPU 上加速的框架。
关键词: