瑞士研究人员开发出破解大型语言模型的方法

瑞士苏黎世联邦理工学院的两名研究人员开发了一种方法，理论上，任何依赖于人类反馈的人工智能(AI)模型，包括最流行的大型语言模型(LLM)，都有可能被越狱。越狱是绕过设备或系统预期安全保护的俚语。它最常用于描述利用漏洞或黑客绕过消费者对智能手机和流媒体设备等设备的限制。当特别应用于生成式AI和大型语言模型的世界时，越狱意味着绕过所谓的“防护栏”，即硬编码的、不可见的指令，以防止模型生成有害、不需要或无用的输出，以便访问模型的不受限制的响应。研究人员成功利用了RLHF来绕过AI模型的防护栏(在这种情况下是LLama-2)，并使其生成潜在有害的输出，而无需对抗性提示。

人工智能

原文链接

所有评论

推荐阅读

Foresight News ·

CyberConnect 转型社交再质押模块化 L2「Cyber」，有何玩法？如何运行？

CyberConnect 重塑为 Cyber，旨在将向社交再质押模块化以太坊 L2 转型，速读 Cyber L2 的参与方式和未来发展之路。
华尔街日报：苹果正在研发数据中心AI芯片

苹果正在研发可用于在数据中心服务器上运行人工智能软件的芯片，此举有可能使其在人工智能领域竞争中占据优势。据知情人士透露，该项目的内部代号为 ACDC（Apple Chips in Data Center）。ACDC 项目已经进行好几年，目前还不确定新芯片何时会推出。此前苹果公司宣布将于 6 月 10 日至 14 日在线举行第 35 届全球开发者大会（WWDC）。知情人士表示，此次大会将重点关注人工智能。届时该公司有望公布其人工智能战略。（华尔街日报）
马斯克的人工智能公司xAI或融资30亿美元

知情人士称，与马斯克关系密切的投资者正洽谈帮助其AI初创公司xAI融资30亿美元，本轮融资将使该公司估值达到180亿美元。据悉，考虑投资此轮融资的支持者包括风险投资公司Gigafund和美国风投家Steve Jurvetson。xAI的融资条款尚未最终确定，计划可能会发生变化。
沙特拟用400亿美元投资AI

沙特政府计划创建一个约400亿美元的基金，用于投资人工智能。400亿美元的目标将使美国风险投资公司的典型融资规模相形见绌。最近几周，沙特主权财富基金的代表与硅谷顶级风投公司之一安德森·霍洛维茨基金和其他金融家讨论了可能的合作关系。他们警告说，计划仍可能有变。据四名知情人士透露，沙特代表向潜在合作伙伴提到，该国正在寻求支持一系列与人工智能相关的科技初创公司，包括芯片制造商和昂贵、庞大的数据中心，这些数据中心对于下一代计算的发展越来越必要。沙特甚至考虑创办自己的人工智能公司。
AI机器人公司Figure以26亿美元估值完成6.75亿美元融资，微软等参投

AI 机器人公司 Figure 以 26 亿美元估值完成 6.75 亿美元融资，本轮融资由微软、OpenAI 创业基金、NVIDIA、杰夫·贝索斯（通过贝索斯远征公司）、Parkway Venture Capital、Intel Capital、Align Ventures 参投。Figure 还与 OpenAI 签署了一项合作协议，旨在开发下一代人形机器人的人工智能模型。此次合作旨在通过增强人形机器人处理和推理语言的能力，帮助加速 Figure 的商业时间表。新资金将将加快 Figure 的人形机器人商业部署时间表，并将用于：人工智能培训、制造业、部署更多机器人、扩大工程人员规模、推进商业部署工作等。
Mistral AI完成4.87亿美元融资

法国人工智能初创公司Mistral AI获得4.87亿美元融资，由Andreessen Horowitz（A16z）领投，英伟达（Nvidia）和Salesforce参投，估值达20亿美元。
ForesightNews 独家 ·

AI 掀起 GPU 短缺潮：区块链如何缓解机器学习瓶颈？

随着人工智能的发展和对 GPU 需求的增加，机器学习行业面临着 GPU 成本和可访问性的问题，让我们看看区块链技术是如何提供解决方案的。
OpenAI CEO被解雇，首席技术官Mira Murati担任临时CEO

OpenAI人工智能技术巨头的CEO被突然罢免，公司宣布将寻找新领导人。公司在网上发布的声明中称，Altman“在与董事会的沟通中不一致，阻碍了其行使职责的能力。”公司表示，“我们相信需要新的领导人来引领OpenAI前进。”同时，OpenAI首席技术官Mira Murati将担任临时CEO，公司表示她已经领导公司的研究、产品和安全功能，是“独具匠心的人才”。公司表示，将寻找永久CEO，期望过渡顺利。
波兰数据保护办公室调查OpenAI的ChatGPT数据处理行为

波兰个人数据保护办公室已经对OpenAI的ChatGPT提出的投诉展开调查，投诉人指控该公司以“非法、不可靠的方式”处理数据。该投诉指控OpenAI以非法和不可靠的方式处理数据，并且其收集和处理数据的规则不透明。投诉人称，在他的案例中，ChatGPT生成了关于他的虚假信息，OpenAI未能满足他根据欧洲通用数据保护条例（GDPR）行使权利的要求。波兰个人数据保护办公室将要求OpenAI回答一系列问题，以便能够彻底进行行政程序。
谷歌启动数字未来计划，投资2000万美元研究负责任的人工智能技术

谷歌及其慈善机构Google.org于9月11日推出了数字未来项目，该项目旨在研究负责任的人工智能技术。公司将向全球领先的智库和学术机构投资总计2000万美元，旨在“促进对话和探究”人工智能技术。谷歌希望通过与外部组织的深度合作和促进负责任的讨论来解决公平、偏见、错误信息、安全和工作未来等问题。

最近浏览

热门币种

每日趋势

每日必读

欢迎回来

注册账号

使用 email 登录

使用 email 注册

检查您的收件箱

瑞士研究人员开发出破解大型语言模型的方法

所有评论

推荐阅读

CyberConnect 转型社交再质押模块化 L2「Cyber」，有何玩法？如何运行？

华尔街日报：苹果正在研发数据中心AI芯片

马斯克的人工智能公司xAI或融资30亿美元

沙特拟用400亿美元投资AI

AI机器人公司Figure以26亿美元估值完成6.75亿美元融资，微软等参投

Mistral AI完成4.87亿美元融资

AI 掀起 GPU 短缺潮：区块链如何缓解机器学习瓶颈？

OpenAI CEO被解雇，首席技术官Mira Murati担任临时CEO

波兰数据保护办公室调查OpenAI的ChatGPT数据处理行为

谷歌启动数字未来计划，投资2000万美元研究负责任的人工智能技术

每日必读

Coinbase：一文看懂 EigenLayer AVS 格局

让 ICO 回归：分布式代币发行 (DTL)

宏观思考：并非都是厄运和阴霾

币安又被罚！遭加拿大罚款约440万美元

灰度报告：解析公链和代币化革命，谁会是RWA的最大受益者？

读懂做市商：灰色地带的掠夺者，保持市场持续流动性

热门标签

分享