新V不雅国外：Anthropic警示AI陡立力

发布日期：2024-11-01 17:22 点击次数：190

（原标题：新V不雅国外：Anthropic警示AI陡立力）陈沛/文在OpenAI积极转型牟利机构加快AI愚弄落地的同期，被视为OpenAI主要竞争敌手的Anthropic新发布了一篇AI陡立力的论说，无间引颈AI安全对皆连

（原标题：新V不雅国外：Anthropic警示AI陡立力）

陈沛/文在OpenAI积极转型牟利机构加快AI愚弄落地的同期，被视为OpenAI主要竞争敌手的Anthropic新发布了一篇AI陡立力的论说，无间引颈AI安全对皆连系的前沿风向。

Anthropic提议翌日AI四类安全风险

Anthropic这篇名为《前沿模子陡立才气风险评估》论说提议，现在AI安全连系主要聚焦规矩坏心用途，而跟着翌日AI才气将跨越东说念主类，也要提前连系AI主动陡立风险。

Anthropic具体连系了四类风险：通过安全可靠的花样误导东说念主类决议、在系统中插入难以发现的作假代码、经受安全测试时稀奇覆盖危机才气、陡立东说念主类成就的AI安全风险监测系统。

Anthropic也对这四种风险分辨提议了评估场景、测试神色、风险阈值、分析效果和发展瞻望，并对自家Claude-3-Opus、Claude-3.5-Sonnet模子作念了评估。

评估效果是现在模子的陡立风险可控，但跟着翌日模子才气提高，提前连系更强力的应酬门径满盈是有必要的。

Anthropic的安全理念正劝诱更多AI东说念主才

Anthropic自2021年由Dario Amodei、Daniela Amodei等前OpenAI连系厚爱东说念主创立。他们在OpenAI期间积存了丰富的深度学习、当然谈话处理、AI安全连系教唆，但在AI安全和可诠释性方面理念不同，因此离开OpenAI自作宗派。

Anthropic公司名字平直体现了以东说念主为中心的理念，更强调构建可诠释、安全可靠的AI系统，增强东说念主们对AI的信任。

特别是客岁OpenAI晓示由前首席科学家Ilya Sutskever和团队厚爱东说念主Jan Leike牵头超等对皆连系后，坐窝劝诱无数神志。不事自后发生宫斗，OpenAI超等对皆厚爱东说念主Jan Leike晓示加入更爱重安全的Anthropic。近期遴荐加入Anthropic的还有OpenAI连合创举东说念主John Schulman等。

这些高层加入让Anthropic实力大增，也标明Anthropic的安全理念启动取得修起，延续超等对皆连系。

对翌日超等智能的安全风险尚未酿成共鸣

诚然Anthropic对AI可诠释性的探索可能对AI发展产生潜入影响，但现在来看，奈何看待AI风险还远莫得酿成共鸣。

举例图灵奖得主、Meta首席AI科学家Yann LeCun最近示意，对AI可能要挟东说念主类生计的担忧满盈是瞎掰八说念。

此外，永恒以来AI从业者中也有一种不雅点，以为AI公司过分强调期间危机性是为了突显期间才气，以便在融资时取得更高估值。

这些不雅点与Anthropic的安全对皆连系其实不矛盾。因为安全对皆是假定翌日超等智能出现，以此预测翌日的未知风险，并站在今天的角度从底层启动分析和提前退缩，因此很难平直下定论。

至少Anthropic的安全连系对咱们能起到警示作用。在此次发布论说的驱散，Anthropic指出，在AI器具默许会匡助东说念主类的情况下，东说念主类用户很难对AI提供的建议产生合理怀疑。而这小数在接下来AI智能体愚弄设备经过中，要是不严加措置和高度对皆，必将会激发新的安全风险隐患。

<< 上一篇：“烧钱”的自动驾驶，广汽投疯了 | 下一篇：不雅察：壁挂炉以旧换新，还需买通三大“消耗堵点” >>

栏目分类

虎嗅网洞察

（原标题：新V不雅国外：Anthropic警示AI陡立力）陈沛/文在OpenAI积极转型牟利机构加快AI愚弄落地的同期，被视为OpenAI主要竞争敌手的Anthropic新发布了一篇AI陡立力的论说，无间引颈AI安全对皆连

友情链接：

Powered by 虎嗅网洞察 @2013-2022 RSS地图 HTML地图

让建站和SEO变得简单

新V不雅国外：Anthropic警示AI陡立力

栏目分类

相关资讯

虎嗅网洞察

让建站和SEO变得简单

新V不雅国外：Anthropic警示AI陡立力

栏目分类

热点资讯

相关资讯

虎嗅网洞察