0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何应对并解决可能出现的智能体失控问题

电子工程师 来源:未知 作者:李倩 2018-07-04 09:46 次阅读

随着人工智能(AI) 威廉希尔官方网站 和应用的普及,人们对于AI的认识不再只是一种智能机器。近日,麻省理工的研究团队构建了一个有精神病倾向的AI智能体,它表现得就像我们人类一样,有着自己情感和人格。通常,我们只能在一些科幻作品中看到这种人工智能体,也见识过人工智能失控的可怕场景,在现实中我们该如何应对并解决可能出现的智能体失控问题呢。

近日,堪萨斯州立大学的研究人员从精神病理学的角度回答了这个问题。他们称之为“人格障碍治疗”:通过矫正训练来试图改变人类的行为模式;通过药物疗法操纵外部的奖励信号以从根本上改变AI智能体的行为方式。该研究主要分为三步骤进行,具体来看他们的论文:

▌摘要

由于人工智能( AI )威廉希尔官方网站 的动态复杂性已经逐渐接近那些复杂的自适应系统,因此这一定程度上削弱了AI在安全性工程领域的可行性、可控性和可达性。由此可见,对于通用人工智能( AGI )的实例设想也将同样面临这种复杂性的挑战。为了解决这些问题,我们将AI和AGI中的不良行为视为心理障碍,通过建模的方式,从精神病理学的角度分析并控制这些不良行为。相应地,我们进一步讨论了这种精神病理学方法在AI、AGI安全工程方面的可行性,并为AGI中心理疾病的研究建模,诊断和治疗提供了一种通用的方法。

▌简介

虽然人类认知的自适应机制为其适应动态环境提供了独特的手段,但是这也容易产生心理紊乱问题,这是一种被广泛定义为对自我或社会生态系统的核心和长期目标会产生危害的自我重构行为。根据这一现象不难推断,具有类似认知能力的通用人工智能( AGI )实例也可能容易引发这种疾病。例如,某些目标功能和环境条件在重复的高回报奖励策略下,可能会导致强化学习( RL )的代理得以发展一些成瘾的行为,这违反了代理长期的目标策略。此类突发性疾病的其他情况还包括创伤后行为,抑郁症和精神病等。

目前对于人工智能(AI)安全研究主要集中在安全意识设计及其缓解威廉希尔官方网站 ,但随着AI、AGI复杂性的不断扩大,将使得这种疾病分析会像生物智能分析一样困难。要解决人类智能方面的难题,我们需要从神经科学、认知科学再到心理学,精神病学,社会学和犯罪学等各种抽象层面,去研究不良行为的原因和动态。本文,我们建议使用精神病理学的方法来研究AI和AGI中的疾病问题,提供其中的威廉希尔官方网站 讨论和动机,并建立二者之间的并行性。

▌精神病理学

精神病理学是指对精神障碍的起因及其相关治疗手段的科学研究。在这种背景下,引用美国精神病学协会( APA )对精神障碍的定义:精神障碍是一种在“心理学”与痛苦,残疾相关的心理综合症,它可能会增加相关的综合症或模式死亡风险或重大自治权丧失(如追求目标)的几率。在精神病理学中,精神障碍通常由四种异常指标所决定,被称为四个Ds:行为和情感的偏离规范,由疾病引发的个体痛苦、损害个体正常功能的机体障碍或机能失调,以及个人对自身或社会的危险。

导致人类精神出现障碍的原因,包括遗传的混合物(如神经质),父母虐待行为对个体发育的影响,社会影响(如虐待,欺凌行为)和创伤事件,以及一些生物学影响(如创伤性脑损伤和感染)等。

目前,人们普遍认为,理解心理障碍需要全面考虑生物和社会因素的影响,因此生物心理社会学模型通常被用来研究这种现象。这些模型将精神障碍广泛地分为认知障碍或行为障碍。认知障碍是由潜在认知机制所引发的的异常功能引,而行为障碍是通过发展,环境和社会互动所学到的。

精神障碍的诊断通常基于对症状及构成各种疾病类型障碍的评估。一个用于全面评估精神障碍的框架是由美国精神病学家出版协会( APA )发布的诊断和统计精神疾病手册( DSM )。本手册提供了通用语言和标准的精神障碍分类标准。此外,最近随着机器学习的进展,各种软件和算法工具也被研发并用于帮助提高精神障碍的分类和诊断准确性。

此外,精神障碍的治疗通常是一种或两种方法的混合。一种是心理治疗,这是通过一系列心理学技巧进行认为干预的一种形式。药物治疗是另一种针对性的方法,还可以二者的混合来治疗精神障碍。

▌精神病理学与AI安全性

图1 AI和AGI与精神病理学的关系

如上图1所示,我们建立精神病理学与AI、AGI之间的关系,并从建模与验证,诊断,及治疗三个主要领域进行研究。

建模与验证

考虑到人类精神病理学与AI之间存在可描述的相似性,为了打开AI安全性研究的大门,我们需要以一种工程的方式,建立数学模型,研究并验证其中的相似性。在认知和医学科学领域已存在一些精神障碍的动力学模型,在这里我们对这些疾病进行定量分析和探索,并基于神经经济学,复杂适应系统,控制理论和动态数据驱动的范例,开发新的AI和AGI模型。

此外,为了验证模型并确保随后理论的正确性,我们还需要开发实验框架和仿真平台。在任意的、独立的上下文情景中,这些平台必须能够提供广泛实验的手段,对出现的动态行为和认知疾病进行分析,并且还能够兼容各种不同的代理和环境模型。

疾病的诊断与分类

这部分主要是用于研究并开发人工智能障碍得诊断威廉希尔官方网站 。在人工智能安全工程的背景下,诊断指的是两个相互关联的任务:第一个是异常行为的检测,第二个是对检测到的异常行为进行分类治疗。因此,我们需要开发相应的机器学习方法来诊断并对疾病进行分类处理。

此外,在仿真训练相关疾病和注释情景下,我们还可以从模型中学习到不良行为的通用指标。一旦模型检测到错误行为,下一步就是进行特征化并对导致这种行为的疾病进行分类。然而,这个过程的先决条件是需要一系列不同的疾病和相应的诊断标准。因此,我们还需要汇编一些有代表性和经过实验验证的疾病。

疾病治疗

当AI代理诊断出疾病时,简单地停用或重置代理的做法并不总是可行的。在这种情况下,我们希望代理能够倾向于通过最小破坏性的威廉希尔官方网站 去治疗纠正错误的行为,同时保留代理所学到的有用特征。这样的治疗需要满足一些具有挑战性的要求。

高级的AI代理通常都是很复杂的自适应系统,因此可能其中一个组件的微小扰动可能都会导致局部或整体产生意想不到的后果。因此,有效的治疗手段必须是完全微创或非侵入性。受精神病理学相似性的启发,我们提出了两种一般方法治疗疾病。一种是矫正训练,这是采用行为疗法的一种方式。

这种方法是需要在特定的环境或情境下重新训练我们的代理,以便通过新的学习经验去纠正或缓解有害的行为。第二种方法与药物治疗类似,AI代理的奖励信号是通过外部手段人为地操纵并调整它们的行为策略。

▌结论

当前对于AI安全性的研究主要侧重于设计和缓解问题,AI和AGI的复杂性将使得这种分析变得困难。考虑到诊断并治疗AI、AGI中实际目标的不良行为,我们提出采用精神病理学的方法研究AI、AGI的安全性工程。

我们依次介绍了AI、AGI安全性工程,分析了人类疾病与精神病理学之间的相似之处,并建立精神病理学与AI、AGI安全性之间的关系,提出了包括建模与验证、诊断与分类,及疾病治疗的三步骤方案,打开了安全性工程的研究大门。我们希望本文的研究能够为未来的研究和发展奠定坚实的基础。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1792

    文章

    47409

    浏览量

    238919
  • 智能体
    +关注

    关注

    1

    文章

    155

    浏览量

    10593

原文标题:应对AI失控,研究人员提出用“人格障碍治疗”解决问题

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    解决MCU应用系统中上电暂态时输出失控的方法

    的常规IO在上电暂态过程中是弱上拉输出的,即输出逻辑1,如果用常规正向思维往往会采用正逻辑设计,即高电平有效,那么上电暂态中就非常可能会有失控现象,采用负逻辑即可解决。上电暂态中,IO输出随着电源的建立
    发表于 12-08 10:54

    基于像素失控的剖析

    。二、像素失控的原因: 1、LED自身品质不佳。2、使用方法不当。3、失控的最大诱因是静电放电引起,静电放电导致LED管失效的机理非常复杂,设备、工具、人体等均有可能带有静电对其放电
    发表于 06-12 11:43

    让海外的智能硬件在国内成为爆品,可能吗?

    导语:还记得《星球大战》中萌萌的BB-8机器人吗?这个出现在迪士尼新片中的萌宠机器人,被授权给美国玩具商Sphero公司研发生产,1月13日出现在了京东智能的活动上。我们看到的许多智能
    发表于 10-31 18:56

    全彩LED显示屏像素失控怎么办?

    晶胶、PPA 杯等材料热膨胀系数的差异,引发其内部应力的不同而产生的。静电放电导致LED失效的机理,非常复杂,设备、工具、器皿及人体均有可能带有静电对其放 电,这种静电少则几百伏,高则几万伏,放电
    发表于 09-21 16:16

    电机在高速旋转时会中断或失控

    `make flash`时无法烧录固件其他可能不会产生错误代码的问题电机在高速旋转时会中断或失控(ie: > 5000 RPM)静止时电机振动或发出噪音电机位置控制出现过冲或在目标位置震荡电机开...
    发表于 09-17 09:00

    基于4位单片机SH66P58的智能脂秤方案设计

    介绍基于4位单片机SH66P58的智能脂秤方案设计,对量产设计可能发生的问题做了相关说明。智能
    发表于 11-29 07:42

    浅析锂电池正极材料热失控的真正原因

    通过将复合电极热失控前后的相分布进行单个电极颗粒层面的成像,并将多种相分离现象在热失控前后的相关性进行了纳米级别的可视化,专家发现热失控可能与导电剂以及粘结剂的分布呈现密切的相关性。
    的头像 发表于 07-24 11:24 5253次阅读

    失控扩散的防御措施有哪些

    在目前的热失控扩散的防御措施里面,核心的还是谈性价比,模组和 Pack 层面,前者花的成本更多一些,需要很多的措施来在第一个电芯出现失控之后就地阻止第二个电芯热失控,在最近几个月 B
    的头像 发表于 01-16 16:52 2235次阅读

    如何应对无法根除的锂电热失控

    充电电池发热属于正常现象,但是涉及电池安全,如何应对无法根除的锂电热失控
    的头像 发表于 12-25 21:07 544次阅读

    元宇宙电影失控玩家

    失控玩家》是近期比较火爆的电影,《失控玩家》脑洞很大,给元宇宙增添无限想象力,电影里面体现了关于人工智能觉醒的答案,展现了现实和虚拟世界高度融合,里面的数字NPC角色可以为我们提供服务。
    的头像 发表于 11-05 10:35 1910次阅读

    联汇科技发布自主智能 OmBot 欧姆智能及 OmBot OS 操作系统

    智能的发展都表现出极大兴趣,寄予厚望。 大语言模型的出现,无疑给 AI 智能的发展带来了
    的头像 发表于 07-11 14:07 506次阅读
    联汇科技发布自主<b class='flag-5'>智能</b><b class='flag-5'>体</b> OmBot 欧姆<b class='flag-5'>智能</b><b class='flag-5'>体</b>及 OmBot OS 操作系统

    锂电池热失控气体产生原因、分析方法

    设计缺陷、电池使用不当以及恶劣工作环境。以下将对这三个方面进行详尽、详实、细致的分析,介绍相应的分析方法。 首先,电池设计缺陷是导致锂电池热失控气体产生的一个重要原因。电池的设计缺陷可能表现为材料选择不当、结构
    的头像 发表于 12-08 15:55 1262次阅读

    锂离子电池热失控过程,不同锂电池热失控反应一样吗?

    非常复杂的化学性质,可能会导致热失控,这对于电池的稳定性和安全性构成了挑战。 不同种类的锂离子电池在热失控过程中可能表现出不同的反应和行为。然而,大多数锂离子电池在热
    的头像 发表于 01-10 15:16 690次阅读

    极限失控的大模型使电力系统面临的跨域攻击风险及应对措施

    分析大规模生成式预训练模型(以下简称为大模型)发生极限失控、使电力系统面临的跨域攻击风险及相关的应对措施,以期引起业内对这一风险的重视、讨论与行动。基于大模型的现状、发展趋势以及它与人工智能反叛之间
    发表于 07-22 12:09 0次下载

    聚徽-工控一出现黑屏怎么处理

    工控一出现黑屏可能有多种原因,以下是一些可能的解决方法:
    的头像 发表于 08-16 09:24 602次阅读