0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

将人类知识转移到人工智能

星星科技指导员 来源:mouser 作者:Michael Matuschek 2023-05-16 09:10 次阅读

2020年,超过44亿互联网用户通过社交媒体帖子、评论、推荐以及类似的互动产生了惊人的数据量。从这些数据中收集的见解对于指导企业和创新者进行产品开发、市场营销和客户支持都是无价之宝。但是,由于人类语言和文化背景的复杂性,让机器很难理解和解释客户提供的观点性数据,因此提取见解极具挑战性。自然语言处理 (NLP) 和机器学习 (ML) 等工具使计算机能够理解人类语言并得出其中的含义。此外,情感分析是人工智能 (AI) 研究的一个前沿领域,它可以帮助机器理解客户提供的非结构化数据,并将观点解释为肯定、否定或中立。

语义分析中的语言复杂性

为了解自然语言处理中的情感分析,让我们先来看看餐厅点评中的一个简单表述:“汤很不错”。 对其中情感的分析包括三个步骤:

确定表述、语句或全文中是否包含观点。
了解这些观点是肯定、否定还是中立的 (也就是所谓的极性)。
确定观点的目标。

在本例中,对于餐厅提供的特定餐品,情感分析得出的无疑是正面结论。但是,其他例子则不太直接,例如与之类似的另一个表述:“啤酒很凉”。许多人会认为这种观点是正面的,因为他们喜欢这样的啤酒,但是凉这个词如果换到其他语境中,它的“极性”可能就是负面的。例如,“咖啡很凉”这个表述的结构和形容词完全相同,但许多人都不会认为咖啡凉了是一件好事。

其他语言复杂性也带来了更多的挑战,例如包含多种情感的表述,比如说:“菜不错,就是汤有点凉”。在这里,我们根据客户对汤冷、汤热的偏好,会得出正面、负面和模棱两可的情绪。同样,如果说“汤热乎乎的,但是啤酒很凉”,对大多数人来说这都是一种正面表述,但在某种潜在的客户语境下却模棱两可。

修饰语进一步模糊了“极性”之间的界限。例如,可以想象一下这样一条意见:“工作人员太过热情了”。在这里,我们还必须考虑讽刺、嘲讽或修辞手法,这使得正确识别情绪具有挑战性。例如“我们等了一个多小时了,这服务也太好了吧!”这种表述在训练数据中往往不多见,并且很难通过系统性的方式来手动编码。

语义分析中的文化变量

将个人、文化或环境偏好纳入考量后,判断观点的“极性”就变得更具挑战性。例如,现在我们来分析一下客户对日式旅馆的评论。传统的日式旅馆往往都豪华昂贵,但配备的沐浴设施是公共洗浴区而非独立浴室。将有无某种东西归类为正面或负面看起来似乎直截了当,例如:“淋浴间有污垢”或“有一个儿童游泳池”。然而日式旅馆的例子说明了为什么将文化变量和个人喜好纳入考虑对于获得有用的数据见解至关重要。在日本,客人认为公共洗浴区是一个正面的属性; 相比之下,大多数欧洲游客会对此持负面看法,对费用较高的酒店而言尤其如此。这个例子所表现的还只是一个特征和两种文化。

解决自然语言处理中的语言和文化多样性问题

在自然语言处理中,可能需要在整个文档级别以及段落和句子级别分析情感,往往做完了这一步才能汇总出结果。全文档分析非常有用,而段落和句子级别的分析可以产生更细粒度和相对准确的结果(即除了可以识别对产品整体的情感外,还可以识别有关特定产品特征的情感)。这一过程的挑战来自于如何制订出一套词汇,并将这套词汇作为一组规则,让机器用它来将情感分类为正面、负面或中立。对此,我们可以先从许多免费工具和资源用起,它们都已经在公开数据上进行过训练。例如,Natural Language Toolkit、spaCy和TextBlob等软件库都包括情绪模型,而且还允许使用用户数据进行再训练。如果您不喜欢写代码,那么Google Cloud Platform或Microsoft Azure等云服务都可以让您立即开始进行情绪分析:只需将需要分析的文本粘贴到浏览器中,然后就可以构建您的应用了。

除了原型之外,数据集和机器学习模型还应进一步解决语言和文化复杂性的问题。这就意味着:

在计划上, 需要找出一种结构化的方法来发现多样性和有用的深入见解。例如,分析您的数据以了解深层的语言和文化、语气、来源、作者人口特征,然后咨询语言学家以解释这些要素。通过采访与作者同属一个群体的人来进一步细化您的方法,以准确了解微妙差别和语境。
在训练数据上, 需要确定多样性处理所需的示例,并添加人工提供的注释。这也可能意味着查阅诸如词典等知识库、为特定问题添加更多训练数据,或者在某些情况下,从数据中删除对结果的客观真实性构成损害的不良或误导性内容。
在建模上, 需要找到相应的方法,以数学上可处理的方式来表示句子。例如,将任意文本表示为数值向量的词嵌入,这种方法可用来将语境中使用的单词映射为相应的正面、负面或中立情绪。理想情况下,数据分析会显式或隐式地基于各客户的偏好进行。但是,这种分析相当麻烦,而且在许多情况下,如果用户资料无法辨识,就无法进行分析。更易采用的方法是根据地区和语言分析数据,然后使用单独的训练示例对文化差异进行建模。

结论

客户在媒体帖子、评论、推荐中提供的数据为企业和创新者提供了宝贵的见解。自然语言和文化的复杂性让由人工智能驱动的机器难以理解客户的观点;但是,情感分析可以帮助确保这些方面被捕获并反映在见解中。您可以从使用免费工具和资源入手,但是解决语言和文化复杂性的问题具有挑战性,需要大量的计划、数据准备和建模。提高对语言和文化复杂性的认识是获得有用的见解的良好起点,也是一条极有价值的途径,让您能够进一步了解客户和他们的需求。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 互联网
    +关注

    关注

    54

    文章

    11163

    浏览量

    103396
  • 机器学习
    +关注

    关注

    66

    文章

    8422

    浏览量

    132724
  • nlp
    nlp
    +关注

    关注

    1

    文章

    489

    浏览量

    22049
收藏 人收藏

    评论

    相关推荐

    CSP LED切割前如何转移到UV膜上

    倒装芯片底部与高温胶膜接触,封装后如何芯片底部与高温膜分离,然后转移到UV膜上?
    发表于 10-29 23:23

    在这五件事情上 人工智能人类更出色

    的东西。然而,塔夫斯大学的一支研究团队已经证明这些批评者都是错的。智力发现新知识,在这个过程中并不需要意识的帮助。研究者通过遗传算法与基因通路模拟相结合创建了一套系统,其做出了第一条由人工智能发现
    发表于 01-15 12:09

    人工智能的前世今生 引爆人工智能大时代

    ,还是威廉希尔官方网站 作为目标本身。这种差异的体现是,制造越来越强大的计算机、软件和机器人的目的是以人类用户为核心进行设计,还是替代人类人工智能与注重人机交互的
    发表于 03-03 11:05

    人工智能--失业将是人类面临的最大挑战

    以前总觉得类似机器人可能会夺走人类的工作,甚至会控制人类,最终夺取这个星球等议论,只是科幻迷们的自娱自乐,离现实还很遥远,但在围棋高手李世石和AlphaGo人机大战中失败;日本开发的人工智能会写小说
    发表于 06-27 11:06

    人工智能:革命还是伤害?

    遥远,实际上它已经开始走入我们的生活,而且正以一种磁悬浮般的速度向我们奔来,人工智能已经打响21世纪新的军备赛。看起来人工智能会给人类带来很大的便利,但有一部分人却担心过于智能会威胁到
    发表于 10-10 14:21

    人类人工智能机器人合作的前景

    的工资会比原来高出很多。  其次,人类的生活品质会极大提高。人工智能的进步将带来许多社会利益。例如,无人驾驶汽车会减少90%的交通事故。人工智能可以人们从日常工作中解放出来,寻找新的
    发表于 04-16 17:42

    vDGA转移到vGPU

    嗨 - 有关某人从vDGA转移到vGPU需要做些什么的想法?我们是否删除了PCI HOLE条目?“2.调整pciHole.start。注意:仅当虚拟机的配置内存超过2GB时才需要此选项。对于配置
    发表于 09-07 16:47

    解读人工智能的未来

    识别猫,而不会同事识别狗等其他动物。AGI是人们恐慌人工智能的主要原因,他们恐慌的原因是都相信我们构建出一个无人监督的学习者,它将以人类无法控制的速度递归地进化自己,如此日复一日,年复一年,AGI
    发表于 11-14 10:43

    人工智能:超越炒作

    人工智能发展的关键组成部分,有助于AI作为未来的主流。而这仅仅是个开始。AI:反映人类推理的对象根据经典的定义,人工智能是一个相当不引人注目的事件。在他开创性的1976年论文“
    发表于 05-29 10:46

    人工智能能否取代人类

    不断被刷新的媒体头条,好像AI取代人类是完全可能而且理所应当的事情。手把手教你设计人工智能芯片及系统(全阶设计教程+AI芯片FPGA实现+开发板)详情链接:http://url.elecfans.com/u/c422a4bd15
    发表于 09-11 11:52

    中国人工智能的现状与未来

    机器学习,计算机视觉等等,总的说来,人工智能研究的一个主要目标是使机器能够胜任通常需要人类智能才能完成的复杂工作。那人工智能知识体系有哪些内容呢?下面是新一代
    发表于 07-27 06:40

    ch579例程里使用的是Keil编译,转移到MounRiver是有什么要配置的吗?

    579例程里使用的是Keil编译的,我工程转移到MounRiver来编译,编译成功了,下载程序跑起来会,串口会有几率乱码,在转移到MounRiver是有什么要配置的吗J?还是说兼容不MounRiver编译?
    发表于 09-02 06:47

    如何pin从arduino转移到esp32?

    大家好,我最近将我的项目从 Arduino 转移到 ESP32,我在 arduino 上使用引脚 10,9 从我的设备和库 SoftwareSerial 传输 RX/TX。我想知道我可以在 ESP 中使用哪个引脚,如果我要使用 ESPSoftwareSerial。
    发表于 04-12 06:14

    企业应把重点从基于数据的AI策略转移到基于知识的AI策略

    AI公司最具战略意义的护城河,但在未来几年中,专有数据将不再是一种独特的资产,从而使专有数据差异化的可持续性降低。因此,我们希望重点从基于数据的AI策略转移到基于知识的AI策略。
    的头像 发表于 09-22 15:02 1506次阅读

    IBM宣布拆为两家公司,重心转移到云计算和人工智能业务上

    当地时间10月8日,有109年历史的蓝色巨人IBM宣布分拆为两家公司。IBM此举旨在重心转移到云计算和人工智能等利润率更高的业务上,而IT基础设施部门将于明年被剥离出去成为一家新公
    的头像 发表于 10-10 16:42 1784次阅读