0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GelSight触觉传感器:表面柔软、分辨率高,能复刻整块饼干的形状和纹理

hl5C_deeptechch 来源:DeepTech深科技 作者:DeepTech深科技 2021-01-06 13:59 次阅读

近年来,人工智能AI)的发展势头从最初的兴起逐渐走向平缓,现阶段 AI 领域面临的一个瓶颈就是十分依赖人工标注的数据,正如数据标注行业流行的那句话,“有多少智能,就有多少人工”。

如果可以让机器人自己进行数据采集、数据分析,无疑可以节省很多人力。麻省理工学院(MIT)计算机科学系博士王少雄认为能够让机器人学会自我分析是一件令他十分兴奋的事情,“机器人可以利用自动化的方式自己重置系统,以及通过和物体交互的过程来自己学习”,他觉得这样在数据标注方面可以节省很多人力。

今年,王少雄和另外一位一作王辰的一篇有关机器人可以自我采集触觉数据并自我分析,最终能够完成特定动作的论文获得了机器人领域国际顶会 IROS 2020 的最佳论文奖。

下图的机器人就是他们研究的成果,它叫 SwingBot,可以把它理解为是一个 “甩笔” 机器人。它将这根笔由下到上翻转了 180 度,这真的不是研究人员给它 “喂” 了大量的数据才建立的模型,这是它通过自我采集触觉数据并学习分析后的结果。

293fa934-4fcd-11eb-8b86-12bb97331649.gif

这项研究来自于麻省理工学院(MIT)与上海交通大学的暑期联合项目,论文题目为 “SwingBot: Learning Physical Features from In-Hand Tactile Exploration for Dynamic Swing-up Manipulation”(SwingBot:从手部触觉探索中学习物理特征,以实现动态摆起操作)。

论文的两位一作分别是王辰和王少雄,王辰刚刚本科毕业于上海交通大学、即将前往斯坦福大学攻读计算机科学博士学位,少雄本科毕业于清华大学、目前是 MIT 计算机科学系在读博士生。

“我们在思考怎样才能让机器人通过简单的动作去感知手上握有物体的物理特性,比如物体的质量、重心,物体表面的摩擦力等,” 王辰告诉 DeepTech。

因为人在做很多控制任务的时候,其实并不需要知道这些精确的物理参数,但是我们通过一些掂量的动作,就能够感受到这个物体的特性,比如我们在看手机时,谁也不会拿手机的上部,因为我们能感受到托住手机的下部才是最省力的,但谁也无法分析出具体关于力的物理参数。

研究人员正想让机器人通过自我学习来解决这样的问题,让它自我采集数据进行整合分析,不断地学习,最终希望它不仅能分析出完成相关动作所需的物理参数,还能顺利拿起未知物体完成指定动作。

如果说这篇论文的出彩之处是培养了机器人对触觉的分析能力,那么实验中用到的触觉传感器则至关重要。

GelSight 触觉传感器:表面柔软、分辨率高,能复刻整块饼干的形状和纹理

GelSight 最初是为测量目标表面的三维形状和纹理而设计的,由覆盖有反射涂层膜的透明弹性体板组成。当物体被压在弹性体上时,薄膜会变形,呈现物体表面的形状,但具有一致的反射率。例如研究人员以奥利奥饼干为例,将饼干压在弹性体板的表皮上,从后面看,薄膜能够完全复刻出饼干的形状和纹理。

33ecab5c-4fcd-11eb-8b86-12bb97331649.png

图|将饼干压在弹性体板的表皮上。来源:[1]

王少雄告诉 DeepTech,“这个触觉传感器其实是一个非常新的处理系统,目前还处于研究阶段,它最大的特点就是可以以整张图像的形式输入,而其它的传感器可能只有十几个电极,这就极大的丰富了触觉的感知能力。”

王辰补充道,“GelSight 触觉传感器的一大优点是成本更低,而且能够返回高密度的光学信息,能够更好的获得触觉端对物体的感知情况。”

研究中用到的触觉传感器 GelSight 同样出于 MIT 实验室,最初是 MIT CSAIL 感知科学小组教授 Edward H. Adelson 2009 年的研究成果,近年来逐步研发并应用于机器人触觉中。

图 | GelSight 原型,CVPR 2009。来源:[1]

图 | GelSight 运用于机器人触觉,Sensors 2017。来源:[2]

在本篇论文中,研究人员将下图中的传感器安装在机械臂的抓手上,以此来采集不同质量、重心物体的数据。

34b93988-4fcd-11eb-8b86-12bb97331649.gif

若要让 Swingbot 很好地完成甩笔任务,虽然研究人员猜测质量、重心、摩擦力等参数可能会影响实验结果,但是他们并不知道究竟是哪一部分占主导作用,“所以需要机器人具备分析能力,我们希望它能够通过倾斜以及抖动这些简单的探索动作,自己从触觉传感器的反馈信息当中搜集完成这个任务所需要的信息。” 王辰说道。

触觉探索第一步:通过倾斜+摇晃,机器人得到不同笔的物理特征

研究方法由两个主要部分组成,一个信息融合模型和一个正向动力学模型。研究人员首先让 SwingBot 执行两个动作,分别是倾斜和摇晃,这是一种手持式物理特征探测方法,帮助机器人进行触觉探索。一旦机器人学会嵌入物体的物理参数,正向动力学模型就会通过特征向量和控制参数来产生起摆运动,以实现最终的 “甩笔” 角度。

少雄说道,“我们想让机器人去感觉一个未知的物体,通过让它完成特定的操作来感知物体的物理信息,然后我们可以借助这个物理信息应用到控制系统中。”

359442b2-4fcd-11eb-8b86-12bb97331649.png

图|机器人采取几个步骤来获取被持有对象的物理特征

在训练初始一定伴随着很多困难,比如机器人总是拿不住笔,但这些都没能难住他们。“我们在底下安装了一个 V 型的槽,一方面它可以回收和接到飞出去的笔,另一方面它通过顶部的相机可以捕捉物体的一个位置,然后它可以去调节这个物体,让它重新到最初的位置。通过这个方法就完全不需要人为去参与。” 王辰告诉 DeepTech。

在机器人完成倾斜动作时,研究人员发现,当物体倾斜到一定的角度时能够检测出物体的质量,因此他们分别让机器持笔倾斜到 20 度和 45 度,可以观察到物体重量产生不同的力和扭矩分布。这些触觉反馈信息会通过一个卷积神经网络(CNN)来输出一个一维的特征向量。

36344226-4fcd-11eb-8b86-12bb97331649.gif

在机器人完成晃动任务时,从触觉信号的时间序列中可以观察到不同的摩擦和震动,研究人员用一个循环神经网络(RNN)来处理获得相应的特征,可以获取有关摩擦力和惯性矩的信息。

3691e6a6-4fcd-11eb-8b86-12bb97331649.gif

然后,一个由若干多层感知器(MLP)组成的信息融合模型会将以上两步中收集到的物理特征进行整合分析,得到一个低维的物理特征概括,这也就是机器人获取自我分析能力的基础。

自我采集 1300 多组数据并分析,成功将笔甩至 90 度和 180 度

在机器人具备自我分析能力后,才迎来了研究的重点 —— 甩笔,这项任务看似单一且简单,实则不然。

王辰告诉 DeepTech,甩笔其实是一个非常不稳定的任务,“刚开始的时候不仅需要四处捡笔,而且有时它根本不能把笔甩起来,或者甩不到我们想要的角度。在这个过程中,我们发现对于收集数据也非常困难。”

王辰还透露,机器人自我采集的数据一共有1300多组,包含27个不同物理特性的物体,采集这些数据用了大概一天的时间。“当完成采集时,这也是成功的讯号。”

37baf9e6-4fcd-11eb-8b86-12bb97331649.png

图|通过添加 / 摘除相关零件以及换不同摩擦系数的笔头来制作不同物理特性的物体

最后一步就是让学习了物理特征的预测模型尝试将那些未知特征的笔甩到特定角度,对此,研究人员准备了 6 个测试对象,从机器人准备甩笔到完成特定的角度,整个过程只有 5 秒左右。

37ee9e36-4fcd-11eb-8b86-12bb97331649.gif

38b97fde-4fcd-11eb-8b86-12bb97331649.gif

对于这些未知的物理特征,SwingBot 也能成功完成指定动作,王辰称,最终的误差仅在 10 度左右。

3983c5fa-4fcd-11eb-8b86-12bb97331649.png

图|定量评价预测模型与物理嵌入的结果

研究人员证实了借助这种融合模型,可以将多个探索动作获取的信息组合到一个联合嵌入空间中,以端到端的自我监督方式来训练机器人,最终 SwingBot 能够很好地完成甩笔动作。此外,该研究还表明,学习到的面向任务的特征嵌入也可以成功地回归个体的物理特性,如质量、质心、惯性矩和摩擦。

关于未来的研究方向,王辰说道,“甩笔是一个比较简单直观可以理解的一个例子,但是这个触觉分析的能力未来可以用在很多其他的任务上,不仅不单单只是这样的一个甩笔任务。”

两位一作

一次暑期研究的机会,二人通过邮件结识。就这样,今年夏天刚刚从上海交通大学毕业的王辰和 MIT 计算机科学系在读博士生王少雄开始了这次长达六个月的合作,而他们本身也都十分优秀。

图|王辰

王辰在今年获得了上海交通大学计算机科学学士学位,师从卢策吾教授。大学期间,王辰也参与了多次实习项目,他在 2018 年 6 月至 2019 年 8 月担任斯坦福大学的研究实习生,Silvio Savarese、朱玉可和李飞飞都是他的导师。他还在 2018 年 1 月到 5 月期间参与 “Transferable Force-Torque Dynamics Model for Peg-in-hole Task” 项目的研究,研究成果也提交到了 IROS 2019。接下来,王辰即将前往斯坦福大学继续攻读计算机科学博士学位。

图|王少雄

王少雄本科就读于清华大学计算机科学与威廉希尔官方网站 系,师从唐杰。毕业后他去到 MIT 继续深造,目前是 MIT 计算机科学系在读博士生。从 2016 年至今,王少雄共发表了六篇论文,除了本次的 SwingBot 项目获得了 IROS 2020 最佳论文奖,今年 7 月他参与的研究的 “操纵电缆机器人” 项目(Cable Manipulation with a Tactile-Reactive Gripper)也入围了机器人领域国际顶级会议 RSS 2020 最佳论文。

图|操纵电缆机器人

最后,提到对于 AI 发展的前景以及对于通用人工智能(AGI)的畅想,二人直言没有想那么远。“我们更多希望看到的是有一个实际的问题,然后知道这个问题的难点在哪里,如何去解决它。因为其实当下对于机器人控制的话,还有很多问题没有解决,远还没有到去思考 AI 会不会像人一样,总归是一步步来。” 王辰说道。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    211

    文章

    28389

    浏览量

    206942
  • 人工智能
    +关注

    关注

    1791

    文章

    47207

    浏览量

    238280
  • 触觉传感器
    +关注

    关注

    4

    文章

    85

    浏览量

    9339

原文标题:机器人有 “触觉” 了!上交&MIT发明一款机器人,自己拿起笔就能甩|IROS 2020最佳论文

文章出处:【微信号:deeptechchina,微信公众号:deeptechchina】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    HDMI接口支持哪些视频分辨率

    支持最大分辨率4K(3840x2160)@30Hz。这意味着在4K分辨率下,HDMI 1.4能以每秒30帧的速度传输视频。 同时支持1080p分辨率下的刷新
    的头像 发表于 11-27 14:14 999次阅读

    Meta正努力推进人工智能触觉传感器的市场化进程

    11月1日,据TechCrunch报道,Meta近期宣布与传感器专家GelSight及韩国机器人企业Wonik Robotics携手,共同推进人工智能(AI)触觉传感器的市场化进程。
    的头像 发表于 11-01 15:57 564次阅读

    触觉传感器的发展,对机器人产业有什么影响?

    从工业生产线的自动化到家庭服务的智能化,机器人的身影无处不在,它们正在改变着我们的生活方式和工作模式。而在这一过程中,触觉传感器的发展起到了至关重要的作用。触觉传感器,这一能够感知物体
    的头像 发表于 10-23 18:25 495次阅读

    高速、高分辨率传感器的价值

    电子发烧友网站提供《高速、高分辨率传感器的价值.pdf》资料免费下载
    发表于 08-29 10:01 0次下载
    高速、高<b class='flag-5'>分辨率</b>光<b class='flag-5'>传感器</b>的价值

    VR显示分辨率的选择

    一、VR显示分辨率的重要性 1.1 分辨率与视觉体验 分辨率是指显示上能够显示的像素点的数量,通常用水平像素数×垂直像素数来表示。在VR
    的头像 发表于 07-08 10:29 1062次阅读

    伺服编码分辨率是什么意思

    。 伺服编码分辨率的概念 伺服编码是一种用于测量电机轴或负载位置和速度的传感器。它通过将机械位置转换为电信号,为伺服控制系统提供反馈信息。编码
    的头像 发表于 06-17 11:16 903次阅读

    伺服电机编码分辨率是多少

    伺服电机编码分辨率是衡量编码性能的重要指标之一,它直接影响到伺服系统的精度和稳定性。本文将详细介绍伺服电机编码分辨率,包括其定义、
    的头像 发表于 06-17 11:13 1503次阅读

    管洞察:高分辨率音乐需要高分辨率扬声

    所有关于高分辨率音乐传输和无损音频或空间音频格式的讨论都为时过早。很少有人分辨出其中的区别——除非他们通过高分辨率、固态扬声聆听。 作者
    发表于 03-21 14:57 876次阅读
    <b class='flag-5'>高</b>管洞察:高<b class='flag-5'>分辨率</b>音乐需要高<b class='flag-5'>分辨率</b>扬声<b class='flag-5'>器</b>

    伺服编码分辨率越高越快吗?

    。较高的分辨率意味着编码能够提供更精确的位置或运动反馈信息。 然而,关于伺服编码分辨率与速度之间的关系,并没有直接的等号关系。分辨率
    的头像 发表于 03-21 08:43 1049次阅读
    伺服编码<b class='flag-5'>器</b><b class='flag-5'>分辨率</b>越高越快吗?

    像素大小和相机分辨率

    由于表面积的增加而能够收集更多的光子。这允许更多的光子转化为光电子,从而提高传感器的灵敏度。但是,这是以分辨率为代价的。 较小的像素能够提供更高的空间分辨率,但每个像素捕获的光子更少。
    的头像 发表于 03-20 06:29 639次阅读
    像素大小和相机<b class='flag-5'>分辨率</b>

    编码分辨率是什么意思 编码分辨率和脉冲数的关系

    按照编码支持的分辨率可以把编码分成标清编码、高清编码、全高清编码
    的头像 发表于 02-21 18:07 4176次阅读
    编码<b class='flag-5'>器</b><b class='flag-5'>分辨率</b>是什么意思 编码<b class='flag-5'>器</b><b class='flag-5'>分辨率</b>和脉冲数的关系

    台阶仪:亚埃级垂直分辨率,领跑新材料纳米加工的测量利器!

    台阶仪具备亚埃级垂直分辨率,可实现纳米级别测量和分析。在纳米加工领域,台阶仪评估材料表面形貌和结构,优化纳米加工过程。其线性可变差动电容传感器具有高
    的头像 发表于 02-19 13:49 645次阅读
    台阶仪:亚埃级垂直<b class='flag-5'>分辨率</b>,领跑新材料纳米加工的测量利器!

    镜头分辨率简述

    分辨率可以从显示分辨率与图像分辨率两个方向来分类。
    的头像 发表于 01-15 11:12 919次阅读

    浅谈相机的图像分辨率

    谈到显微成像系统,常常会用分辨率来评价成像能力的高低,那分辨率到底指的是什么,又怎样计算呢?其实对于一个特定的显微成像系统,分辨率要从两个方面来考虑,一种是光学系统的分辨率—光学衍射极
    的头像 发表于 01-09 09:54 1774次阅读
    浅谈相机的图像<b class='flag-5'>分辨率</b>

    adc电路的分辨率怎么算

    ADC(模数转换)电路的分辨率是指其能够将模拟信号转换为数字信号时能够达到的最小分辨单位。分辨率通常用位数表示,例如10位的ADC具有1024个离散的输出级别。 要计算ADC电路的
    的头像 发表于 01-04 15:23 7117次阅读