谷歌公布AI手势识别新成果-电子发烧友网

尽管早期的消费型智能眼镜也尝试过使用触控板和手持或可穿戴控制器用于信息输入，但实际上HoloLens 2的手势控制界面和Magic Leap One代表着智能眼镜输入的未来。

谷歌的研究部门开发了一种新的机器学习模型，可以在轻量智能眼镜中实现高端AR系统中的复杂手势控制，无需额外的体积或者深度感测和运动传感器的成本。

本周，谷歌人工智能团队公布了手掌/手指追踪的最新方法。新方法使用了开源、跨平台的MediaPipe框架，在移动设备上（而不是在云端）即时处理视频，通过机器学习模型映射多达21个手部和手指点。

“我们希望向更广泛的研究和开发团队提供这种手感功能，带来更多创造性案例，刺激新的应用程序和研究途径的产生，”谷歌团队在一篇详博客文章中写道。

手掌/手指追踪方法实际上把任务划分成为三个机器学习模型。谷歌的研究人员没有使用机器学习模型来识别手掌本身，而是用的手掌检测算法，平均准确率接近96%。

检测到手掌后，另一个机器学习模型识别出了相机视图中手掌的21个关节坐标点。第三种算法通过记录每个手指的手势，与预定义的手势进行匹配，学习模型支持分辨计数和其他各种手势。

换句话说，这种机器学习方法可以直接应用在Android或iOS设备上，无需专门的运动或深度传感器。谷歌团队还在研发开放源代码方式的模型，以便其他开发人员和研究人员使用。团队的计划也会不断提高机器学习模型的准确性和性能。

在不久的将来，这款手控跟踪系统将帮助开发者打造类似于Snapchat和Facebook的AR体验，将手控识别和跟踪威廉希尔官方网站融入自拍中。

谷歌还可以利用这项威廉希尔官方网站与Pixel 4上的Soli雷达传感器合作，打造一些独特的AR体验，类似于iPhone X系列上的Animojis，后者把苹果的ARKit和TrueDepth相机组合使用。

然而，通过这一进步，我们更要思考机器学习方法可以给智能眼镜带来什么。硬件制造商不再使用运动深度传感器，更接近HoloLens 2和Magic Leap One上的用户输入方法。

越来越多的科技公司需要人工智能来解决AR可穿戴设备在外形和功能方面的问题。甚至微软也在混合使用ARKit和ARcore的人工智能方法来检测界面瑕疵，以更好地实现HoloLens 2的新场景理解能力。软件应该是研发智能眼镜的关键。只能眼镜足够轻薄，可以每天佩戴，而不仅限于家里或办公室区域。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

谷歌

谷歌

+关注

关注
27

文章
6166

浏览量
105337
手势识别

手势识别

+关注

关注
8

文章
225

浏览量
47787
AI

AI

+关注

关注
87

文章
30809

浏览量
268954

Cortex-A55国产处理器_教学实验箱_操作案例分享：5-21 手势识别实验

一、实验目的熟悉Qt程序的开发流程。掌握Qt Creator的基础开发使用。通过编写Qt程序实现手势识别的显示界面。二、实验原理 Qt工程的创建步骤包括：（1）创建Qt工程；（2）GUI

发表于 10-15 16:18

谷歌Pixel 9系列AI功能抢眼,苹果被指AI领域落后

8月15日，谷歌意外提前揭晓了其新品发布会，借助Pixel 9系列手机搭载的Gemini AI威廉希尔官方网站，在苹果iPhone 16系列发布前夕抢占了科技头条。此举不仅展示了谷歌在人工智能领域的最新成

发表于 08-15 15:31 •583次阅读

谷歌:聚焦AI与威廉希尔官方网站创新,携手中国开发者共筑未来

2024年8月9日，备受瞩目的谷歌开发者大会——I/O Connect China圆满落幕。此次盛会，谷歌面向中国广大的开发者群体，全面展示了其在人工智能（AI）、移动威廉希尔官方网站、云计算及Web威廉希尔官方网站领域的最新突破与创新

发表于 08-09 17:03 •884次阅读

谷歌AI新突破：为无声视频智能配音

近日，谷歌DeepMind团队公布了一项革命性的威廉希尔官方网站 ——利用AI为无声视频生成背景音乐的“video-to-audio”威廉希尔官方网站。这一威廉希尔官方网站的出现，不仅为视频创作领域带来了新的可能，也为观众带来了更加丰富的视听体验。

发表于 06-21 10:50 •492次阅读

鸿蒙ArkTS声明式开发：跨平台支持列表组合手势

手势识别组合，即多种手势组合为复合手势，支持连续识别、并行识别和互斥

发表于 06-19 09:33 •413次阅读

基于毫米波雷达的手势识别算法

具体的软硬件实现点击http://mcu-ai.com/MCU-AI威廉希尔官方网站网页_MCU-AI 摘要基于毫米波的手势识别威廉希尔官方网站提供了良好的人机交

发表于 06-05 19:09

基于毫米波雷达的手势识别神经网络

具体的软硬件实现点击 http://mcu-ai.com/ MCU-AI威廉希尔官方网站网页_MCU-AI 概要手势识别是智能教育领域的关键威廉希尔官方网站，毫米

发表于 05-23 12:12

谷歌发布多模态AI新品，加剧AI巨头竞争

在全球AI竞技场上，谷歌与OpenAI一直稳居领先地位。近日，谷歌在I/O开发者大会上掀起了一股新的威廉希尔官方网站浪潮，发布了多款全新升级的多模态AI产品。

发表于 05-16 09:28 •448次阅读

OpenHarmony实战开发-手势事件

手势表示由单个或多个事件识别的语义动作（例如：点击、拖动和长按）。一个完整的手势也可能由多个事件组成，对应手势的生命周期。支持的事件有：

发表于 04-29 13:57 •385次阅读

基于FPGA威廉希尔官方网站的手势识别控制型多功能机械臂系统

首先通过图像采集设备来获取手势图像，通过手势建模将获取的手势图像用数学模型描述出来，最后根据得到的手势识别所需要的模型参量判别出具体的

发表于 04-27 11:21 •1235次阅读

开发者手机 AI - 目标识别 demo

功能简介该应用是在Openharmony 4.0系统上开发的一个目标识别的AI应用，旨在从上到下打通Openharmony AI子系统，展示Openharmony系统的AI能力，并为

发表于 04-11 16:14

【开源获奖案例】隔空手势识别测试系统

——来自迪文开发者论坛本期为大家推送迪文开发者论坛获奖开源案例——隔空手势识别测试系统。工程师采用7英寸COF智能屏，通过T5LOS核与PAJ7620U2手势识别传感器进行数据交互，不

发表于 03-16 08:12 •578次阅读

紫光展锐在MWC 2024展示AI领域的最新成果

在2024年的世界移动通信大会（MWC 2024）上，紫光展锐展示了其在AI领域的最新成果，为各种终端品类带来了前所未有的创新应用体验。该公司最新一代的AI计算平台提供了一站式的软件、硬件和算法

发表于 02-29 14:09 •1114次阅读

谷歌AI大模型Gemma全球开放使用

谷歌公司近日宣布，其全新的AI大模型Gemma现已在全球范围内开放使用。这一重要举措不仅彰显了谷歌在AI领域的领先地位，还为其在全球范围内的竞争力增添了新

发表于 02-28 18:12 •1143次阅读

我用全志V851s做了一个魔法棒，使用Keras训练手势识别模型控制一切电子设备

开关灯？多亏了这个开灯器打配合！看看它的电路吧：整体配合效果就是这样的：硬件设计参考：Yuzukilizard 柚木PI 迷你 AIoT 开发板软件部分通过本章节，你会了解到——AI手势识别

发表于 02-04 10:44

搜索历史

谷歌公布AI手势识别新成果

评论

Cortex-A55国产处理器_教学实验箱_操作案例分享：5-21 手势识别实验

谷歌Pixel 9系列AI功能抢眼,苹果被指AI领域落后

谷歌:聚焦AI与威廉希尔官方网站创新,携手中国开发者共筑未来

谷歌AI新突破：为无声视频智能配音

鸿蒙ArkTS声明式开发：跨平台支持列表组合手势

基于毫米波雷达的手势识别算法

基于毫米波雷达的手势识别神经网络

谷歌发布多模态AI新品，加剧AI巨头竞争

OpenHarmony实战开发-手势事件

基于FPGA威廉希尔官方网站的手势识别控制型多功能机械臂系统

开发者手机 AI - 目标识别 demo

【开源获奖案例】隔空手势识别测试系统

紫光展锐在MWC 2024展示AI领域的最新成果

谷歌AI大模型Gemma全球开放使用

我用全志V851s做了一个魔法棒，使用Keras训练手势识别模型控制一切电子设备