作者：极链科技曾启澔

前言

随着前端生态的发展，Java已经不仅仅局限于作为网页开发，也越来越活跃于服务器端，移动端小程序等应用开发中。甚至通过Electron等打包工具，甚至能够开发多系统的桌面应用。其涉足的领域宽泛也使得能够实现的功能也不再是简单的UI控件制作和内容的展示，在互动娱乐，小游戏领域也有着极大的发展前景。本文以通过Java开发一个基于浏览器摄像头的实时人物动作捕捉小程序为例，介绍一下前端在这一领域的可行性。

什么是TensorFlow

TensorFlow 最初是由Google大脑小组的研究员和工程师们开发出来，采用数据流图（Data Flow Graphs）用于机器学习和深度神经网络方面数值计算的开源软件库。其高度的可移植性和多语言性使得它可以通过各种常用编程语言编写，轻松的运行在多种平台的设备上。是一个集性能，可靠性，通用性，易用性为一体的强大开源库。

本文所使用的开源Java模型库：

l tfjs-models/posenet: 一个机器学习模型，功能为对图像或者视频中的人物进行动作捕捉，输出人体各个部位的keypoints（坐标集）。具有单一人物分析和多人物分析的特点。

l tfjs-models/body-pix: 一个机器学习模型，功能为对图像或者视频中人物和背景进行分析，将人物从背景中剥离出来，输出结果为人体24个部位在画面中的像素位置。具有将人物与背景分离的功能。

实现原理

本文所介绍的基于浏览器和网络摄像头的人物实时动作捕捉方法，其实现原理是通过Java调用

*在基本的原理中

通过tfjs-models/posenet模型库实现人物动作捕捉

l基本配置

· 导入JS

· HTML

· 初始化网络摄像头

· 生成posenet对象

参数说明：

architecture：分为MobileNetV1和ResNet50两个体系，其中ResNet50精度更高但处理速度较慢。

outputStride：输出结果每个像素占用字节数，数字越小结果越精确，但处理的成本和时间更多。

inputResolution：输入图像压缩后的尺寸，数字越大越精确，但处理的成本和时间更多。

multiplier：仅在MobileNetV1体系中使用，卷积运算的深度（通道数），数字越大层数越多越精确，但处理的成本和时间更多。

l执行实时分析

l结果

· 多人捕捉：多人捕捉时能够获得画面中人物的keypoints，互相之间有一定的干扰但影响并不是特别大。

· 单人捕捉：很容易被背景及身边人物干扰，导致人体keypoint定位不准确。

l缺点

通过实际的效果可以看到，该模型可以在多人物的时候准确捕捉到各个人物的动作和身体部位的keypoints，虽然存在若干干扰和不稳定但基本能够接受，实时性效果好，但是无法区分主要人物和次要人物，需要开发者对结果数据进行处理。

其score的生成是根据形状准确度来计算，没有场景深度的分析，因此无法判断人物前后位置关系。

由于以上的问题，该方法在单一人物动作捕捉时被周围环境干扰的影响极大。在背景存在其他人物时会因无法判断主次人物关系，极大的降低准确率。对单一人物动作捕效果非常的不理想，需要进行改进。

改进方案

单一人物的动作捕捉被外界干扰的影响太大导致结果并不理想，因此首先要考虑的就是屏蔽掉周围干扰物体，突出主体人物。由此引入了tfjs-models/body-pix模型库。

**tfjs-models/body-pix模型库的主要功能：**实时分析人物结构，将人物从背景中剥离。其作用对象为单一捕捉对象，正好适用于上述单人捕捉结果不理想的情况。

l基本配置

· 导入JS

· 生成bodyPixNet对象

ltfjs-models/body-pix与tfjs-models/posenet的混合使用

l结果

tfjs-models/body-pix与tfjs-models/posenet的混合使用，虽然加大了canvas处理的负担，加大了描绘和图像处理的次数，但是由于tfjs-models/body-pix已经先将人物与背景剥离，在tfjs-models/posenet只使用用最高效但低准确度的参数配置下，也能够产生远高于使用高精确度但消耗处理性能极大的配置所不能达到的准确度。从而实现了高效，高准确度，流畅的实时单人动作捕捉功能。

结论

通过TensorFlow的开源库，能够轻松的在浏览器上通过网络摄像头实现人物动作的实时捕捉。

由于基于图像分析，因此表现能力极大的依赖于对canvas的描绘性能，移动端由于浏览器canvas描绘能力以及硬件性能限制的原因，表现并不出色，无法做到长时间实时捕捉。甚至部分浏览器限制了网络摄像头的调用。在移动端的表现并不出色。

在单一人物的动作捕捉时，tfjs-models/body-pix与tfjs-models/posenet的混合使用能够使精确度大大提升。

由于需要对canvas进行描绘，结合其他canvas的JS库可以进行交互UI，交互小游戏等不同场合APP的开发。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

开源AI模型库是干嘛的

开源AI模型库是指那些公开源代码、允许自由访问和使用的AI模型集合。这些模型通常经过训练，能够执行特定的任务。以下，是对开源AI模型库的详细

发表于 12-14 10:33 •173次阅读

PNI高精度低功耗3D动作捕捉手柄方案

SpacePoint3D动作捕捉手柄方案被虚拟现实（VR）厂商PICO选入PICOTrackingkit产品。虚拟现实和游戏类手柄的设计师们非常清楚地了解，用消费类惯性传感器想做到高精准度的动作

发表于 11-05 08:06 •151次阅读

PNI高精度低功耗3D<b class='flag-5'>动作</b><b class='flag-5'>捕捉</b>手柄方案

鸿蒙跨端实践-JS虚拟机架构实现

类似的框架，我们需要自行实现以确保核心基础能力的完整。鸿蒙虚拟机的开发经历了从最初 ArkTs2V8 到 JSVM + Roma新架构方案。在此过程中，我们实现了完整的鸿蒙版的“J2V8”和基于系统JSVM的JS虚拟机框架

发表于 09-30 14:42 •2411次阅读

鸿蒙跨端实践-<b class='flag-5'>JS</b>虚拟机架构<b class='flag-5'>实现</b>

第四章：在 PC 交叉编译 aarch64 的 tensorflow 开发环境并测试

本文介绍了在 PC 端交叉编译 aarch64 平台的 tensorflow 库而非 tensorflow lite 的心酸过程。

发表于 08-25 11:38 •1065次阅读

第四章：在 PC 交叉编译 aarch64 的 <b class='flag-5'>tensorflow</b> 开发环境并测试

如何在Tensorflow中实现反卷积

在TensorFlow中实现反卷积（也称为转置卷积或分数步长卷积）是一个涉及多个概念和步骤的过程。反卷积在深度学习领域，特别是在图像分割、图像超分辨率、以及生成模型（如生成对抗网络GANs）等任务中

发表于 07-14 10:46 •613次阅读

TensorFlow是什么？TensorFlow怎么用？

TensorFlow是由Google开发的一个开源深度学习框架，它允许开发者方便地构建、训练和部署各种复杂的机器学习模型。TensorFlow凭借其高效的计算性能、灵活的架构以及丰富的工具和库

发表于 07-12 16:38 •703次阅读

tensorflow和pytorch哪个更简单?

： TensorFlow和PyTorch都是用于深度学习和机器学习的开源框架。TensorFlow由Google Brain团队开发，而PyTorch由Facebook的AI研究团队开发。易用性：

发表于 07-05 09:45 •860次阅读

tensorflow简单的模型训练

在本文中，我们将详细介绍如何使用TensorFlow进行简单的模型训练。TensorFlow是一个开源的机器学习库，广泛用于各种机器学习任务，包括图像识别、自然语言处理等。我们将从安装

发表于 07-05 09:38 •656次阅读

keras模型转tensorflow session

和训练深度学习模型。Keras是基于TensorFlow、Theano或CNTK等底层计算框架构建的。TensorFlow是一个开源的机器学习框架，由Google Brain团队开发。它提供了一种灵活

发表于 07-05 09:36 •532次阅读

如何使用Tensorflow保存或加载模型

TensorFlow是一个广泛使用的开源机器学习库，它提供了丰富的API来构建和训练各种深度学习模型。在模型训练完成后，保存模型以便将来使用或部署是一项常见的需求。同样，加载已保存的模型进行预测或

发表于 07-04 13:07 •1504次阅读

TensorFlow的定义和使用方法

TensorFlow是一个由谷歌人工智能团队谷歌大脑（Google Brain）开发和维护的开源机器学习库。它基于数据流编程（dataflow programming）的概念，将复杂的数学运算表示为

发表于 07-02 14:14 •768次阅读

解锁未来，无线姿态传感器如何革新动作捕捉与VR体验

随着科技的飞速发展，动作捕捉和虚拟现实（VR）威廉希尔官方网站成为我们生活中的一部分，它们为我们带来了前所未有的沉浸式体验。而在这个变革之中，无线传感器凭借其独特的优势，推动这一威廉希尔官方网站革新的关键力量。无线

发表于 06-27 10:02 •361次阅读

鸿蒙OS元服务开发说明：【WebGL网页图形库开发接口】

WebGL主要帮助开发者在前端开发中完成图形图像的相关处理，比如绘制彩色图形等。目前该功能仅支持使用兼容JS的类Web开发范式开发。

发表于 04-02 17:02 •467次阅读

web前端开发和前端开发的区别

、CSS和JavaScript等威廉希尔官方网站来构建用户界面，实现用户与应用程序的交互。Web前端开发包括网页设计、网页编码、前端框架使用以及优化页面

发表于 01-18 09:54 •3523次阅读

基于TensorFlow和Keras的图像识别

，让我们先花点时间来了解一些术语。TensorFlow/KerasTensorFlow是GoogleBrain团队创建的一个Python开源库，它包含许多算法和模型

发表于 01-13 08:27 •815次阅读

搜索历史

基于TensorFlow的开源JS库的网页前端人物动作捕捉的实现

前言

评论

开源AI模型库是干嘛的

PNI高精度低功耗3D动作捕捉手柄方案

鸿蒙跨端实践-JS虚拟机架构实现

第四章：在 PC 交叉编译 aarch64 的 tensorflow 开发环境并测试

如何在Tensorflow中实现反卷积

TensorFlow是什么？TensorFlow怎么用？

tensorflow和pytorch哪个更简单?

tensorflow简单的模型训练

keras模型转tensorflow session

如何使用Tensorflow保存或加载模型

TensorFlow的定义和使用方法

解锁未来，无线姿态传感器如何革新动作捕捉与VR体验

鸿蒙OS元服务开发说明：【WebGL网页图形库开发接口】

web前端开发和前端开发的区别

基于TensorFlow和Keras的图像识别