0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Side Window Filtering 论文解读和C++实现

电子设计 来源:电子设计 作者:电子设计 2020-12-10 19:17 次阅读
本文复现的是CVPR2019 Oral论文Side Window Filtering。
作者:梁德澎
首发知乎:https://zhuanlan.zhihu.com/p/79254846

论文:Side Window Filtering(文末可以直接下载
链接:https://arxiv.org/pdf/1905.07177.pdf

刚开始看到这篇论文的时候,我就很感兴趣想去复现一把看看效果。这篇论文是 CVPR2019 oral 且不是深度学习方向的,其核心贡献点就是:不管原来的滤波器保不保边,运用了side-window思想之后,都可以让它变成保边滤波!

于是利用业余时间,参考作者开源的matlab代码,我用C++实现了一下Side-window 盒子滤波,其他滤波器有时间再试下,下面是github的链接,读者可以去跑下代码看看效果玩下,从实验结果上看我觉得算是复现了论文的效果:

我们来看下复现论文的效果,对于一张普通图片,经典的盒子滤波和side-window 盒子滤波的效果对比:

从滤波结果对比上可以看到,经典的盒子滤波随着对同一张图片反复应用盒子滤波的迭代次数的增加,视觉效果是越来越模糊,到了30次迭代的时候已经糊的没法看了,但是Side-window盒子滤波即使迭代了30次,对于边缘的保持还很好,和原图基本看不出大的区别,就是边缘细节有些丢失。

然后对原图加上椒盐噪声,再对比下滤波效果:

从滤波结果对比上可以看到,经典的盒子滤波到了10次迭代的时候,虽然椒盐噪声已经很好的消除了,但是图片也变得很模糊,边缘都细节都丢失了,但是Side-window盒子滤波却能很好的消除椒盐噪声的同时,对于边缘的保持还很好,基本上算是还原了原图。

下面从我的理解上去简单解读下这篇论文的核心思想,还有我在复现过程中的一些实现细节介绍。

目前的经典滤波算法基本都是,以某个像素点为中心,按照滤波半径,把这个包括像素点和其邻域加权线性组合得到输出,一般公式如下:

Ω是以像素点 i 为中心的滤波窗口,w是滤波权值,q是原图像素值,I'是输出结果。但是这样以一个像素为中心去滤波会导致的问题是,如果一个像素点处在边缘位置(这里的边缘不是指图片的大小边界,而是指图像中物体的边缘)的话,以像素为中心去滤波会导致滤波结果的边缘部分变模糊。具体是为什么,论文中给出了分析过程。

首先来看下,论文中的一张图:

文中提到为了分析方便只讨论3种典型的边缘,分别是图中的 (a)阶梯状边缘、(b)斜坡状边缘和(c)屋顶状边缘。论文中也给出了这3三种边缘的形象展示:

然后文中采用了泰勒展开去分析,首先假定,图像上(x, y)坐标点的像素值为g(x, y),对于图中展示的情况来看,函数 g(x, y)是连续但不可导的。对于(a)阶梯状边缘的 'a' (蓝色方框那个点)点来说,文中定义 'a-' 和 'a+' 来分别表示 'a' 点左极限 (x - ε, y),和右极限 (x + ε, y),且 ε > 0。 很明显从图中可以看出来 g(x - ε, y) ≠ g(x + ε, y) 且/或(文中的用词是"and (or)")g'(x - ε, y) ≠ g'(x + ε, y),导数也不等是由于边缘部分的跳跃。因此对于这两块区域的泰勒展开也是不一样的,首先来看下泰勒展开的一般公式:

“泰勒公式是将一个在 x=x0 处具有n阶导数的函数 f(x) 利用关于 (x - x0) 的n次多项式来逼近函数的方法。”----百度百科

根据文中的分析,这里设定 f(x) = g(x - 2ε, y),x0 = x - ε,则根据泰勒展开公式:

g(x - 2ε, y) ≈ f(x0) + f'(x0)(x - x0)
= g(x - ε, y) + g'(x - ε, y)(x - 2ε - (x - ε))
= g(x - ε, y) + g'(x - ε, y)(- ε)

同理,设 f(x) = g(x + 2ε, y),x0 = x + ε,则泰勒展开得:

g(x + 2ε, y) ≈ f(x0) + f'(x0)(x - x0)
= g(x + ε, y) + g'(x + ε, y)(x + 2ε - (x + ε))
= g(x + ε, y) + g'(x + ε, y)ε

所以从两边的泰勒展开式可以得出结论,对于 'a-' 区域的滤波估计肯定是来自区域 'a' 的左边,而对于 'a+' 估计是来自于 'a' 的右边,然后类比分析区域 'b','c' 和 'd' 都可以得到类似的结论。

因此分析得到的结论是,如果一个像素点处于图像中的边缘位置,那么滤波的时候就应该把滤波器的边缘和该像素点对齐,而不是把滤波器的中心和该像素点对齐。受该发现的启发,文中提出了一个新的保边滤波策略,就是把每个滤波像素点都当成是潜在的边缘点,然后对于每个待滤波的像素点,生成几种不同的滤波子窗口,然后把这些滤波窗口的边缘或者角点位置和该像素点对齐,然后滤波得到结果,最后根据把这些子窗口的滤波之后的最佳重构结果作为最终的滤波结果。以上就是side window 滤波的思想。

然后文中提出了8个方向的滤波窗口,分别是上、下,左、右、左上、右上、左下和右下,最后就得到了 side window filter 的核心算法流程:

其实从核心算法逻辑来看,对原来滤波算法的改动其实不大,就是滤波的窗口位置和大小需要改动下,然后把8次的结果每个位置取重构误差最小的。然后论文中又详细分析了 box filter 和 side window box filter 对于上面提到的三种经典边缘的滤波之后的保留情况。文中给出分析的图表如下:

总的来说结论就是 side window box filter 对于阶梯和斜坡状的边缘都能完整的保留,而对于屋顶状边缘虽然不能完整的保留边缘,但是也比经典的盒子滤波要好很多。

在复现过程中,本来一开始是想对文中提到的8种side window去分别写对应的盒子滤波的,因为盒子滤波有个经典的优化思路,可以让运行时间不受滤波半径的影响,具体可以参考我之前写得一篇博客:

梁德澎:移动端arm cpu优化学习笔记----一步步优化盒子滤波(Box Filter)

后来仔细想了下,这8个side window其实也就是边界处理不同,核心运算逻辑都是一致的,最后就是抽象成一个函数,对于不同的side window传不同的边界参数,就不需要每个窗口写一个函数了,具体可以看看github上的代码。

然后在实现side window中值滤波的时候针对移动端想了一个加速方案,因为求中值需要对窗口内元素排序,这里直观上感觉是没什么办法加速的,不过我尝试了一个方案,利用neon指令相对原来提速了不少,有空的话可以写一篇小博客去解释,这里先埋一个彩蛋。

最后看看几组对比结果,看看在迭代10次的情况下,经典box filter 和 side window box filter的结果对比:


熊猫宝宝原图


滤波结果, box filter, iteration = 10


滤波结果, side window box filter, iteration = 10


熊猫宝宝原图+椒盐噪声


去噪结果, box filter, iteration = 10


去噪结果, side window box filter, iteration = 10

然后在迭代10次的情况下,经典中值 filter 和 side window 中值滤波的结果对比:


歼20+椒盐噪声


去噪结果, median filter, iteration = 10


去噪结果, side window median filter, iteration = 10

相关资料

  • AI鸡蛋:CVPR2019 Oral论文 #5176 Side Window Filtering介绍
  • AI鸡蛋:Sub-window Box Filter论文介绍

推荐文章

更多AI移动端优化的请关注专栏嵌入式AI以及知乎(@梁德澎)。

审核编辑:符乾江
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30894

    浏览量

    269085
  • 人工智能
    +关注

    关注

    1791

    文章

    47279

    浏览量

    238493
收藏 人收藏

    评论

    相关推荐

    运动控制卡周期上报实时数据IO状态之C++

    使用C++进行运动控制卡的周期上报功能实现
    的头像 发表于 12-17 13:59 220次阅读
    运动控制卡周期上报实时数据IO状态之<b class='flag-5'>C++</b>篇

    ADS1299EEGFE-PDK在window上如何通过C++读取8通道数据?

    入手了一块ADS1299EEGFE-PDK,想用这块板做eeg测试,开发语言是c++window平台,这块板没有提供sdk之类的,怎么获取8个通道的数据,有没有做过的朋友?
    发表于 11-27 06:51

    C语言和C++中结构体的区别

    同样是结构体,看看在C语言和C++中有什么区别?
    的头像 发表于 10-30 15:11 227次阅读

    C7000优化C/C++编译器

    电子发烧友网站提供《C7000优化C/C++编译器.pdf》资料免费下载
    发表于 10-30 09:45 0次下载
    <b class='flag-5'>C</b>7000优化<b class='flag-5'>C</b>/<b class='flag-5'>C++</b>编译器

    所有Window Watchdog Supervisors

    电子发烧友网站提供《所有Window Watchdog Supervisors.pdf》资料免费下载
    发表于 10-10 10:37 0次下载
    所有<b class='flag-5'>Window</b> Watchdog Supervisors

    OpenVINO2024 C++推理使用技巧

    很多人都使用OpenVINO新版的C++ 或者Python的SDK,都觉得非常好用,OpenVINO2022之后的版本C++ SDK做了大量的优化与整理,已经是非常贴近开发的使用习惯与推理方式。与OpenCV的Mat对象对接方式更是几乎无缝对接,非常的方便好用。
    的头像 发表于 07-26 09:20 905次阅读

    C++语言基础知识

    电子发烧友网站提供《C++语言基础知识.pdf》资料免费下载
    发表于 07-19 10:58 7次下载

    C++实现类似instanceof的方法

    函数,可实际上C++中没有。但是别着急,其实C++中有两种简单的方法可以实现类似Java中的instanceof的功能。 在 C++ 中,确定对象的类型是编程中实际需求,使开发人员
    的头像 发表于 07-18 10:16 586次阅读
    <b class='flag-5'>C++</b>中<b class='flag-5'>实现</b>类似instanceof的方法

    Perforce静态代码分析专家解读MISRA C++:2023®新标准:如何安全、高效地使用基于范围的for循环,防范未定义行

    MISRA C++:2023——MISRA® C++ 标准的下一个版本来了!为了帮助您了解 MISRA C++:2023相比于之前版本的变化,我们将继续为您带来Perforce首席威廉希尔官方网站 支持工程师
    的头像 发表于 06-18 12:57 421次阅读

    C/C++中两种宏实现方式

    #ifndef的方式受C/C++语言标准支持。它不仅可以保证同一个文件不会被包含多次,也能保证内容完全相同的两个文件(或者代码片段)不会被不小心同时包含。
    的头像 发表于 04-19 11:50 626次阅读

    鸿蒙OS开发实例:【Native C++

    使用DevEco Studio创建一个Native C++应用。应用采用Native C++模板,实现使用NAPI调用C标准库的功能。使用C
    的头像 发表于 04-14 11:43 2633次阅读
    鸿蒙OS开发实例:【Native <b class='flag-5'>C++</b>】

    使用 MISRA C++:2023® 避免基于范围的 for 循环中的错误

    在前两篇博客中,我们 向您介绍了新的 MISRA C++ 标准 和 C++ 的历史 。在这篇博客中,我们将仔细研究以 C++ 中 for 循环为中心的特定规则。
    的头像 发表于 03-28 13:53 796次阅读
    使用 MISRA <b class='flag-5'>C++</b>:2023® 避免基于范围的 for 循环中的错误

    c语言,c++,java,python区别

    C语言、C++、Java和Python是四种常见的编程语言,各有优点和特点。 C语言: C语言是一种面向过程的编程语言。它具有底层的特性,能够对计算机硬件进行直接操作。
    的头像 发表于 02-05 14:11 2389次阅读

    vb语言和c++语言的区别

    VB语言和C++语言是两种不同的编程语言,虽然它们都属于高级编程语言,但在设计和用途上有很多区别。下面将详细比较VB语言和C++语言的区别。 设计目标: VB语言(Visual Basic)是由
    的头像 发表于 02-01 10:20 2317次阅读

    C++简史:C++是如何开始的

    MISRA C++:2023,MISRA® C++ 标准的下一个版本,来了!为了帮助您做好准备,我们介绍了 Perforce 首席威廉希尔官方网站 支持工程师 Frank van den Beuken 博士撰写
    的头像 发表于 01-11 09:00 596次阅读
    <b class='flag-5'>C++</b>简史:<b class='flag-5'>C++</b>是如何开始的