[论文阅读]PIDNet: A Real-time Semantic Segmentation Network Inspired by PID Controllers

这篇具有很好参考价值的文章主要介绍了[论文阅读]PIDNet: A Real-time Semantic Segmentation Network Inspired by PID Controllers。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1.摘要

双分支网络结构已显示出其对实时语义分割任务的效率性和有效性。然而,低级细节和高级语义的直接融合将导致细节特征容易被周围上下文信息淹没,即本文中的超调 (overshoot),这限制了现有两个分支模型的准确性的提高。
在本文中,我们在卷积神经网络(CNN)和比例积分微分(PID)控制器之间架起了桥梁,并揭示了双分支网络只是一个比例积分(PI)控制器,当然也会存在类似的超调问题。为了解决这个问题,我们提出了一种新的三分支网络架构:PIDNet,它具有三个分支来分别解析细节、上下文和边界信息(语义的派生),并在最后阶段使用边界注意来指导细节和上下文分支的融合

2.introduction

比例积分微分(PID)控制器是上个世纪提出的传统概念,已广泛应用于现代动态系统或过程,如机器人操纵、化学过程、电力系统。尽管近年来已经开发了许多具有更好控制性能的先进控制策略,但由于其简单但鲁棒的特性,PID控制器仍然是大多数工业应用的首选。一个科学领域的经典概念可以扩展到许多其他领域。例如,PID控制器的基本方法被引入到图像去噪、随机梯度下降和数值优化中,并实现了对原始方法的极大改进。在本文中,我们通过采用PID控制器的基本概念,为实时语义分割任务设计了一个深度神经网络架构,该新模型的性能超过了所有先前的网络,从而实现了推理速度和准确性之间的最佳权衡。

3.contribution

我们在深度学习模型与PID控制器之间架起了桥梁,并提出了一个基于PID控制器架构的三分支网络家族。
提出了基于选择性学习的连接、快速上下文聚合模块和边界引导融合模块,以提高PIDNets的性能
我们的模型在所有现有模型中实现了推理速度和准确性之间的最佳权衡。特别是,在没有加速工具的Cityscapes测试集上,PIDNet-S以93.2 FPS的速度实现了78.6%的mIOU,PIDNet-L以31.1 FPS的速度达到了80.6%的mIOU(实时域最高)

4.Method

4.1PIDNet:新型的三分支网络

为两分支网络提供辅助微分分支(ADB),并在空间域中完全模拟PID控制器。每个对象内部像素的语义是一致的,并且仅在相邻对象的边界上变得不一致,因此语义的微分仅在对象边界处是非零的,ADB的功能应是边界检测。因此,我们建立了一个新的三分支实时语义分割架构,即比例积分微分网络(PIDNet),如图4所示。PIDNet拥有三个具有互补职责的分支:

  • 比例(P)分支解析并保存其高分辨率特征图中的详细信息;
  • 积分(I)分支本地和全局聚合上下文信息以解析长程依赖关系;
  • 微分(D)分支提取高频特征以预测边界区域。

 [论文阅读]PIDNet: A Real-time Semantic Segmentation Network Inspired by PID Controllers,论文阅读

我们在第一个Pag模块后面添加一个语义头,用来生成额外的语义损失L0,来优化整个网络。

采用加权二元交叉熵损失L1来代替dice loss来处理边界检测的不平衡问题,因为粗糙边界更适合突出边界区域并增强小对象的特征。L2和L3表示CE损失,而我们利用边界头的输出来协调语义分割和边界检测任务,并增强Bag模块的功能。

4.2Pag:选择性学习高级语义

[论文阅读]PIDNet: A Real-time Semantic Segmentation Network Inspired by PID Controllers,论文阅读

在PIDNet中,I分支 提供的丰富而准确的语义信息,对于包含相对较少的层和通道的 P分支 的细节解析至关重要。因此,我们可以将 I分支视为其他两个分支的备份,并使其能够向它们提供所需的信息。与直接添加所提供的特征图的 D分支不同,我们为P分支引入了像素注意力引导融合模块(Pag),如图所示,以选择性地从I分支学习有用的语义特征,而不会被淹没。

当得到的权重矩阵中的参数较高时,我们更相信i分支,因为i分支的语义更高。反之则更相信p分支

4.3PAPPM:上下文的快速聚合 

[论文阅读]PIDNet: A Real-time Semantic Segmentation Network Inspired by PID Controllers,论文阅读

图中arg()的实际操作是池化(ks,stride) +BN+ReLU+卷积,将上面四个得到的特征图经过上采样后与第五个特征图相加卷积再拼接

4.4Pag:平衡细节和上下文

[论文阅读]PIDNet: A Real-time Semantic Segmentation Network Inspired by PID Controllers,论文阅读

边界注意力引导融合模块(Bag)来融合三个分支提供的特征。注意,上下文分支语义丰富,可以提供更准确的语义,但它丢失了太多的空间和几何细节,特别是对于边界区域和小对象。由于细节分支更好地保留了空间细节,我们迫使模型沿着边界区域更加信任细节分支,并利用上下文特征填充对象内部的区域,这可以通过图7中的Bag实现。文章来源地址https://www.toymoban.com/news/detail-856328.html

到了这里,关于[论文阅读]PIDNet: A Real-time Semantic Segmentation Network Inspired by PID Controllers的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包赞助服务器费用

相关文章

  • 【目标检测论文阅读笔记】RTMDet: An Empirical Study of Designing Real-Time Object Detectors(2022)

    【目标检测论文阅读笔记】RTMDet: An Empirical Study of Designing Real-Time Object Detectors(2022)

            在本文中,我们的目标是 设计一种高效的实时物体检测器,它超越了 YOLO 系列,并且可以轻松扩展到许多物体识别任务 ,例如实例分割和旋转物体检测。为了获得更高效的模型架构,我们探索了一种  在主干和颈部具有兼容能力的架构 ,该架构  由一个 由 大核

    2024年02月07日
    浏览(12)
  • 论文阅读及复现——《CT_ICP: Real-time Elastic LiDAR Odometry with Loop Closure》

    论文阅读及复现——《CT_ICP: Real-time Elastic LiDAR Odometry with Loop Closure》

    论文网址:https://arxiv.org/abs/2109.12979 源码网址:https://github.com/jedeschaud/ct_icp 复现过程:https://blog.csdn.net/qq_44164791/article/details/132188049?spm=1001.2014.3001.5502 提出了一个具有扫 描内姿态连续性 和 扫描间不连续性 的新型弹性激光雷达里程计 使用稀疏体素结构存储稠密点云的局部地

    2024年02月11日
    浏览(11)
  • NeRF-SLAM: Real-Time Dense Monocular SLAM with Neural Radiance Fields 论文阅读

    NeRF-SLAM: Real-Time Dense Monocular SLAM with Neural Radiance Fields 论文阅读

    题目 :NeRF-SLAM: Real-Time Dense Monocular SLAM with Neural Radiance Fields 作者 :Antoni Rosinol, John J. Leonard, Luca Carlone 代码 :https://github.com/ToniRV/NeRF-SLAM 来源 :arxiv 时间 :2022 我们提出了一种新颖的几何和光度 3D 映射流程,用于从单目图像进行准确、实时的场景重建。 为了实现这一目标

    2024年02月14日
    浏览(12)
  • 3D Gaussian Splatting for Real-Time Radiance Field Rendering 阅读笔记

    3D Gaussian Splatting for Real-Time Radiance Field Rendering 阅读笔记

    感谢B站意の茗的讲解。 论文地址:https://arxiv.org/abs/2308.04079 项目主页:https://repo-sam.inria.fr/fungraph/3d-gaussian-splatting/ 从已有点云模型出发(sfm),以每个点为中心建立可学习的3D高斯表达,Splatting方法进行渲染,实现高分辨率实时渲染。(推动NERF加速方向) 能用训练好的点云

    2024年01月16日
    浏览(26)
  • Training-Time-Friendly Network for Real-Time Object Detection 论文学习

    Training-Time-Friendly Network for Real-Time Object Detection 论文学习

    目前的目标检测器很少能做到快速训练、快速推理,并同时保持准确率。直觉上,推理越快的检测器应该训练也很快,但大多数的实时检测器反而需要更长的训练时间。准确率高的检测器大致可分为两类:推理时间久的的训练时间久的。 推理时间久的检测器一般依赖于复杂的

    2024年02月15日
    浏览(17)
  • 【论文笔记】3D Gaussian Splatting for Real-Time Radiance Field Rendering

    【论文笔记】3D Gaussian Splatting for Real-Time Radiance Field Rendering

    原文链接:https://arxiv.org/abs/2308.04079 网孔和点是最常见的3D场景表达,因其是显式的且适合基于GPU/CUDA的快速栅格化。神经辐射场(NeRF)则建立连续的场景表达便于优化,但渲染时的随机采样耗时且引入噪声。本文的方法结合了上述两种方法的优点:使用3D高斯表达和基于ti

    2024年02月04日
    浏览(9)
  • 【读论文】3D Gaussian Splatting for Real-Time Radiance Field Rendering

    【读论文】3D Gaussian Splatting for Real-Time Radiance Field Rendering

    What kind of thing is this article going to do (from the abstract and conclusion, try to summarize it in one sentence) To simultaneously satisfy the requirements of efficiency and quality, this article begins by establishing a foundation with sparse points using 3D Gaussian distributions to preserve desirable space. It then progresses to optimizing anisotrop

    2024年04月09日
    浏览(10)
  • 论文笔记《3D Gaussian Splatting for Real-Time Radiance Field Rendering》

    论文笔记《3D Gaussian Splatting for Real-Time Radiance Field Rendering》

    项目地址 原论文 最近辐射场方法彻底改变了多图/视频场景捕获的新视角合成。然而取得高视觉质量仍需神经网络花费大量时间训练和渲染,同时最近较快的方法都无可避免地以质量为代价。对于无边界的完整场景(而不是孤立的对象)和 1080p 分辨率渲染,目前没有任何方法

    2024年02月09日
    浏览(10)
  • 带你读论文丨S&P2019 HOLMES Real-time APT Detection

    本文分享自华为云社区《[论文阅读] (09)SP2019 HOLMES Real-time APT Detection(溯源图)》,作者: eastmount 。 本文提出了一种实现了检测高级持久性威胁(Advanced Persistent Threat,APT)新的方法,即HOLMES系统。HOLMES的灵感来自现实世界中APT活动的一些共同目标。简而言之,HOLMES旨在产生

    2024年02月11日
    浏览(8)
  • 3D Gaussian Splatting for Real-Time Radiance Field Rendering(论文中代码复现)

    3D Gaussian Splatting for Real-Time Radiance Field Rendering(论文中代码复现)

    3D Gaussian Splatting for Real-Time Radiance Field Rendering https://repo-sam.inria.fr/fungraph/3d-gaussian-splatting/ 主要研究方法是使用3D高斯光点绘制(3D Gaussian Splatting)方法进行实时光辐射场渲染。该方法结合了3D高斯场表示和实时可微分渲染器,通过优化3D高斯场的属性和密度控制,实现了高质

    2024年02月03日
    浏览(23)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包