yolov26改进 | 图像复原篇 | 单阶段盲真实图像去噪网络RIDNet辅助YOLOv26图像去噪（全网独家首发）-品致数荣

开始讲解之前推荐一下我的专栏本专栏的内容支持(分类、检测、分割、追踪、关键点检测),专栏目前为限时折扣欢迎大家订阅本专栏本专栏每周更新5-7篇最新机制更有包含我所有改进的文件和交流群提供给大家本人定期在群内分享发表论文方法和经验。一、本文介绍本文在 YOLOv26 中加入 RIDNet主要目的就是让模型在检测前先把图片“处理干净”。实际场景中的图片经常会受到光照不足、设备噪声、背景杂乱、压缩失真等影响直接送入 YOLOv26 可能会让一些目标边缘变模糊尤其是小目标和细节不明显的目标更容易被漏检。RIDNet 可以在前端先对图像进行去噪和细节增强把无用噪声压下去同时尽量保留目标的轮廓、纹理和边缘信息这样后面的 YOLOv26 在提取特征时拿到的就是更清晰、更稳定的图像信息。简单来说这个改进相当于在检测前给图像做了一次“清洗和增强”让模型在复杂环境下看得更清楚、判断更准确从而提升整体检测效果和抗干扰能力。欢迎大家订阅我的专栏一起学习YOLO专栏链接YOLOv26有效涨点专栏包含Conv、注意力机制、主干/Backbone、损失函数、优化器、后处理等改进机制目录一、本文介绍二、RIDNet 网络的原理和机制三、核心代码四、手把手教你添加RIDNet4.1 修改一4.2 修改二4.3 修改三4.4 修改四五、RIDNet 的yaml文件和运行记录5.1 RIDNet 的yaml文件5.2 训练代码5.3 RIDNet 的训练过程截图五、本文总结二、RIDNet 网络的原理和机制官方论文地址官方论文地址点击此处即可跳转官方代码地址官方代码地址点击此处即可跳转RIDNetReal Image Denoising with Feature Attention是一个用于真实图像去噪的卷积神经网络CNN旨在解决现有去噪方法在处理真实噪声图像时性能受限的问题。通过单阶段结构和特征注意机制RIDNet在多种数据集上展示了其优越性。RIDNet由三个主要模块组成1. 特征提取模块Feature Extraction Module该模块包含一个卷积层旨在从输入的噪声图像中提取初始特征。2. 特征学习模块Feature Learning Module核心部分是增强注意模块Enhanced Attention ModuleEAM使用残差在残差结构Residual on Residual和特征注意机制来增强特征学习能力。EAM包括两个主要部分1特征提取子模块通过两个膨胀卷积层和一个合并卷积层提取和学习特征。2特征注意子模块使用全局平均池化和自门控机制生成特征注意力调整每个通道的特征权重以突出重要特征。3. 重建模块Reconstruction Module包含一个卷积层将学习到的特征重建为去噪后的图像。结论:RIDNet在多个合成和真实噪声数据集上进行了广泛的实验展示了其在定量指标如PSNR和视觉质量上的优越性。与现有最先进的算法相比RIDNet在处理合成噪声和真实噪声图像时均表现出色。RIDNet通过引入特征注意机制和残差在残差结构实现了对真实图像去噪的有效处理。其单阶段结构、跳跃连接和特征注意机制确保了高效的特征学习和信息传递使其在多个数据集上均取得了优异的性能。三、核心代码核心代码使用方式看章节四import torch import torch.nn as nn import torch.nn.functional as F __all__ [RIDNET] def default_conv(in_channels, out_channels, kernel_size, biasTrue): return nn.Conv2d( in_channels, out_channels, kernel_size, padding(kernel_size//2), biasbias) class MeanShift(nn.Conv2d): def __init__(self, rgb_range, rgb_mean, rgb_std, sign-1): super(MeanShift, self).__init__(3, 3, kernel_size1) std torch.Tensor(rgb_std) self.weight.data torch.eye(3).view(3, 3, 1, 1) self.weight.data.div_(std.view(3, 1, 1, 1)) self.bias.data sign * rgb_range * torch.Tensor(rgb_mean) self.bias.data.div_(std) for p in self.parameters(): p.requires_grad False def init_weights(modules): pass class Merge_Run(nn.Module): def __init__(self, in_channels, out_channels, ksize3, stride1, pad1, dilation1): super(Merge_Run, self).__init__() self.body1 nn.Sequential( nn.Conv2d(in_channels, out_channels, ksize, stride, pad), nn.ReLU(inplaceTrue) ) self.body2 nn.Sequential( nn.Conv2d(in_channels, out_channels, ksize, stride, 2, 2), nn.ReLU(inplaceTrue) ) self.body3 nn.Sequential( nn.Conv2d(in_channels * 2, out_channels, ksize, stride, pad), nn.ReLU(inplaceTrue) ) init_weights(self.modules) def forward(self, x): out1 self.body1(x) out2 self.body2(x) c torch.cat([out1, out2], dim1) c_out self.body3(c) out c_out x return out class Merge_Run_dual(nn.Module): def __init__(self, in_channels, out_channels, ksize3, stride1, pad1, dilation1): super(Merge_Run_dual, self).__init__() self.body1 nn.Sequential( nn.Conv2d(in_channels, out_channels, ksize, stride, pad), nn.ReLU(inplaceTrue), nn.Conv2d(in_channels, out_channels, ksize, stride, 2, 2), nn.ReLU(inplaceTrue) ) self.body2 nn.Sequential( nn.Conv2d(in_channels, out_channels, ksize, stride, 3, 3), nn.ReLU(inplaceTrue), nn.Conv2d(in_channels, out_channels, ksize, stride, 4, 4), nn.ReLU(inplaceTrue) ) self.body3 nn.Sequential( nn.Conv2d(in_channels * 2, out_channels, ksize, stride, pad), nn.ReLU(inplaceTrue) ) init_weights(self.modules) def forward(self, x): out1 self.body1(x) out2 self.body2(x) c torch.cat([out1, out2], dim1) c_out self.body3(c) out c_out x return out class BasicBlock(nn.Module): def __init__(self, in_channels, out_channels, ksize3, stride1, pad1): super(BasicBlock, self).__init__() self.body nn.Sequential( nn.Conv2d(in_channels, out_channels, ksize, stride, pad), nn.ReLU(inplaceTrue) ) init_weights(self.modules) def forward(self, x): out self.body(x) return out class BasicBlockSig(nn.Module): def __init__(self, in_channels, out_channels, ksize3, stride1, pad1): super(BasicBlockSig, self).__init__() self.body nn.Sequential( nn.Conv2d(in_channels, out_channels, ksize, stride, pad), nn.Sigmoid() ) init_weights(self.modules) def forward(self, x): out self.body(x) return out class ResidualBlock(nn.Module): def __init__(self, in_channels, out_channels): super(ResidualBlock, self).__init__() self.body nn.Sequential( nn.Conv2d(in_channels, out_channels, 3, 1, 1), nn.ReLU(inplaceTrue), nn.Conv2d(out_channels, out_channels, 3, 1, 1), ) init_weights(self.modules) def forward(self, x): out self.body(x) out F.relu(out x) return out class EResidualBlock(nn.Module): def __init__(self, in_channels, out_channels, group1): super(EResidualBlock, self).__init__() self.body nn.Sequential( nn.Conv2d(in_channels, out_channels, 3, 1, 1, groupsgroup), nn.ReLU(inplaceTrue), nn.Conv2d(out_channels, out_channels, 3, 1, 1, groupsgroup), nn.ReLU(inplaceTrue), nn.Conv2d(out_channels, out_channels, 1, 1, 0), ) init_weights(self.modules) def forward(self, x): out self.body(x) out F.relu(out x) return out class CALayer(nn.Module): def __init__(self, channel, reduction16): super(CALayer, self).__init__() self.avg_pool nn.AdaptiveAvgPool2d(1) self.c1 BasicBlock(channel, channel // reduction, 1, 1, 0) self.c2 BasicBlockSig(channel // reduction, channel, 1, 1, 0) def forward(self, x): y self.avg_pool(x) y1 self.c1(y) y2 self.c2(y1) return x * y2 class Block(nn.Module): def __init__(self, in_channels, out_channels, group1): super(Block, self).__init__() self.r1 Merge_Run_dual(in_channels, out_channels) self.r2 ResidualBlock(in_channels, out_channels) self.r3 EResidualBlock(in_channels, out_channels) # self.g ops.BasicBlock(in_channels, out_channels, 1, 1, 0) self.ca CALayer(in_channels) def forward(self, x): r1 self.r1(x) r2 self.r2(r1) r3 self.r3(r2) # g self.g(r3) out self.ca(r3) return out class RIDNET(nn.Module): def __init__(self, args): super(RIDNET, self).__init__() n_feats 16 kernel_size 3 rgb_range 255 mean (0.4488, 0.4371, 0.4040) std (1.0, 1.0, 1.0) self.sub_mean MeanShift(rgb_range, mean, std) self.add_mean MeanShift(rgb_range, mean, std, 1) self.head BasicBlock(3, n_feats, kernel_size, 1, 1) self.b4 Block(n_feats, n_feats) self.tail nn.Conv2d(n_feats, 3, kernel_size, 1, 1, 1) def forward(self, x): s self.sub_mean(x) h self.head(s) b_out self.b4(h) res self.tail(b_out) out self.add_mean(res) f_out out x return f_out if __name__ __main__: # Generating Sample image image_size (1, 3, 640, 640) image torch.rand(*image_size) # Model model RIDNET(3) out model(image) print(out.size())四、手把手教你添加RIDNet4.1 修改一第一还是建立文件我们找到如下ultralytics/nn文件夹下建立一个目录名字呢就是Addmodules文件夹(用群内的文件的话已经有了无需新建)然后在其内部建立一个新的py文件将核心代码复制粘贴进去即可。4.2 修改二第二步我们在该目录下创建一个新的py文件名字为__init__.py(用群内的文件的话已经有了无需新建)然后在其内部导入我们的检测头如下图所示。4.3 修改三第三步我门中到如下文件ultralytics/nn/tasks.py进行导入和注册我们的模块(用群内的文件的话已经有了无需重新导入直接开始第四步即可)4.4 修改四按照我的添加在parse_model里添加即可。到此就修改完成了大家可以复制下面的yaml文件运行。五、RIDNet 的yaml文件和运行记录5.1 RIDNet 的yaml文件此版本训练信息YOLO26-RIDNet summary: 288 layers, 2,530,552 parameters, 2,530,528 gradients, 25.6 GFLOPs# Ultralytics AGPL-3.0 License - https://ultralytics.com/license # Ultralytics YOLO26 object detection model with P3/8 - P5/32 outputs # Model docs: https://docs.ultralytics.com/models/yolo26 # Task docs: https://docs.ultralytics.com/tasks/detect # Parameters nc: 80 # number of classes end2end: True # whether to use end-to-end mode reg_max: 1 # DFL bins scales: # model compound scaling constants, i.e. modelyolo26n.yaml will call yolo26.yaml with scale n # [depth, width, max_channels] n: [0.50, 0.25, 1024] # summary: 260 layers, 2,572,280 parameters, 2,572,280 gradients, 6.1 GFLOPs s: [0.50, 0.50, 1024] # summary: 260 layers, 10,009,784 parameters, 10,009,784 gradients, 22.8 GFLOPs m: [0.50, 1.00, 512] # summary: 280 layers, 21,896,248 parameters, 21,896,248 gradients, 75.4 GFLOPs l: [1.00, 1.00, 512] # summary: 392 layers, 26,299,704 parameters, 26,299,704 gradients, 93.8 GFLOPs x: [1.00, 1.50, 512] # summary: 392 layers, 58,993,368 parameters, 58,993,368 gradients, 209.5 GFLOPs # YOLO26n backbone backbone: # [from, repeats, module, args] - [-1, 1, RIDNET, []] # 0-P1/2 - [-1, 1, Conv, [64, 3, 2]] # 1-P1/2 - [-1, 1, Conv, [128, 3, 2]] # 2-P2/4 - [-1, 2, C3k2, [256, False, 0.25]] - [-1, 1, Conv, [256, 3, 2]] # 4-P3/8 - [-1, 2, C3k2, [512, False, 0.25]] - [-1, 1, Conv, [512, 3, 2]] # 6-P4/16 - [-1, 2, C3k2, [512, True]] - [-1, 1, Conv, [1024, 3, 2]] # 8-P5/32 - [-1, 2, C3k2, [1024, True]] - [-1, 1, SPPF, [1024, 5, 3, True]] # 10 - [-1, 2, C2PSA, [1024]] # 11 # YOLO26n head head: - [-1, 1, nn.Upsample, [None, 2, nearest]] - [[-1, 7], 1, Concat, [1]] # cat backbone P4 - [-1, 2, C3k2, [512, True]] # 14 - [-1, 1, nn.Upsample, [None, 2, nearest]] - [[-1, 5], 1, Concat, [1]] # cat backbone P3 - [-1, 2, C3k2, [256, True]] # 17 (P3/8-small) - [-1, 1, Conv, [256, 3, 2]] - [[-1, 14], 1, Concat, [1]] # cat head P4 - [-1, 2, C3k2, [512, True]] # 20 (P4/16-medium) - [-1, 1, Conv, [512, 3, 2]] - [[-1, 11], 1, Concat, [1]] # cat head P5 - [-1, 1, C3k2, [1024, True, 0.5, True]] # 23 (P5/32-large) - [[17, 20, 23], 1, Detect, [nc]] # Detect(P3, P4, P5)5.2 训练代码大家可以创建一个py文件将我给的代码复制粘贴进去配置好自己的文件路径即可运行。import warnings warnings.filterwarnings(ignore) from ultralytics import YOLO if __name__ __main__: model YOLO(ultralytics/cfg/models/v8/yolov8-C2f-FasterBlock.yaml) # model.load(yolov8n.pt) # loading pretrain weights model.train(datar替换数据集yaml文件地址, # 如果大家任务是其它的ultralytics/cfg/default.yaml找到这里修改task可以改成detect, segment, classify, pose cacheFalse, imgsz640, epochs150, single_clsFalse, # 是否是单类别检测 batch4, close_mosaic10, workers0, device0, optimizerSGD, # using SGD # resume, # 如过想续训就设置last.pt的地址 ampFalse, # 如果出现训练损失为Nan可以关闭amp projectruns/train, nameexp, )5.3 RIDNet 的训练过程截图五、本文总结到此本文的正式分享内容就结束了在这里给大家推荐我的YOLOv26改进有效涨点专栏本专栏目前为新开的平均质量分98分后期我会根据各种最新的前沿顶会进行论文复现也会对一些老的改进机制进行补充如果大家觉得本文帮助到你了订阅本专栏关注后续更多的更新~专栏链接YOLOv26有效涨点专栏包含Conv、注意力机制、主干/Backbone、损失函数、优化器、后处理等改进机制

yolov26改进 | 图像复原篇 | 单阶段盲真实图像去噪网络RIDNet辅助YOLOv26图像去噪（全网独家首发）

相关新闻

相关新闻

Oracle数据库锁机制概述

获取免费FOFA高级会员、DayDaymap、360Quake、Hunter测绘搜索引擎高级会员免费使用最大1W条查询工具

AI价值投资：因子选择与组合优化实战指南

最新新闻

科研配图告别多软件折腾！paperxie AI 科研绘图三步式制图功能全解析

Qt实现简易计数器（点击累加/清零功能）【完整源码】

Koji Build 命令参数深度解析：从入门到精通

2026年7月亲测：深圳高空吊装企业性价比分享

字典、集合你真的了解吗？

Python爬虫经典案例第58篇：数据竞赛平台爬取——Kaggle数据采集实战

日新闻

C#与Gemma 3构建本地AI代理实战指南

如何轻松获取国家中小学智慧教育平台电子教材PDF完整指南

如何5分钟快速上手XUnity.AutoTranslator：打破语言障碍的游戏翻译神器终极指南

周新闻

月新闻