0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浅析卷积降维与池化降维的对比

jf_78858299 来源:算法与编程之美 作者:编程之美 2023-02-17 14:58 次阅读

**1 **问题

在学习深度学习中卷积网络过程中,有卷积层,池化层,全连接层等等,其中卷积层与池化层均可以对特征图降维,本次实验针对控制其他层次一致的情况下,使用卷积降维与池化降维进行对比分析,主要是看两种降维方式对精度的影响以,以及损失值的大小。与此同时还可以探究不同维度下对精度是否有影响。

**2 **方法

这里是所有的代码,每次只需要更改网络的模型,即使用卷积层,使其降维的维度最后是1x1、7x7、14x14,需要更改三次,其次是使用池化层降维,最后也需要达到1x1、7x7、14x14,这三种维度。

| import torchvision
from torchvision.transforms import ToTensor, transforms
from torch.utils.data import DataLoader
from torch import nn
import torch
from time import *
import xlwt
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus']=False

创建一个新的类继承nn.Module

class MyNet(nn.Module):

(5.2) 定义网络有哪些层,这些层都作为成员变量

def init (self):
super(). init ()

卷积

in_channels输入 out_channels输出 kernel_size 卷积核 stride 步长

self.conv1 = nn.Conv2d(in_channels=1, out_channels=16, kernel_size=3, stride=1, padding=1, )

[-,16,28,28] [B, C, H, W] batch channel height weight

self.max_pool1 = nn.MaxPool2d(2)

self.conv2 = nn.Conv2d(in_channels=16, out_channels=32, kernel_size=3, stride=2, padding=1, )

self.max_pool2 = nn.MaxPool2d(2)

self.conv3 = nn.Conv2d(in_channels=32, out_channels=64, kernel_size=4, stride=2, padding=1, )

self.max_pool3 = nn.MaxPool2d(2)

[-,32,28,28]

全连接

self.fc = nn.Linear(in_features=32 * 14 * 14, out_features=10)

(5.3) 定义数据在网络中的流动

x - 1x28x28 CxHxW C表示通道数,H表示图像高度,W表示图像宽度

def forward(self, x):

x = torch.relu(self.conv1(x))

x = self.max_pool1(x)

x = torch.relu(self.conv2(x))

x = self.max_pool2(x)

x = torch.relu(self.conv3(x))

x = self.max_pool3(x)

x = torch.flatten(x, 1) #! 默认从0维开始拉伸 如果不设置1的话 会吧batch也拉伸进去

[B, C, H, W]

拉伸 C H W

out = torch.relu(self.fc(x))

return out

训练网络

loss_list: 统计每个周期的平均loss

def train(dataloader, net, loss_fn, optimizer):
size = len(dataloader.dataset)
epoch_loss = 0.0
batch_num = len(dataloader)
net.train()

精度=原预测正确数量/总数

correct = 0

一个batch一个batch的训练网络

for batch_idx, (x, y) in enumerate(dataloader):

--->

x, y = x.to(device), y.to(device) # 在GPU上运行x,y
pred = net(x)
loss = loss_fn(pred, y)

基于loss信息利用优化器从后向前更新网络全部参数

optimizer.zero_grad()
loss.backward()
optimizer.step()
epoch_loss += loss.item()
correct += (pred.argmax(1) == y).type(torch.float).sum().item()
if batch_idx % 100 == 0:

print(f'batch index:, loss:') # item()方法将单个tensor转化成数字

print(f'[ {batch_idx + 1 :>5d} / {batch_num :>5d} ] loss: {loss.item()}')

统计一个周期的平均loss

avg_loss = epoch_loss / batch_num
avg_accuracy = correct / size
return avg_accuracy, avg_loss

验证and评估

def test_and_val(dataloader, net, loss_fn):
size = len(dataloader.dataset)
batch_num = len(dataloader)
correct = 0
losses = 0
net.eval()
with torch.no_grad():
for x, y in dataloader:
x, y = x.to(device), y.to(device)
pred = net(x)
loss = loss_fn(pred, y)
losses += loss.item()
correct += (pred.argmax(1) == y).type(torch.int).sum().item()
accuracy = correct / size
avg_loss = losses / batch_num

print(f'The Accuracy =%')

return accuracy, avg_loss
if name == 'main':
transform = transforms.Compose([
transforms.ToTensor(),
transforms.Normalize(0.1307, 0.3081)])

(0) 测试机器是否支持GPU

data_train_acc = []
data_train_loss = []
data_val_acc = []
data_val_loss = []
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

batch_size = [32,64,128,256]

batch_size = [64]
train_all_ds = torchvision.datasets.MNIST(root="data", download=True, train=True, transform=transform, )

将训练集划分为训练集+验证集

train_ds, val_ds = torch.utils.data.random_split(train_all_ds, [50000,10000])
test_ds = torchvision.datasets.MNIST(root="data", download=True, train=False, transform=transform, )
for each in range(len(batch_size)):
train_loader = DataLoader(dataset=train_ds,batch_size=batch_size[each], shuffle=True,)
val_loader = DataLoader(dataset=val_ds,batch_size=batch_size[each],)
test_loader = DataLoader(dataset=test_ds,batch_size=batch_size[each],)

(5) 网络的输入、输出以及测试网络的性能(不经过任何训练的网络)

net = MyNet().to(device)
optimizer = torch.optim.SGD(net.parameters(), lr=0.01)
loss_fn = torch.nn.CrossEntropyLoss()

(6)训练周期

begin_time = time()
train_accuracy_list = []
train_loss_list = []
val_accuracy_list = []
val_loss_list = []
epoch = 10
for t in range(epoch):
print(f"Epoch {t + 1}")
train_accuracy, train_loss = train(train_loader, net, loss_fn, optimizer)
train_accuracy_list.append(train_accuracy)
train_loss_list.append(train_loss)
print(f'Epoch {t + 1 :<2d} Train Acc = {train_accuracy * 100 :.2f}% || Epoch {t + 1} Train Loss = {train_loss}')
val_accuracy, val_loss = test_and_val(val_loader, net, loss_fn)
val_accuracy_list.append(val_accuracy)
val_loss_list.append(val_loss)
print(f'Epoch {t + 1 :<2d} Val Acc = {val_accuracy * 100 :.2f}% || Epoch {t + 1} Val Loss = {val_loss}')

print(f'Best_Train_Acc =% || Best_Val_Acc =%')

data_train_acc.append(train_accuracy_list)
data_train_loss.append(train_loss_list)
data_val_acc.append(val_accuracy_list)
data_val_loss.append(val_loss_list)
data_set = [data_train_acc,data_train_loss,data_val_acc,data_val_loss]
file = xlwt.Workbook('encoding = utf-8') # 设置工作簿编码
sheet1 = file.add_sheet('数据', cell_overwrite_ok=True) # 创建sheet工作表

要写入的列表的值

name = ['train_acc_batch','train_loss_batch','val_acc_batch','val_loss_batch']

for one in range(len(data_set)):

data = data_set[one]

id = name[one]

for i in range(len(data)):

for j in range(len(data[i])):

sheet1.write(j, i, data[i][j]) # 写入数据参数对应 行, 列, 值

file.save(f'CNN1_CH_.xls') # 保存.xls到当前工作目录

print(f'Best_Train_Acc = {max(train_accuracy_list) * 100 :.2f}%, Best_Val_Acc = {max(val_accuracy_list) * 100 :.2f}%')
test_accuracy,_ = test_and_val(test_loader, net, loss_fn)
print(f'Test Acc = {test_accuracy * 100}%')
end_time = time()
print('Time Consumed:',end_time-begin_time) |

卷积降维与池化降维对精度的影响

图片

图2.1训练集精度对比

图片

图2.2验证集精度对比

如图2.1和图2.2所示在使用卷积降维的情况下无论特征图尺寸在14x14、7x7、1x1在训练集下,精度最开始都是从80%多在10个周期以后均能达到99%左右,最终预测精度能达到99.99%,并且在10个周期以后就达到99%,再训练90个周期就是缓慢的从99%到99.99%几乎接近1的精度了。训练集也是如此,10个周期左右达到98%,最后稳定在98.40%左右。

池化降维,无论训练集还是验证集在14x14、7x7,1x1在首次只有60%多的准确率,在14x14的尺寸下,池化降维可以接近90%的准确率,大致在88%-89%,7x7、1x1均只能达到78%-79%左右,并且都是在10个周期左右趋于稳定,只有小幅波动。

图片

图2.3训练集损失值对比

卷积降维与池化降维对损失值****的影响

图片

图2.4验证集损失值对比

如图2.3和2.4所示,卷积降维训练集与验证集的损失值在首次就能达到池化降维的最小值,并且卷积降维随着训练次数的增加还在持续减小,几乎能够达到0.00几的损失值,最后稳定在这附近波动,代表预测值与真实值之间的差距非常小,几乎接近。

然后池化降维首次就是0.8-0.9左右,随着训练次数增加最低值也就只有0.5-0.6左右。但是池化降维在14x14尺寸下其损失值可以相对于在池化降维下7x7、1x1的尺寸下较小一些,可以达到0.3左右的损失值。

**3 **结语

针对卷积降维和池化降维,这里是对特征图14x14、7x7、1x1进行了精度对比和损失值对比的分析,最终得出在对于降维的方法使用下,卷积降维效果更佳,但需要人为去计算出该卷积出来的特征图大小,但是池化可以直接很简单的得出特征图大小,这是其中一个区别,也是池化特征的一个优点。但是对于实验结果的效果,卷积降维要更好与池化降维的。能够使训练集精度达到99.99%,验证集精度达到98.40%左右。这是卷积降维的优点所在。

在本次实验中,得出的最后的结论是,卷积降维对于结果精度要优于池化降维,但是卷积降维需要人为来计算卷积后的特征图大小,从而去更改卷积层的参数,有时候较为麻烦。池化降维则可以轻易的得出想要的特征图大小。

对于本次实验只是比较了特征图14x14、7x7、1x1,这三个尺寸对于精度的影响不同。还可以试着比较训练花费时间。以及不同尺寸是否对结果有什么影响。这次实验数据也有不同尺寸的结果,我也同时对比了一下在卷积层最后不同的尺寸对于精度的影响,最后发现只有前10个周期有一点区别,最终均能达到最优的效果,但是为了计算量的减少,在同等结果的情况下,尺寸小那么更节省时间吧。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 卷积
    +关注

    关注

    0

    文章

    95

    浏览量

    18526
  • 深度学习
    +关注

    关注

    73

    文章

    5504

    浏览量

    121250
  • 卷积网络
    +关注

    关注

    0

    文章

    42

    浏览量

    2180
收藏 人收藏

    评论

    相关推荐

    求助,SVM分类时要不要先进行PCA呢?

    大家知道,既然SVM可以较好地解决小样本、非线性、高数等分类问题,那对于高样本输入,需不需要提前进行PCA呢?PCA
    发表于 10-27 20:13

    卷积神经网络一卷积的处理过程

    。本文就以一卷积神经网络为例谈谈怎么来进一步优化卷积神经网络使用的memory。文章(卷积神经网络中一卷.
    发表于 12-23 06:16

    基于图嵌入和最大互信息组合的

    在特征方面,图嵌入框架统一了PCA, LDA 等一系列特征算法,方便求解,但相似度矩阵计算有赖于人为假设。而最大互信息(MMI)从信息论的角度得到有效的特征
    发表于 08-21 10:24 9次下载

    空时自适应处理研究

    是空时自适应处理(STAP :SPACE-TIME ADAPTIVE PROCESSING)实用的重要手段,基于杂波协方差矩阵特征分解的
    发表于 12-18 16:46 13次下载

    卡诺图在逻辑函数设计中的应用

    给出了由逻辑函数表达式直接做卡诺图、用卡诺图化简逻辑函数的具体步骤和方法,并分析了在设计组合逻辑电路中,用
    发表于 04-18 15:27 44次下载
    <b class='flag-5'>降</b><b class='flag-5'>维</b>卡诺图在逻辑函数设计中的应用

    基于图论的人脸图像数据方法综述

    近几年基于图论的方法越来越得到人们的关注,本文针对人脸识别中的核心问题即对高数据进行的目的,首先介绍了有关图论的基本概念,通过总结
    发表于 09-03 16:13 0次下载

    一种基于局部结构保持的数据方法

    一种基于局部结构保持的数据方法_张琳
    发表于 01-07 18:56 2次下载

    基于Wasserstein距离概率分布模型的非线性算法

    是大数据分析和可视领域中的核心问题,其中基于概率分布模型的算法通过最优化高数据模型和
    发表于 11-24 17:13 3次下载

    基于间距的方法_间距判别投影

    针对全局方法判别信息不足,局部方法对邻域关系的判定存在缺陷的问题,提出一种新的基于间距的
    发表于 12-03 11:20 1次下载

    卷积、二卷积、三卷积具体应用

    由于计算机视觉的大红大紫,二卷积的用处范围最广。因此本文首先介绍二卷积,之后再介绍一卷积
    发表于 05-08 10:29 4870次阅读
    一<b class='flag-5'>维</b><b class='flag-5'>卷积</b>、二<b class='flag-5'>维</b><b class='flag-5'>卷积</b>、三<b class='flag-5'>维</b><b class='flag-5'>卷积</b>具体应用

    【连载】深度学习笔记10:三卷积与全连接

    并没有什么学习过程。     完成之后就是标准神经网络中的全连接层了。全连接层我们在 DNN 中有详细介绍,这里就不再赘述。总之,一个典型的卷积层通常包括卷积层-
    的头像 发表于 10-25 20:09 3344次阅读

    如何使用自适应嵌入的半监督多视角特征实现的方法概述

    半监督模式下的多视角特征方法,大多并未考虑到不同视角间特征投影的差异,且由于缺乏对后的低矩阵的稀疏约束,无法避免噪声和其他不相关特
    发表于 12-18 14:19 10次下载
    如何使用自适应嵌入的半监督多视角特征实现<b class='flag-5'>降</b><b class='flag-5'>维</b>的方法概述

    由浅入深的对其原理进行了详细总结

    矩阵是由多个列向量组成的,因此矩阵思想与向量思想一样,只要求得矩阵在各基向量的投影即可,基向量可以理解为新的坐标系,投影就是
    的头像 发表于 03-22 14:01 8196次阅读
    由浅入深的对其<b class='flag-5'>降</b><b class='flag-5'>维</b>原理进行了详细总结

    如何使用FPGA实现高光谱图像奇异值分解威廉希尔官方网站

    了解决高光谱图像数高、数据量巨大、实时处理威廉希尔官方网站 实现难的问题,提出了高光谱图像实时处理威廉希尔官方网站 。采用奇异值分解(SVD)算法对高光谱图像进行
    发表于 03-11 16:07 10次下载
    如何使用FPGA实现高光谱图像奇异值分解<b class='flag-5'>降</b><b class='flag-5'>维</b>威廉希尔官方网站

    关于Python 的11种经典数据算法

    网上关于各种算法的资料参差不齐,同时大部分不提供源代码。这里有个 GitHub 项目整理了使用 Python 实现了 11 种经典的数据抽取(数据)算法,包括:PCA、LDA、
    的头像 发表于 06-04 15:03 1862次阅读