当前位置: 开发笔记 > 编程语言 > 正文

torch7框架深度学习(1)

作者：求道金林 | 来源：互联网 | 2023-09-15 20:38

前面已经安装好了torch，下面就来看看如何在torch框架上搭建深度学习模型，我一直觉得源码结合原理是机器学习最好的学习途径。所以我们从分析一个简单的案例开始吧。参考Supervis

前面已经安装好了torch，下面就来看看如何在torch框架上搭建深度学习模型，我一直觉得源码结合原理是机器学习最好的学习途径。所以我们从分析一个简单的案例开始吧。

参考Supervised Learning

这个例子呢，主要是以有监督的方式构建一个深度学习模型实现对数据集SVHN的分类。

SVHN是 The Street View House Numbers Dataset, 数据集介绍见 SVHN数据集

代码主要分为五个部分

数据的预处理
网络模型的构建
损失函数的定义
训练网络
测试数据

数据的预处理

 
    require 'torch' -- torch  
      
require 'image' -- to visualize the dataset  
      
require 'nn' -- provides a normalization operator

加载头文件

 
    if not opt then  
      
print '==> processing options'  
      
cmd = torch.CmdLine()  
      
cmd:text()  
      
cmd:text('SVHN Dataset Preprocessing')  
      
cmd:text()  
      
cmd:text('Options:')  
      
cmd:option('-size', 'small', 'how many samples do we load: small | full | extra')  
      
cmd:option('-visualize', true, 'visualize input data and weights during training')  
      
cmd:text()  
      
opt = cmd:parse(arg or {})  
      
end

文件的命令行参数。主要有两个参数（文件大小和是否可视化选项），torch.CmdLine()函数参见torch.CmdLine()

 
    www = 'http://data.neuflow.org/data/housenumbers/'  
      
train_file = 'train_32x32.t7'  
      
test_file = 'test_32x32.t7'  
      
extra_file = 'extra_32x32.t7'  
      
if not paths.filep(train_file) then  
      
os.execute('wget ' .. www .. train_file)  
      
end  
      
if not paths.filep(test_file) then  
      
os.execute('wget ' .. www .. test_file)  
      
end  
      
if opt.size == 'extra' and not paths.filep(extra_file) then  
      
os.execute('wget ' .. www .. extra_file)   
      
end

用于数据集的下载，数据集网址,但是这个网址好像被墙了，访问不了。所以我自己令下载的数据集SVHN，其中只下载了 train_32x32.mat和 test_32x32.mat文件，因为数据太大机子跑得太慢。

顺便说一句上边代码中 os.execute(string)是执行string指令，wget是下载指令，参见linux 应用之wget 命令详解

下载下来的数据是 mat格式的，要转换成 torch使用的t7格式，文档中说可以使用mattorch工具实现，但是我在虚拟机上没有装matlab，所以安装mattorch总是失败。另外使用matio同样可以实现matlab和torch间数据转换。

下面是安装matio的指令matio-ffi

 
    sudo apt-get install libmatio2  
      
sudo luarocks install matio

此时下载的数据是 columns x rows x channels x num ,但image.display()要求的数据组织形式是： num x channels x columns x rows,所以需要进行重组织，由于我也是个刚开始使用torch没一周的人，所以就用较原始的办法重组织了，谁有好办法希望教教我！下面是数据转换的代码

 
    matio = require'matio'  
      
loaded = matio.load('/SVHN_Data/train_32x32.mat')  
      
tempData=loaded.X:permute(4,3,1,2)  
      
trainData = {  
      
data = tempData,  
      
labels = loaded.y[{{},{1}}], -- loaded.y:size() --> 26032 x 1  
      
size = function() return trsize end  
      
}

数据存放在'/SVHN_Data'文件夹内
------------------------------------------------------下面一段是用来看数据转换的对不对 --------------------------------
torch 结果
enter description here
matlab结果

颜色不大一样，一个是在笔记本上跑的，一个是在台机上跑的，不知道是不是机器的原因还是什么原因

---------------------------------------------------------------------END---------------------------------------------------------

 
    if opt.size == 'extra' then  
      
 print '==> using extra training data'  
      
 trsize = 73257 + 531131  
      
 tesize = 26032  
      
elseif opt.size == 'full' then  
      
 print '==> using regular, full training data'  
      
 trsize = 73257  
      
 tesize = 26032  
      
elseif opt.size == 'small' then  
      
 print '==> using reduced training data, for fast experiments'  
      
 trsize = 10000  
      
 tesize = 2000  
      
end

上面这一段是设置训练集和测试集的大小。
================================================================= START ==================================================

 
    loaded = torch.load(train_file,'ascii')  
      
trainData = {  
      
 data = loaded.X:transpose(3,4),  
      
 labels = loaded.y[1],  
      
 size = function() return trsize end  
      
}

上面这段代码很容易理解，就是分别将数据和标签起别名data和labels方便后续使用，size返回的是训练样本的个数。唯一需要注意的是transpose()函数的使用，这是因为在matlab中数据的表达一般是先列后行，而在torch中数据的表达一般是先行后列，所以这里对后两维进行了转置
这段代码被上面自己下载数据并处理取代
====================================================== END ======================================================

 
    if opt.size == 'extra' then  
      
 loaded = torch.load(extra_file,'ascii')  
      
 trdata = torch.Tensor(trsize,3,32,32)  
      
 trdata[{ {1,(#trainData.data)[1]} }] = trainData.data  
      
 trdata[{ {(#trainData.data)[1]+1,-1} }] = loaded.X:transpose(3,4)  
      
 trlabels = torch.Tensor(trsize)  
      
 trlabels[{ {1,(#trainData.labels)[1]} }] = trainData.labels  
      
 trlabels[{ {(#trainData.labels)[1]+1,-1} }] = loaded.y[1]  
      
 trainData = {  
      
 data = trdata,  
      
 labels = trlabels,  
      
 size = function() return trsize end  
      
 }  
      
end

当数据选择extra时，上面对训练集进行拼接。

同样加载测试集

 
    loaded = matio.load('/SVHN_Data/test_32x32.mat')  
      
tempData = loaded.X:permute(4,3,1,2)  
      
testData = {data = tempData, labels =loaded.y, size = function() return tesize end}  
      
tempData = nil

下面进行数据的预处理
数据的预处理包含三个trick
+ 图像从RGB空间映射到YUV空间
+ Y通道使用 contrastive normalization operator进行局部规范化
+ 对所有的数据在每个通道进行规范化到0，1之间

 
    -- RGB==>YUV  
      
for i=1,trainData:size() do   
      
 trainData.data[i] = image.rgb2yuv(trainData.data[i]) -- 等价于 trainData.data[{{i},{},{},{}}]  
      
end  
      
for i=1,testData:size() do  
      
 testData.data[i] = image.rgb2yuv(testData.data[i])  
      
end  
      
-- Name Channels for convenience  
      
channels = {'y','u','v'}  
      
-- 单通道进行规范化  
      
Mean={}  
      
Std={}  
      
for i=1, channel in ipairs(channels) do --此处和for i=1,3 do等价  
      
 Mean[i]= trainData.data[{{},{i},{},{}}]:mean()  
      
 Std[i] = trainData.data[{{},{i},{},{}}]:std()  
      
 trainData.data[{{},{i},{},{}}]=trainData.data[{{},{i},{},{}}]:csub(Mean[i])  
      
 trainData.data[{{},{i},{},{}}]=trainData.data[{{},{i},{},{}}]:div(Std[i])  
      
end  
      
for i=1,3 do  
      
 testData.data[{{},{i},{},{}}]:add(-Mean[i]) -- add 和csub  
      
 -- 这个用法见Tensor的手册，改变后替代原来数据，所以和上面是一样的  
      
 testData.data[{{},{i},{},{}}]:div(Std[i])  
      
end  
      
-- 至于为什么测试数据使用训练集的统计量归一化，参见机器学习相关理论

Y通道局部的规范化需要使用nn包里的算子

 
    -- Define the normalization neighborhood:  
      
neighborhood = image.gaussian1D(7)  
      
-- Define our local normalization operator (It is an actual nn module,   
      
-- which could be inserted into a trainable model):  
      
normalization = nn.SpatialContrastiveNormalization(1, neighborhood):float()  
      
-- Normalize all Y channels locally:  
      
for i = 1,trainData:size() do  
      
 trainData.data[{ i,{1},{},{} }] = normalization:forward(trainData.data[{ i,{1},{},{} }]) --前向计算  
      
end  
      
for i = 1,testData:size() do  
      
 testData.data[{ i,{1},{},{} }] = normalization:forward(testData.data[{ i,{1},{},{} }])  
      
end

关于函数 nn.SpatialContrastiveNormalization(1, neighborhood) 参见 torch/nn/SpatialContrastiveNormalization.lua

===================== It's always good practice to verify that data is properly normalized ========================

 
    for i,channel in ipairs(channels) do  
      
 trainMean = trainData.data[{ {},i }]:mean()  
      
 trainStd = trainData.data[{ {},i }]:std()  
      
 testMean = testData.data[{ {},i }]:mean()  
      
 testStd = testData.data[{ {},i }]:std()  
      
 print('training data, '..channel..'-channel, mean: ' .. trainMean)  
      
 print('training data, '..channel..'-channel, standard deviation: ' .. trainStd)  
      
 print('test data, '..channel..'-channel, mean: ' .. testMean)  
      
 print('test data, '..channel..'-channel, standard deviation: ' .. testStd)  
      
end

================================================= END ======================================

最后是数据的可视化,显示了前256个数据Y，U，V通道上的效果

 
    if opt.visualize then  
      
 first256Samples_y = trainData.data[{ {1,256},1 }]  
      
 first256Samples_u = trainData.data[{ {1,256},2 }]  
      
 first256Samples_v = trainData.data[{ {1,256},3 }]  
      
 image.display{image=first256Samples_y, nrow=16, legend='Some training examples: Y channel'}  
      
 image.display{image=first256Samples_u, nrow=16, legend='Some training examples: U channel'}  
      
 image.display{image=first256Samples_v, nrow=16, legend='Some training examples: V channel'}  
      
end

具体的代码见附件

命令行执行： (1_data.lua)是文件名

qlua 1_data.lua

result.png

结果见下图（Y通道）
enter description here

github上给的结果(Y通道)
enter description here

================================================== 结论 ===================================

torch 挺好用的，和我胃口^-
在笔记本上安装虚拟机跑深度学习的代码。。。真是蛮拼的。。。这速度感人啊，直接在ubuntu系统上跑还是蛮快的
===========================================================================================
=

附件

推荐阅读

const
使用 Azure Service Principal 和 Microsoft Graph API 获取 AAD 用户列表

本文介绍了一段通用代码示例，该代码不仅能够操作 Azure Active Directory (AAD)，还可以通过 Azure Service Principal 的授权访问和管理 Azure 订阅资源。Azure 的架构可以分为两个层级：AAD 和 Subscription。 ... [详细]

蜡笔小新 2024-12-27 16:07:12
string
扫描线三巨头 hdu1928hdu 1255 hdu 1542 [POJ 1151]

学习链接：http:blog.csdn.netlwt36articledetails48908031学习扫描线主要学习的是一种扫描的思想，后期可以求解很 ... [详细]

蜡笔小新 2024-12-26 20:04:36
string
ASP.NET Core 3.1 中的Startup类

Startup 类配置服务和应用的请求管道。Startup类ASP.NETCore应用使用 Startup 类，按照约定命名为 Startup。 Startup 类：可选择性地包括 ... [详细]

蜡笔小新 2024-12-25 02:13:25
string
深入理解Cookie与Session会话管理

本文详细介绍了如何通过HTTP响应和请求处理浏览器的Cookie信息，以及如何创建、设置和管理Cookie。同时探讨了会话跟踪技术中的Session机制，解释其原理及应用场景。 ... [详细]

蜡笔小新 2024-12-27 18:20:43
string
JQuery基础：省市联动与表单验证

本文介绍了如何使用JQuery实现省市二级联动和表单验证。首先，通过change事件监听用户选择的省份，并动态加载对应的城市列表。其次，详细讲解了使用Validation插件进行表单验证的方法，包括内置规则、自定义规则及实时验证功能。 ... [详细]

蜡笔小新 2024-12-27 17:10:48
runtime
Java 序列化接口详解

本文深入探讨了 Java 中的 Serializable 接口，解释了其实现机制、用途及注意事项，帮助开发者更好地理解和使用序列化功能。 ... [详细]

蜡笔小新 2024-12-27 15:06:12
shell
360SRC安全应急响应：从漏洞提交到修复的全过程

本文详细介绍了360SRC平台处理一起关键安全事件的过程，涵盖从漏洞提交、验证、排查到最终修复的各个环节。通过这一案例，展示了360在安全应急响应方面的专业能力和严谨态度。 ... [详细]

蜡笔小新 2024-12-27 11:10:05
string
Android LED 数字字体的应用与实现

本文介绍了一种适用于 Android 应用的 LED 数字字体（digital font），并详细描述了其在 UI 设计中的应用场景及其实现方法。这种字体常用于视频、广告倒计时等场景，能够增强视觉效果。 ... [详细]

蜡笔小新 2024-12-27 10:34:22
window
C#中获取进程主窗口句柄的实现方法

本文介绍了如何在C#中启动一个应用程序，并通过枚举窗口来获取其主窗口句柄。当使用Process类启动程序时，我们通常只能获得进程的句柄，而主窗口句柄可能为0。因此，我们需要使用API函数和回调机制来准确获取主窗口句柄。 ... [详细]

蜡笔小新 2024-12-27 03:39:09
string
ServiceStack与Swagger的无缝集成指南

本文详细介绍了如何在ServiceStack项目中集成Swagger，以实现API文档的自动生成和在线测试。通过本指南，您将了解从配置到部署的完整流程，并掌握如何优化API接口的开发和维护。 ... [详细]

蜡笔小新 2024-12-26 19:52:39
string
高效解决应用崩溃问题！友盟新版错误分析工具全面升级

友盟推出的最新版错误分析工具，专为移动开发者设计，提供强大的Crash收集与分析功能。该工具能够实时监控App运行状态，快速发现并修复错误，显著提升应用的稳定性和用户体验。 ... [详细]

蜡笔小新 2024-12-26 14:11:47
string
深入探讨CPU虚拟化与KVM内存管理

本文详细介绍了现代服务器架构中的CPU虚拟化技术，包括SMP、NUMA和MPP三种多处理器结构，并深入探讨了KVM的内存虚拟化机制。通过对比不同架构的特点和应用场景，帮助读者理解如何选择最适合的架构以优化性能。 ... [详细]

蜡笔小新 2024-12-25 19:15:51
string
Spring Boot 服务的最大并发处理能力

本文探讨了 Spring Boot 应用程序在不同配置下支持的最大并发连接数，重点分析了内置服务器（如 Tomcat、Jetty 和 Undertow）的默认设置及其对性能的影响。 ... [详细]

蜡笔小新 2024-12-25 16:45:57
c语言
PHP编程语言及其在股市中的应用

本文将深入探讨PHP编程语言的基本概念，并解释PHP概念股的含义。通过详细解析，帮助读者理解PHP在Web开发和股票市场中的重要性。 ... [详细]

蜡笔小新 2024-12-25 15:02:45
c语言
优化深度神经网络在低性能硬件上的运行

尽管深度学习带来了广泛的应用前景，其训练通常需要强大的计算资源。然而，并非所有开发者都能负担得起高性能服务器或专用硬件。本文探讨了如何在有限的硬件条件下（如ARM CPU）高效运行深度神经网络，特别是通过选择合适的工具和框架来加速模型推理。 ... [详细]

蜡笔小新 2024-12-24 08:48:32

求道金林

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章