torch默认参数初始化_【DL】参数初始化：你真的了解我吗？

作者：aaa | 来源：互联网 | 2023-09-14 13:45

参数初始化很简单，但是简单的东西也容易出现知识盲区，本文全文4000字，将从数理和代码两个角度带大家认识初始化，希望能给大家

参数初始化很简单&＃xff0c;但是简单的东西也容易出现知识盲区&＃xff0c;本文全文 4000 字&＃xff0c;将从数理和代码两个角度带大家认识初始化&＃xff0c;希望能给大家带来更加形象的认识。

参数初始化分为&＃xff1a;固定值初始化、预训练初始化和随机初始化。

固定初始化是指将模型参数初始化为一个固定的常数&＃xff0c;这意味着所有单元具有相同的初始化状态&＃xff0c;所有的神经元都具有相同的输出和更新梯度&＃xff0c;并进行完全相同的更新&＃xff0c;这种初始化方法使得神经元间不存在非对称性&＃xff0c;从而使得模型效果大打折扣。

预训练初始化是神经网络初始化的有效方式&＃xff0c;比较早期的方法是使用 greedy layerwise auto-encoder 做无监督学习的预训练&＃xff0c;经典代表为 Deep Belief Network&＃xff1b;而现在更为常见的是有监督的预训练&＃43;模型微调。

随机初始化是指随机进行参数初始化&＃xff0c;但如果不考虑随机初始化的分布则会导致梯度爆炸和梯度消失的问题。

我们这里主要关注随机初始化的分布状态。

1.Naive Initialization

先介绍两个用的比较多的初始化方法&＃xff1a;高斯分布和均匀分布。

以均匀分布为例&＃xff0c;通常情况下我们会将参数初始化为

&＃xff0c;我们来看下效果&＃xff1a;

class MLP(nn.Module):def __init__(self, neurals, layers):super(MLP, self).__init__()self.linears &＃61; nn.ModuleList([nn.Linear(neurals, neurals, bias&＃61;False) for i in range(layers)])self.neurals &＃61; neuralsdef forward(self, x):for (i, linear) in enumerate(self.linears):x &＃61; linear(x)print("layer:{}, std:{}".format(i&＃43;1, x.std()))if torch.isnan(x.std()):breakreturn xdef initialize(self):for m in self.modules():if isinstance(m, nn.Linear):a &＃61; np.sqrt(1/self.neurals)nn.init.uniform_(m.weight.data, -a, a)neural_nums&＃61;256 layers_nums&＃61;100 batch_size&＃61;16net &＃61; MLP(neural_nums, layers_nums) net.initialize()inputs &＃61; torch.randn((batch_size, neural_nums)) output &＃61; net(inputs)

输出为

layer:0, std:0.5743116140365601 layer:1, std:0.3258207142353058 layer:2, std:0.18501722812652588 layer:3, std:0.10656329244375229 ... ... layer:95, std:9.287707510161138e-24 layer:96, std:5.310323679717446e-24 layer:97, std:3.170952429065466e-24 layer:98, std:1.7578611563776362e-24 layer:99, std:9.757115839154053e-25

我们可以看到&＃xff0c;随着网络层数加深&＃xff0c;权重的方差越来越小&＃xff0c;直到最后超出精度范围。

我们先通过数学推导来解释一下这个现象&＃xff0c;以第一层隐藏层的第一个单元为例。

首先&＃xff0c;我们是没有激活函数的线性网络&＃xff1a;

其中&＃xff0c;n 为输入层神经元个数。

通过方差公式我们有&＃xff1a;

这里&＃xff0c;我们的输入均值为 0&＃xff0c;方差为 1&＃xff0c;权重的均值为 0&＃xff0c;方差为

&＃xff0c;所以&＃xff1a;

此时&＃xff0c;神经元的标准差为

。

通过上式进行计算&＃xff0c;每一层神经元的标准差都将会是前一层神经元的

倍。

我们可以看一下上面打印的输出&＃xff0c;是不是正好验证了这个规律。

而这种初始化方式合理吗&＃xff1f;有没有更好的初始化方法&＃xff1f;

2.Xavier Initialization

Xavier Glorot 认为&＃xff1a;优秀的初始化应该使得各层的激活值和状态梯度在传播过程中的方差保持一致。即方差一致性。

所以我们需要同时考虑正向传播和反向传播的输入输出的方差相同。

在开始推导之前&＃xff0c;我们先引入一些必要的假设&＃xff1a;

x、w、b 相同独立&＃xff1b;
各层的权重 w 独立同分布&＃xff0c;且均值为 0&＃xff1b;
偏置项 b 独立同分布&＃xff0c;且方差为 0&＃xff1b;
输入项 x 独立同分布&＃xff0c;且均值为 0&＃xff1b;

2.1 Forward

考虑前向传播&＃xff1a;

我们令输入的方差等于输出得到方差&＃xff1a;

则有&＃xff1a;

2.2 Backward

此外&＃xff0c;我们还要考虑反向传播的梯度状态。

反向传播&＃xff1a;

我们也可以得到下一层的方差&＃xff1a;

我们取其平均&＃xff0c;得到权重的方差为&＃xff1a;

此时&＃xff0c;均匀分布为&＃xff1a;

我们来看下实验部分&＃xff0c;只需修改类里面的初始化函数&＃xff1a;

class MLP(nn.Module):...def initialize(self):a &＃61; np.sqrt(3/self.neurals)for m in self.modules():if isinstance(m, nn.Linear):nn.init.uniform_(m.weight.data, -a, a)

输出结果&＃xff1a;

layer:0, std:0.9798752665519714 layer:1, std:0.9927620887756348 layer:2, std:0.9769216179847717 layer:3, std:0.9821343421936035 ... layer:97, std:0.9224138855934143 layer:98, std:0.9622119069099426 layer:99, std:0.9693211317062378

这便达到了我们的目的&＃xff0c;即输入和输出的方差保持一致。

但在实际过程中&＃xff0c;我们还会使用激活函数&＃xff0c;所以我们在 forward 中加入 sigmoid 函数&＃xff1a;

class MLP(nn.Module):...def forward(self, x):for (i, linear) in enumerate(self.linears):x &＃61; linear(x)x &＃61; torch.sigmoid(x)print("layer:{}, std:{}".format(i, x.std()))if torch.isnan(x.std()):breakreturn x...

在看下输出结果&＃xff1a;

layer:0, std:0.21153637766838074 layer:1, std:0.13094832003116608 layer:2, std:0.11587061733007431 ... layer:97, std:0.11739246547222137 layer:98, std:0.11711347848176956 layer:99, std:0.11028502136468887

好像还不错&＃xff0c;也没有出现方差爆炸的问题。

不知道大家看到这个结果会不会有些疑问&＃xff1a;为什么方差不是 1 了&＃xff1f;

这是因为 sigmoid 的输出都为正数&＃xff0c;所以会影响到均值的分布&＃xff0c;所以会导致下一层的输入不满足均值为 0 的条件。我们将均值和方差一并打出&＃xff1a;

layer:0, mean:0.5062727928161621 layer:0, std:0.20512282848358154 layer:1, mean:0.47972571849823 layer:1, std:0.12843772768974304 ... layer:98, mean:0.5053208470344543 layer:98, std:0.11949671059846878 layer:99, mean:0.49752169847488403 layer:99, std:0.1192963495850563

可以看到&＃xff0c;第一层隐藏层&＃xff08;layer 0&＃xff09;的均值就已经变成了 0.5。

这又会出现什么问题呢&＃xff1f;

答案是出现 “zigzag” 现象&＃xff1a;

上图摘自李飞飞的 cs231n 课程。

在反向传播过程中&＃xff1a;

因为

是经过 sigmoid 输出得到的&＃xff0c;所以恒大于零&＃xff0c;所以每个神经元

的梯度方向都取决于偏导数

&＃xff0c;这也意味着所有梯度方向都是相同的&＃xff0c;梯度的更新方向被固定&＃xff08;以二维坐标系为例&＃xff0c;只能是第一和第三象限的方向&＃xff09;&＃xff0c;会降低优化效率。

为此&＃xff0c;我们可以使用&＃xff0c;改变 sigmoid 的尺度与范围&＃xff0c;改用 tanh&＃xff1a;

tanh 的收敛速度要比 sigmoid 快&＃xff0c;这是因为 tanh 的均值更加接近 0&＃xff0c;SGD 会更加接近 natural gradient&＃xff0c;从而降低所需的迭代次数。

我们使用 tanh 做一下实验&＃xff0c;看下输出结果&＃xff1a;

layer:0, mean:-0.011172479018568993 layer:0, std:0.6305743455886841 layer:1, mean:0.0025750682689249516 layer:1, std:0.4874609708786011 ... layer:98, mean:0.0003803471918217838 layer:98, std:0.06665021181106567 layer:99, mean:0.0013235544320195913 layer:99, std:0.06700969487428665

可以看到&＃xff0c;在前向传播过程中&＃xff0c;均值没有出问题&＃xff0c;但是方差一直在减小。

这是因为&＃xff0c;输出的数据经过 tanh 后标准差发生了变换&＃xff0c;所以在实际初始化过程中我们还需要考虑激活函数的计算增益&＃xff1a;

class MLP(nn.Module):...def initialize(self):for m in self.modules():if isinstance(m, nn.Linear):tanh_gain &＃61; nn.init.calculate_gain(&＃39;tanh&＃39;)a &＃61; np.sqrt(3/self.neurals)a *&＃61; tanh_gainnn.init.uniform_(m.weight.data, -a, a)

输出为&＃xff1a;

layer:0, std:0.7603299617767334 layer:1, std:0.6884239315986633 layer:2, std:0.6604527831077576 ... layer:97, std:0.6512776613235474 layer:98, std:0.643700897693634 layer:99, std:0.6490980386734009

此时&＃xff0c;方差就被修正过来了。

当然&＃xff0c;在实际过程中我们也不需要自己写&＃xff0c;可以直接调用现成的函数&＃xff1a;

class MLP(nn.Module):...def initialize(self):a &＃61; np.sqrt(3/self.neurals)for m in self.modules():if isinstance(m, nn.Linear):tanh_gain &＃61; nn.init.calculate_gain(&＃39;tanh&＃39;)nn.init.xavier_uniform_(m.weight.data, gain&＃61;tanh_gain)

输出为&＃xff1a;

layer:0, std:0.7628788948059082 layer:1, std:0.6932843923568726 layer:2, std:0.6658385396003723 ... layer:97, std:0.6544962525367737 layer:98, std:0.6497417092323303 layer:99, std:0.653872549533844

可以看到其输出是差不多的。

在这里&＃xff0c;不知道同学们会不会有一个疑问&＃xff0c;为什么 sigmoid 不会出现 tanh 的情况呢&＃xff1f;

这是因为 sigmoid 的信息增益为 1&＃xff0c;而 tanh 的信息增益为 5/3&＃xff0c;理论证明这里就略过了。

tanh 和 sigmoid 有两大缺点&＃xff1a;

需要进行指数运算&＃xff1b;
有软饱和区域&＃xff0c;导致梯度更新速度很慢。

所以我们经常会用到 ReLU&＃xff0c;所以我们试一下效果&＃xff1a;

class MLP(nn.Module):def __init__(self, neurals, layers):super(MLP, self).__init__()self.linears &＃61; nn.ModuleList([nn.Linear(neurals, neurals, bias&＃61;False) for i in range(layers)])self.neurals &＃61; neuralsdef forward(self, x):for (i, linear) in enumerate(self.linears):x &＃61; linear(x)x &＃61; torch.relu(x)print("layer:{}, std:{}".format(i, x.std()))return xdef initialize(self):for m in self.modules():if isinstance(m, nn.Linear):tanh_gain &＃61; nn.init.calculate_gain(&＃39;relu&＃39;)a &＃61; np.sqrt(3/self.neurals)a *&＃61; tanh_gainnn.init.uniform_(m.weight.data, -a, a)

输出为&＃xff1a;

layer:0, std:1.4423831701278687 layer:1, std:2.3559958934783936 layer:2, std:4.320342540740967 ... layer:97, std:1.3732810130782195e&＃43;23 layer:98, std:2.3027095847369547e&＃43;23 layer:99, std:4.05964954791109e&＃43;23

为什么 Xavier 突然失灵了呢&＃xff1f;

这是因为 Xavier 只能针对类似 sigmoid 和 tanh 之类的饱和激活函数&＃xff0c;而无法应用于 ReLU 之类的非饱和激活函数。

针对这一问题&＃xff0c;何凯明于 2015 年发表了一篇论文《Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification》&＃xff0c;给出了解决方案。

在介绍 kaiming 初始化之前&＃xff0c;这里补充下饱和激活函数的概念。

x 趋于正无穷时&＃xff0c;激活函数的导数趋于 0&＃xff0c;则我们称之为右饱和&＃xff1b;
x 趋于负无穷时&＃xff0c;激活函数的导数趋于 0&＃xff0c;则我们称之为左饱和&＃xff1b;
当一个函数既满足右饱和又满足左饱和时&＃xff0c;我们称之为饱和激活函数&＃xff0c;代表有 sigmoid&＃xff0c;tanh&＃xff1b;
存在常数 c&＃xff0c;当 x>c 时&＃xff0c;激活函数的导数恒为 0&＃xff0c;我们称之为右硬饱和&＃xff0c;同理左硬饱和。两者同时满足时&＃xff0c;我们称之为硬饱和激活函数&＃xff0c;ReLU 则为左硬饱和激活函数&＃xff1b;
存在常数 c&＃xff0c;当 x>c 时&＃xff0c;激活函数的导数趋于 0&＃xff0c;我们称之为右软饱和&＃xff0c;同理左软饱和。两者同时满足时&＃xff0c;我们称之为软饱和激活函数&＃xff0c;sigmoid&＃xff0c;tanh 则为软饱和激活函数&＃xff1b;

3.Kaiming Initialization

同样遵循方差一致性原则。

激活函数为

&＃xff0c;所以输入值的均值就不为 0 了&＃xff0c;所以&＃xff1a;

其中&＃xff1a;

我们将其带入&＃xff0c;可以得到&＃xff1a;

所以参数服从

。&＃xff08;这里注意&＃xff0c;凯明初始化的时候&＃xff0c;默认是使用输入的神经元个数&＃xff09;

我们试一下结果&＃xff1a;

class MLP(nn.Module):... def initialize(self):a &＃61; np.sqrt(3/self.neurals)for m in self.modules():if isinstance(m, nn.Linear):a &＃61; np.sqrt(6 / self.neurals)nn.init.uniform_(m.weight.data, -a, a)

输出为&＃xff1a;

layer:0, std:0.8505409955978394 layer:1, std:0.8492708802223206 layer:2, std:0.8718656301498413 ... layer:97, std:0.8371583223342896 layer:98, std:0.7432138919830322 layer:99, std:0.6938706636428833

可以看到&＃xff0c;结果要好很多。

再试一下凯明均匀分布&＃xff1a;

class MLP(nn.Module):... def initialize(self):a &＃61; np.sqrt(3/self.neurals)for m in self.modules():if isinstance(m, nn.Linear):nn.init.kaiming_uniform_(m.weight.data)

输出为&＃xff1a;

layer:0, std:0.8123029470443726 layer:1, std:0.802753210067749 layer:2, std:0.758887529373169 ... layer:97, std:0.2888352870941162 layer:98, std:0.26769548654556274 layer:99, std:0.2554236054420471

那如果激活函数是 ReLU 的变种怎么办呢&＃xff1f;

这里直接给结论&＃xff1a;

我们上述介绍的都是以均匀分布为例&＃xff0c;而正态分布也是一样的。均值 0&＃xff0c;方差也计算出来了&＃xff0c;所服从的分布自然可知。

4.Source Code

这一节我们来看下源码解析&＃xff0c;以 Pytorch 为例子。

def xavier_uniform_(tensor, gain&＃61;1.):""" xavier 均匀分布"""fan_in, fan_out &＃61; _calculate_fan_in_and_fan_out(tensor)std &＃61; gain * math.sqrt(2.0 / float(fan_in &＃43; fan_out))a &＃61; math.sqrt(3.0) * std return _no_grad_uniform_(tensor, -a, a)def xavier_normal_(tensor, gain&＃61;1.):""" xavier 正态分布"""fan_in, fan_out &＃61; _calculate_fan_in_and_fan_out(tensor)std &＃61; gain * math.sqrt(2.0 / float(fan_in &＃43; fan_out))return _no_grad_normal_(tensor, 0., std)def kaiming_uniform_(tensor, a&＃61;0, mode&＃61;&＃39;fan_in&＃39;, nonlinearity&＃61;&＃39;leaky_relu&＃39;):""" kaiming 均匀分布"""fan &＃61; _calculate_correct_fan(tensor, mode)gain &＃61; calculate_gain(nonlinearity, a)std &＃61; gain / math.sqrt(fan)bound &＃61; math.sqrt(3.0) * stdwith torch.no_grad():return tensor.uniform_(-bound, bound)def kaiming_normal_(tensor, a&＃61;0, mode&＃61;&＃39;fan_in&＃39;, nonlinearity&＃61;&＃39;leaky_relu&＃39;):""" kaiming 正态分布"""fan &＃61; _calculate_correct_fan(tensor, mode)gain &＃61; calculate_gain(nonlinearity, a)std &＃61; gain / math.sqrt(fan)with torch.no_grad():return tensor.normal_(0, std)

可以看到&＃xff0c;xavier 初始化会调用 _calculate_fan_in_and_fan_out 函数&＃xff0c;而 kaiming 初始化会调用 _calculate_correct_fan 函数&＃xff0c;具体看下这两个函数。

def _calculate_fan_in_and_fan_out(tensor):""" 计算输入输出的大小"""dimensions &＃61; tensor.dim()if dimensions <2:raise ValueError("Fan in and fan out can not be computed for tensor with fewer than 2 dimensions")num_input_fmaps &＃61; tensor.size(1)num_output_fmaps &＃61; tensor.size(0)receptive_field_size &＃61; 1if tensor.dim() > 2:receptive_field_size &＃61; tensor[0][0].numel()fan_in &＃61; num_input_fmaps * receptive_field_sizefan_out &＃61; num_output_fmaps * receptive_field_sizereturn fan_in, fan_outdef _calculate_correct_fan(tensor, mode):""" 根据 mode 计算输入或输出的大小"""mode &＃61; mode.lower()valid_modes &＃61; [&＃39;fan_in&＃39;, &＃39;fan_out&＃39;]if mode not in valid_modes:raise ValueError("Mode {} not supported, please use one of {}".format(mode, valid_modes))fan_in, fan_out &＃61; _calculate_fan_in_and_fan_out(tensor)return fan_in if mode &＃61;&＃61; &＃39;fan_in&＃39; else fan_out

xavier 初始化是外部传入信息增益&＃xff0c;而 kaiming 初始化是在内部包装了信息增益&＃xff0c;我们来看下信息增益的函数&＃xff1a;

def calculate_gain(nonlinearity, param&＃61;None):linear_fns &＃61; [&＃39;linear&＃39;, &＃39;conv1d&＃39;, &＃39;conv2d&＃39;, &＃39;conv3d&＃39;, &＃39;conv_transpose1d&＃39;, &＃39;conv_transpose2d&＃39;, &＃39;conv_transpose3d&＃39;]if nonlinearity in linear_fns or nonlinearity &＃61;&＃61; &＃39;sigmoid&＃39;:return 1elif nonlinearity &＃61;&＃61; &＃39;tanh&＃39;:return 5.0 / 3elif nonlinearity &＃61;&＃61; &＃39;relu&＃39;:return math.sqrt(2.0)elif nonlinearity &＃61;&＃61; &＃39;leaky_relu&＃39;:if param is None:negative_slope &＃61; 0.01elif not isinstance(param, bool) and isinstance(param, int) or isinstance(param, float):# True/False are instances of int, hence check abovenegative_slope &＃61; paramelse:raise ValueError("negative_slope {} not a valid number".format(param))return math.sqrt(2.0 / (1 &＃43; negative_slope ** 2))else:raise ValueError("Unsupported nonlinearity {}".format(nonlinearity))

把各个激活函数所对应的信息增益表画下来&＃xff1a;

5.Conclusion

尽管初始化很简单&＃xff0c;但从数理角度出发去分析神经网络并不轻松&＃xff0c;且需要加上假设才能进行分析。但不管怎么说初始化对于训练神经网络至关重要&＃xff0c;那些非常深的网络如 GoogleNet、ResNet 都 stack 了这写方法&＃xff0c;并且非常 work。

6.Reference

《Understanding the difficulty of training deep feedforward neural networks》
《Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification》

推荐阅读

main
PyTorch常见预训练模型的下载链接及使用指南

本文提供了PyTorch框架中常用的预训练模型的下载链接及详细使用指南，涵盖ResNet、Inception、DenseNet、AlexNet、VGGNet等六大分类模型。每种模型的预训练参数均经过精心调优，适用于多种计算机视觉任务。文章不仅介绍了模型的下载方式，还详细说明了如何在实际项目中高效地加载和使用这些模型，为开发者提供全面的技术支持。 ... [详细]

蜡笔小新 2024-10-27 13:57:42
text
Python 伦理黑客技术：深入探讨后门攻击（第三部分）

在《Python 伦理黑客技术：深入探讨后门攻击（第三部分）》中，作者详细分析了后门攻击中的Socket问题。由于TCP协议基于流，难以确定消息批次的结束点，这给后门攻击的实现带来了挑战。为了解决这一问题，文章提出了一系列有效的技术方案，包括使用特定的分隔符和长度前缀，以确保数据包的准确传输和解析。这些方法不仅提高了攻击的隐蔽性和可靠性，还为安全研究人员提供了宝贵的参考。 ... [详细]

蜡笔小新 2024-11-09 16:33:02
install
Ubuntu 22.04 安装搜狗输入法详细指南及常见问题解决方案

本文将详细介绍如何在 Ubuntu 22.04 上安装搜狗输入法，并提供常见问题的解决方法。包括下载安装包、更新源、安装依赖项等步骤。 ... [详细]

蜡笔小新 2024-11-15 10:11:27
include
普通树(每个节点可以有任意数量的子节点)级序遍历

普通树(每个节点可以有任意数量的子节点)级序遍历 ... [详细]

蜡笔小新 2024-11-14 18:53:26
char
MySQL初级篇——字符串、日期时间、流程控制函数的相关应用

文章目录：1.字符串函数2.日期时间函数2.1获取日期时间2.2日期与时间戳的转换2.3获取年月日、时分秒、星期数、天数等函数2.4时间和秒钟的转换2. ... [详细]

蜡笔小新 2024-11-14 10:57:02
text
Spring Data JdbcTemplate 入门指南

本文将介绍如何使用 Spring JdbcTemplate 进行数据库操作，包括查询和插入数据。我们将通过一个学生表的示例来演示具体步骤。 ... [详细]

蜡笔小新 2024-11-14 10:33:29
text
c/c++常用代码doc,ppt,xls文件格式转PDF格式[转]

[转]doc,ppt,xls文件格式转PDF格式http:blog.csdn.netlee353086articledetails7920355确实好用。需要注意的是#import ... [详细]

蜡笔小新 2024-11-12 16:19:40
main
大类|电阻器_使用Requests、Etree、BeautifulSoup、Pandas和Path库进行数据抓取与处理 | 将指定区域内容保存为HTML和Excel格式

大类|电阻器_使用Requests、Etree、BeautifulSoup、Pandas和Path库进行数据抓取与处理 | 将指定区域内容保存为HTML和Excel格式 ... [详细]

蜡笔小新 2024-11-11 19:05:59
instance
Flowable 流程图路径与节点展示：已执行节点高亮红色标记，增强可视化效果

在Flowable流程图中，通常仅显示当前节点，而路径则需自行获取。特别是在多次驳回的情况下，节点可能会出现混乱。本文重点探讨了如何准确地展示流程图效果，包括已结束的流程和正在执行的流程。具体实现方法包括生成带有高亮红色标记的图片，以增强可视化效果，确保用户能够清晰地了解每个节点的状态。 ... [详细]

蜡笔小新 2024-11-11 10:46:10
main
利用OpenCV和线性SVM实现人脸识别

本文介绍如何使用OpenCV和线性支持向量机（SVM）模型来开发一个简单的人脸识别系统，特别关注在只有一个用户数据集时的处理方法。 ... [详细]

蜡笔小新 2024-11-13 14:50:37
main
（7）Python爬虫——爬取豆瓣电影Top250

利用python爬取豆瓣电影Top250的相关信息，包括电影详情链接,图片链接,影片中文名,影片外国名,评分,评价数,概况,导演,主演,年份,地区,类别这12项内容，然后将爬取的信息写入Exce ... [详细]

蜡笔小新 2024-11-13 11:35:24
数组
在范围[0..n-1]中产生m个不同的随机数 - Generating m distinct random numbers in the range [0..n-1]

Ihavetwomethodsofgeneratingmdistinctrandomnumbersintherange[0..n-1]我有两种方法在范围[0.n-1]中生 ... [详细]

蜡笔小新 2024-11-13 09:49:14
int
macOS 上 Visual Studio Code 的安装与配置指南

Visual Studio Code (VSCode) 是一款功能强大的源代码编辑器，支持多种编程语言，具备丰富的扩展生态。本文将详细介绍如何在 macOS 上安装、配置并使用 VSCode。 ... [详细]

蜡笔小新 2024-11-12 19:45:55
int
Reddit 上一个引发热议的编程挑战

一篇关于五个编程问题的 Reddit 帖子引发了广泛讨论，特别是关于这些题目是否适合所有软件工程师。 ... [详细]

蜡笔小新 2024-11-12 17:41:10
include
poj 3352 Road Construction

poj 3352 Road Construction ... [详细]

蜡笔小新 2024-11-12 11:24:39

aaa

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章