这小节深度学习的流程需要记住,代码在下一节会进行优化!使得更简洁!!!
一个隐藏层叫多层感知机,大于等于2个隐藏层就是深度神经网络!
biases 截距
线性变化
**函数,深度学习常用的**函数就是relu!!!
softmax做多分类,理解成2层???
根据y=》交叉熵=》