建造我们第一个神经网络
- 定义 add_layer()
- 创建神经网络
- 结果可视化
- plot the real data
定义 add_layer()
在 Tensorflow 里定义一个添加层的函数可以很容易的添加神经层,为之后的添加省下不少时间.
神经层里常见的参数通常有weights、biases和激励函数。
首先,我们需要导入tensorflow模块。
import tensorflow as tf
然后定义添加神经层的函数def add_layer(),它有四个参数:输入值、输入的大小、输出的大小和激励函数,我们设定默认的激励函数是None。
def add_layer(inputs, in_size, out_size, activation_function=None):
接下来,我们开始定义weights和biases。
因为在生成初始参数时随机变量(normal distribution)会比全部为0要好很多,
所以我们这里的Weights为一个in_size行, out_size列的随机变量矩阵。
Weights = tf.Variable(tf.random_normal([in_size, out_size]))
在机器学习中,biases的推荐值不为0,所以我们这里是在0向量的基础上又加了0.1。
biases = tf.Variable(tf.zeros([1, out_size]) + 0.1)
下面,我们定义Wx_plus_b, 即神经网络未激活的值。其中,tf.matmul()是矩阵的乘法。
Wx_plus_b = tf.matmul(inputs, Weights) + biases
当activation_function——激励函数为None时,输出就是当前的预测值——Wx_plus_b
不为None时,就把Wx_plus_b传到activation_function()函数中得到输出。
if activation_function is None:outputs = Wx_plus_belse:outputs = activation_function(Wx_plus_b)
最后,返回输出,添加一个神经层的函数——def add_layer()就定义好了。
return outputs
创建神经网络
构建所需的数据。 这里的x_data和y_data并不是严格的一元二次函数的关系,因为我们多加了一个noise,这样看起来会更像真实情况。
import numpy as np
x_data = np.linspace(-1,1,300, dtype=np.float32)[:, np.newaxis]
noise = np.random.normal(0, 0.05, x_data.shape).astype(np.float32)
y_data = np.square(x_data) - 0.5 + noise
0
The defined placeholders (both x and y) are 2-dimensional, so you should reshape the input arrays to rank 2. Try to add this
x_data = x_data.reshape([-1,1])
y_data = y_data.reshape([-1,1])
利用占位符定义我们所需的神经网络的输入。 **tf.placeholder()**就是代表占位符,这里的None代表无论输入有多少都可以,因为输入只有一个特征,所以这里是1。
xs = tf.placeholder(tf.float32, [None, 1])
ys = tf.placeholder(tf.float32, [None, 1])
接下来,我们就可以开始定义神经层了。 通常神经层都包括输入层、隐藏层和输出层。这里的输入层只有一个属性, 所以我们就只有一个输入;隐藏层我们可以自己假设,这里我们假设隐藏层有10个神经元; 输出层和输入层的结构是一样的,所以我们的输出层也是只有一层。 所以,我们构建的是——输入层1个、隐藏层10个、输出层1个的神经网络。
完整代码
import tensorflow as tf
import numpy as nptf.compat.v1.disable_eager_execution()
def add_layer(inputs,in_size,out_size,activation_function=None):Weights = tf.Variable(tf.compat.v1.random_normal([in_size,out_size]))biases = tf.Variable(tf.zeros([1,out_size])+0.1)Wx_plus_b = tf.matmul(inputs,Weights) + biasesif activation_function is None:outputs = Wx_plus_belse:outputs = activation_function(Wx_plus_b)return outputsx_data = np.linspace(-1, 1, 300)[:np.newaxis]
noise = np.random.normal(0, 0.05, x_data.shape)
y_data = np.square(x_data)-0.5 + noise
x_data = x_data.reshape([-1,1])
y_data = y_data.reshape([-1,1])
xs = tf.compat.v1.placeholder(tf.float32, [None, 1])
ys = tf.compat.v1.placeholder(tf.float32, [None, 1])l1 = add_layer(xs, 1, 10, activation_function = tf.nn.relu)
prediction = add_layer(l1, 10, 1, activation_function = None)
loss = tf.reduce_mean(tf.reduce_sum(tf.square(ys - prediction),axis=[1]))
train_step = tf.compat.v1.train.GradientDescentOptimizer(0.1).minimize(loss)init = tf.compat.v1.initialize_all_variables()
sess = tf.compat.v1.Session()
sess.run(init)for i in range(3000):sess.run(train_step, feed_dict={xs: x_data, ys: y_data})if i % 100 == 0:print("loss",i,":",sess.run(loss, feed_dict={xs: x_data, ys: y_data}))
输出结果:
loss 0 : 0.19589649
loss 100 : 0.010356216
loss 200 : 0.0043438473
loss 300 : 0.0032807668
loss 400 : 0.0030925728
loss 500 : 0.0029663213
loss 600 : 0.0028795048
loss 700 : 0.0028170738
loss 800 : 0.0027751224
loss 900 : 0.0027430584
loss 1000 : 0.0027192773
loss 1100 : 0.0026999624
loss 1200 : 0.002700134
loss 1300 : 0.0032784946
loss 1400 : 0.010102514
loss 1500 : 0.0030150362
loss 1600 : 0.002679643
loss 1700 : 0.002650431
loss 1800 : 0.0026410439
loss 1900 : 0.0026374548
loss 2000 : 0.002641836
loss 2100 : 0.0027119485
loss 2200 : 0.0034197744
loss 2300 : 0.0055820374
loss 2400 : 0.0034023232
loss 2500 : 0.0027240016
loss 2600 : 0.002637635
loss 2700 : 0.0026169182
loss 2800 : 0.0026102483
loss 2900 : 0.0026087416Process finished with exit code 0
结果可视化
matplotlib 可视化
构建图形,用散点图描述真实数据之间的关系。 (注意:plt.ion()用于连续显示。)
plot the real data
fig = plt.figure()
ax = fig.add_subplot(1,1,1)
ax.scatter(x_data, y_data)
plt.ion()
plt.show()
散点图的结果为:
接下来,我们来显示预测数据。
每隔50次训练刷新一次图形,用红色、宽度为5的线来显示我们的预测数据和输入之间的关系,并暂停0.1s。
for i in range(1000):sess.run(train_step, feed_dict={xs: x_data, ys: y_data})if i % 50 == 0:try:ax.lines.remove(lines[0])except Exception:passprediction_value = sess.run(prediction, feed_dict={xs: x_data})lines = ax.plot(x_data, prediction_value, 'r-', lw=5)plt.pause(0.1)
最后,机器学习的结果为:
完整代码,tf2.0,已调试
import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plttf.compat.v1.disable_eager_execution()
def add_layer(inputs,in_size,out_size,activation_function=None):Weights = tf.Variable(tf.compat.v1.random_normal([in_size,out_size]))biases = tf.Variable(tf.zeros([1,out_size])+0.1)Wx_plus_b = tf.matmul(inputs,Weights) + biasesif activation_function is None:outputs = Wx_plus_belse:outputs = activation_function(Wx_plus_b)return outputsx_data = np.linspace(-1, 1, 300)[:np.newaxis]
noise = np.random.normal(0, 0.05, x_data.shape)
y_data = np.square(x_data)-0.5 + noise
x_data = x_data.reshape([-1,1])
y_data = y_data.reshape([-1,1])
xs = tf.compat.v1.placeholder(tf.float32, [None, 1])
ys = tf.compat.v1.placeholder(tf.float32, [None, 1])l1 = add_layer(xs, 1, 10, activation_function = tf.nn.relu)
prediction = add_layer(l1, 10, 1, activation_function = None)
loss = tf.reduce_mean(tf.reduce_sum(tf.square(ys - prediction),axis=[1]))
train_step = tf.compat.v1.train.GradientDescentOptimizer(0.1).minimize(loss)init = tf.compat.v1.initialize_all_variables()
sess = tf.compat.v1.Session()
sess.run(init)
fig = plt.figure()
ax = fig.add_subplot(1,1,1)
ax.scatter(x_data,y_data)
plt.ion()for i in range(1000):sess.run(train_step, feed_dict={xs: x_data, ys: y_data})if i % 50 == 0:print("loss",i,":",sess.run(loss, feed_dict={xs: x_data, ys: y_data}))try:ax.lines.remove(lines[0])except Exception:passprediction_value = sess.run(prediction, feed_dict={xs: x_data})lines = ax.plot(x_data, prediction_value, 'r-', lw=5)
plt.pause(0.1)
plt.show()
输出:
loss 0 : 0.24042892
loss 50 : 0.00895267
loss 100 : 0.006815916
loss 150 : 0.0059095607
loss 200 : 0.005349032
loss 250 : 0.004874373
loss 300 : 0.0044414266
loss 350 : 0.0040638433
loss 400 : 0.00377721
loss 450 : 0.0035628453
loss 500 : 0.003364147
loss 550 : 0.0031985692
loss 600 : 0.0030857045
loss 650 : 0.0030024864
loss 700 : 0.002943992
loss 750 : 0.0028949715
loss 800 : 0.002852751
loss 850 : 0.0028125304
loss 900 : 0.002781288
loss 950 : 0.002758322Process finished with exit code 0