Mnist例子运行流程分析

来自软件实验室
跳转至: 导航搜索
 先贴一次官方源码
"""A very simple MNIST classifier.

See extensive documentation at
http://tensorflow.org/tutorials/mnist/beginners/index.md
"""
from __future__ import absolute_import
from __future__ import division
from __future__ import print_function

# Import data
#from tensorflow.examples.tutorials.mnist import input_data
from tensorflow.examples.tutorials.mnist import input_data
import tensorflow as tf

mnist = input_data.read_data_sets("Mnist_data/", one_hot=True)

sess = tf.InteractiveSession()

# Create the model
x = tf.placeholder(tf.float32, [None, 784])
W = tf.Variable(tf.zeros([784, 10]))
b = tf.Variable(tf.zeros([10]))
y = tf.nn.softmax(tf.matmul(x, W) + b) 

# Define loss and optimizer
y_ = tf.placeholder(tf.float32, [None, 10])
cross_entropy = -tf.reduce_sum(y_ * tf.log(y)) 
train_step = tf.train.GradientDescentOptimizer(0.01).minimize(cross_entropy)

# Train
tf.initialize_all_variables().run() 
for i in range(1000):
  batch_xs, batch_ys = mnist.train.next_batch(100) 
  train_step.run({x: batch_xs, y_: batch_ys})

# Test trained model
correct_prediction = tf.equal(tf.argmax(y, 1), tf.argmax(y_, 1))
accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))
print(accuracy.eval({x: mnist.test.images, y_: mnist.test.labels}))


先定义mnist 读取数据,sess定义Session()回话,
建立模型,x占位符,W权重变量,b偏置变量,y是一个数学公式,实现线性回归(有关相性回归,我现在还说不清,只有个大体了解,先不说),这里的y得出是一个概率值。
然后定义交叉煽,是模型的出来的值和真实值比较的得出的一个误差;再就是训练步长,作用是减小这个误差,例子中就是通过梯度下降法来减小误差,这就是涉及到多次训练,怎么多次训练,就是下面说的
进行1000次反复训练,每次从mnist中批量取出100张图片,然后放入sess跑起来。到这里整个模型就跑完了,每跑一次,W,b都会更新,然后y跟着变,交叉煽也变,步长也每次下降(例子中没次下降0.1),期间可以调整各种参数,直到得出符合语预期的模型为止。
最后来一次test,就是拿新的数据来喂给它,看识别率了,识别率不满意时候,继续回去训练。