Tensor是TensorFlow最基础和最核心的数据结构,TensorFlow用Tensor这种数据结构来表示所有的数据,TensorFlow的computation graph(计算图)中的节点之间只用Tensor传递数据。Tensor翻译成中文是“张量”,在数学和物理学中运用较多,那么TensorFlow中的Tensor到底是什么呢?本文将解释这个概念。
Tensor的rank(秩)
Tensor的秩和矩阵的秩不一样,Tensor的秩是指这个数据结构的维数。比如一个标量就是一个秩为0的Tensor,一个向量就是一个秩为1的Tensor,一个矩阵就是一个秩为2的Tensor,一个3维数组就是一个秩为3的Tensor,如下表所示:
Tensor的shape(形状)
描述一个Tensor,光知道维数还不够,还必须知道每一维的大小,TensorFlow用shape来定义它,比如[5]表示有5个元素的向量,[3, 4]表示第一维的大小为3,第二维的大小为4的矩阵,参见下表:
Tensor的数据类型
每个Tensor有一个固定的数据类型。常用的数据类型有:DT_FLOAT,DT_DOUBLE,DT_INT32等,DT即Data Type之意。TensorFlow支持的所有数据类型如下表所示:
如何知道一个Tensor的shape
给定一个复杂的Tensor,我们怎样知道它的shape呢?下面通过一个简单的例子来描述。
假如有这样一个Tensor
t = [[[2,3], [4,5], [6,7]], [[8,9], [10,11], [12,13]], [[14,15], [16,17], [18,19]]]
我们将它表示成为一颗树,来辅助计算它的shape:
我们可以看到,第4层(即最底层)的节点2个为一组,第3层的节点3个为一组,第2层的节点3个为一组,这样该Tensor的shape即为[3, 3, 2]。除去根节点,树的层数即是该Tensor的秩,为3。
结语
上面说了这么多,好像Tensor是一个很高大上的东西,其实不然,它就是一个多维数组而已。比如你在C++里定义一个多维数组:
int a[2][3][4][5][6];
将它看作一个Tensor,则它的秩为5,shape为[2, 3, 4, 5, 6]。
更多文章请关注我的公众号:机器学习交流