使用 Theano
,首先要定义符号变量,然后是利用这写符号变量进行计算,这些符号被称为 variables
,而操作 +, -, **, sum(), tanh()
被称为 ops
,一个 op
操作接受某些类型的输入,并返回某些类型的输出。
Theano
利用这些来构建一个图结构,一个图结构包括:
variable
节点op
节点apply
节点其中,apply
节点用来表示一个特定的 op
作用在一些特定的 variables
上,例如:
import theano
import theano.tensor as T
x = T.dmatrix('x')
y = T.dmatrix('y')
z = x + y
要显示这个图结构可以用 pydotprint
,先安装 graphviz。
Windows
下:
在环境变量 path 后加上:
然后要先安装 pydot
包:
如果你的 pyparsing >= 2.0
,则将其降为 1.5.7
,下载并安装 pydot-1.0.28
。
安装完之后,找到 pydot.py
将其中:
graph.append( '%s %s {\n' % (self.obj_dict['type'], self.obj_dict['name']) )
修改为:
graph.append( '%s %s {\n' % (self.obj_dict['type'], quote_if_necessary(self.obj_dict['name'])) )
theano.printing.pydotprint(z, outfile='apply1.png', var_with_name_simple=True)
它的图结构如下:
z
的 owner
是一个 apply
结构,其 op
为:
z.owner.op.name
这个 apply
结构的输入值有两个,输出值有一个:
print z.owner.nin
print z.owner.nout
查看它的输入:
z.owner.inputs
我们可以用 pprint 来显示它:
print theano.printing.pprint(z)
用 debugprint
显示图结构:
theano.printing.debugprint(z)
再看另一个稍微复杂的例子:
y = x * 2
查看 y
的图谱:
theano.printing.debugprint(y)
这里我们看到,y
对应的第二个 input
并不是 2
,而是一个 DimShuffle
的操作:
y.owner.inputs[1].owner.op
它的输入才是常数 2:
y.owner.inputs[1].owner.inputs
theano.printing.pydotprint(y, outfile='apply2.png', var_with_name_simple=True)
其图结构为
a = T.dscalar('a')
b = a + a ** 10
f = theano.function([a], b)
theano.printing.pydotprint(b, outfile='apply_no_opti.png', var_with_name_simple=True)
theano.printing.pydotprint(f, outfile='apply_opti.png', var_with_name_simple=True)
比较一下 function
函数对图结构进行的优化:
未优化前:
优化后: