我正在尝试运行类似于Kerasdocumantation"VGG-likeconvnet"中的CNN但对于一组自定义图像和二进制分类而不是10类输出。当我尝试拟合CNN时,我得到了这个冗长的错误,我认为它告诉我我的输入图像大小不适合CNN输入。ValueError:GpuDnnConvimagesandkernelmusthavethesamestacksizeApplynodethatcausedtheerror:GpuDnnConv{algo='small',inplace=True}(GpuContiguous.0,GpuContiguous.0,GpuAllocEmpty.0,
我想通过Yangetal.使用注意力机制的实现.我找到了使用此注意力机制的自定义层的有效实现here.而不是使用我的LSTM的输出值:my_lstm=LSTM(128,input_shape=(a,b),return_sequences=True)my_lstm=AttentionWithContext()(my_lstm)out=Dense(2,activation='softmax')(my_lstm)我想使用LSTM的隐藏状态:my_lstm=LSTM(128,input_shape=(a,b),return_state=True)my_lstm=AttentionWithCon
我正在尝试通过使用NN和CNN对我自己和几个friend写的手写数字进行分类。为了训练NN,使用了MNIST数据集。问题是用MNIST数据集训练的NN在我的数据集上没有给出令人满意的测试结果。我在Python和MATLAB上使用了一些具有不同设置的库,如下所列。在Python上我使用了thiscode有设置;3层NN,输入数量=784,隐藏神经元数量=30,输出数量=10代价函数=交叉熵时期数=30批量大小=10学习率=0.5使用MNIST训练集进行训练,测试结果如下:MNIST测试结果=96%在我自己的数据集上的测试结果=80%在MATLAB上我使用了deeplearningtool
我正在使用keras1.0.1我正在尝试在LSTM之上添加一个注意力层。这是我目前所拥有的,但它不起作用。input_=Input(shape=(input_length,input_dim))lstm=GRU(self.HID_DIM,input_dim=input_dim,input_length=input_length,return_sequences=True)(input_)att=TimeDistributed(Dense(1)(lstm))att=Reshape((-1,input_length))(att)att=Activation(activation="soft
我的数据由4个不同的时间序列组成,例如:[35,45,47,39...][47,60,57,55...][42,42,61,69...][62,70,62,65...]事实是,除了时间依赖性(水平依赖性)之外,还存在垂直依赖性(在列中,如果我们看一下这个示例“矩阵”)。输出向量将是这些相同的时间序列,仅移动一步。是否可以为每个时间序列创建LSTM网络(因此,在我的例子中有4个网络,还有4个输出),但也可以垂直连接它们,即创建2DLSTM?如果是这样,如何在Tensorflow中实现这一点?是否也可以使这种网络更深(将额外的LSTM层附加到这4个网络中的每一个)?我希望我的解释足够清楚。
给定X维度(m个样本,n个序列和k个特征),以及y维度(m样本,0/1):假设我想训练一个有状态的LSTM(按照keras的定义,其中“stateful=True”意味着细胞状态不会在每个样本的序列之间重置——如果我错了请纠正我!),状态应该是以每个时期或每个样本为基础进行重置?例子:foreinepoch:forminX.shape[0]:#foreachsampleforninX.shape[1]:#foreachsequence#train_on_batchformodel...#model.reset_states()(1)Ibelievethisis'stateful=Fal
这个问题也作为githubissue存在。我想在Keras中构建一个包含二维卷积和LSTM层的神经网络。网络应该对MNIST进行分类。MNIST中的训练数据是60000张手写数字0到9的灰度图像。每张图像为28x28像素。我已将图像分成四个部分(左/右、上/下)并按四个顺序重新排列它们以获得LSTM的序列。|||1|2||image|->-------->4sequences:|1|2|3|4|,|4|3|2|1|,|1|3|2|4|,|4|2|3|1||||3|4|其中一个小子图像的尺寸为14x14。四个序列沿宽度堆叠在一起(宽度或高度无关紧要)。这将创建一个形状为[60000,4,
我得到了这种格式的一些数据和以下详细信息:person1,day1,feature1,feature2,...,featureN,labelperson1,day2,feature1,feature2,...,featureN,label...person1,dayN,feature1,feature2,...,featureN,labelperson2,day1,feature1,feature2,...,featureN,labelperson2,day2,feature1,feature2,...,featureN,label...person2,dayN,feature1,fe
我有多个输入时间序列,我想正确构建一个LSTM模型。我真的很困惑如何选择参数。我的代码:model.add(keras.layers.LSTM(hidden_nodes,input_shape=(window,num_features),consume_less="mem"))model.add(Dropout(0.2))model.add(keras.layers.Dense(num_features,activation='sigmoid'))optimizer=keras.optimizers.SGD(lr=learning_rate,decay=1e-6,momentum=0.
(我正在测试自己写出简短但有效的问题的能力,所以让我知道我在这里是怎么做的)我正在尝试训练/测试TensorFlow循环神经网络,特别是LSTM,使用以下ndarray格式的时间序列数据进行一些试验:[[[time_step_trial_0,feature,feature,...][time_step_trial_0,feature,feature,...]][[time_step_trial_1,feature,feature,...][time_step_trial_1,feature,feature,...]][[time_step_trial_2,feature,feature