Keras

python - 如何使用 Keras model.to_json() 获得 pretty-print JSON？

我正在尝试savemodeltoJSONwithKeras并获取压缩的JSON代码。这里是否可以保存为漂亮的人类友好JSON格式？最佳答案 to_jsonmethod从keras接受**kwargs并将它们传递给json.dumps。因此这是单行解决方案:print(model.to_json(indent=4))它生成的结果类似于@anton-vbr的示例。关于python-如何使用Kerasmodel.to_json()获得pretty-printJSON？，我们在StackOv

python - 如何用张量板监控keras中的梯度消失和爆炸？

我想用keras监控tensorboard的梯度变化来判断梯度是消失还是爆炸。我该怎么办？最佳答案要在Tensorboard中可视化训练，请添加keras.callbacks.TensorBoard回调到model.fit函数。不要忘记设置write_grads=True以查看此处的渐变。训练开始后，您可以运行...tensorboard--logdir=/full_path_to_your_logs...从命令行并将浏览器指向http://localhost:6006。请参阅thisquestion中的示例代码.要检查梯度消失

失和何用 code section stackoverflow python tensorflow keras tensorboard tensorflow-gradient

python - Keras:完成训练过程后释放内存

我用Keras搭建了一个基于CNN结构的autoencoder模型，完成训练过程后，我的笔记本电脑有64GB内存，但我注意到至少还有1/3的内存被占用，GPU也是一样内存也一样。我没有找到释放内存的好方法，只能通过关闭AnacondaPrompt命令窗口和jupyternotebook来释放内存。我不确定是否有人有好的建议。谢谢! 最佳答案释放内存要释放RAM内存，只需按照@nuric在评论中的建议执行delVariables。释放GPU内存这比释放RAM内存要棘手一些。有些人会建议您使用以下代码(假设您使用的是keras)fro

训练 python section code strong keras

Python Keras LSTM 学习在高损失上收敛太快

这更像是一个深度学习概念问题，如果这不是合适的平台，我会把它带到别处。我正在尝试使用KerasLSTM序列模型来学习文本序列并将它们映射到数值(回归问题)。问题是，学习总是在高损失(训练和测试)上收敛得太快。我已经尝试了所有可能的超参数，我感觉这是导致模型高偏差的局部最小值问题。我的问题基本上是:如何根据这个问题初始化权重和偏差？使用哪个优化器？我应该将网络扩展到多深(我担心如果我使用非常深的网络，训练时间将难以忍受并且模型方差会增长)我应该添加更多训练数据吗？输入和输出使用minmax归一化。我正在使用带动量的SGD，目前有3个LSTM层(126,256,128)和2个密集层(200

上收 Python strong section li tensorflow deep-learning keras lstm

python - Keras 破坏 Anaconda Prompt

我在我的Anaconda发行版上从tensorflow切换到keras，并且在使用后者时遇到了一些问题。我使用命令通过Anaconda提示符安装它condainstallkeras我认为安装没有正确完成，因为它运行命令python-c"importkeras"1>nul2>&1并关闭提示。之后，如果我要打开命令行，它会自动运行上面的命令并关闭它，所以我无法使用提示。Anaconda5.3.1(Python3.7)和Anaconda5.2.0(Python3.6)都发生了这种情况。非常感谢您。任何帮助将不胜感激。最佳答案结合GAU

Anaconda 破坏 code keras section python

python - Keras:导入错误:没有名为 data_utils 的模块

我正在尝试导入模块keras.utils.data_utils但它不起作用。但是，我可以找到这个模块here.它确实存在。为什么我不能导入它，而我可以导入一些其他模块，如keras.models和keras.layers.core？cliu@cliu-ubuntu:bin$pythonPython2.7.9(default,Apr22015,15:33:21)[GCC4.9.2]onlinux2Type"help","copyright","credits"or"license"formoreinformation.>>>from__future__importprint_functi

data_utils 名为 code keras noreferrer python python-2.7 python-3.x import

python - Keras CNN 图像和内核大小不匹配，即使在图像转换以适应后也是如此

我正在尝试运行类似于Kerasdocumantation"VGG-likeconvnet"中的CNN但对于一组自定义图像和二进制分类而不是10类输出。当我尝试拟合CNN时，我得到了这个冗长的错误，我认为它告诉我我的输入图像大小不适合CNN输入。ValueError:GpuDnnConvimagesandkernelmusthavethesamestacksizeApplynodethatcausedtheerror:GpuDnnConv{algo='small',inplace=True}(GpuContiguous.0,GpuContiguous.0,GpuAllocEmpty.0,

即使 python 39 CNN code rgb theano conv-neural-network keras

python - Keras 只训练特定的输出

我将Kears与tensorflow结合使用，我有一个具有3个输出的模型，我只想训练其中的2个。model=Model(input=input,output=[out1,out2,out3])model.compile(loss=[loss1,loss2,loss3],optimizer=my_optimizer)loss1(y_true,y_pred):returncalculate_loss1(y_true,y_pred)loss2(y_true,y_pred):returncalculate_loss2(y_true,y_pred)loss3(y_true,y_pred):ret

训练 python section out neural-network keras

python - 在 keras 的 LSTM 中使用隐藏状态而不是输出

我想通过Yangetal.使用注意力机制的实现.我找到了使用此注意力机制的自定义层的有效实现here.而不是使用我的LSTM的输出值:my_lstm=LSTM(128,input_shape=(a,b),return_sequences=True)my_lstm=AttentionWithContext()(my_lstm)out=Dense(2,activation='softmax')(my_lstm)我想使用LSTM的隐藏状态:my_lstm=LSTM(128,input_shape=(a,b),return_state=True)my_lstm=AttentionWithCon

python keras code my_lstm return neural-network deep-learning lstm

python - Keras-嵌入层

input_dim、output_dim和input_length是什么意思:Embedding(input_dim,output_dim,input_length)根据我理解的文档:input_dim:int>0.词汇量output_dim:int>=0.密集嵌入的维数。input_length:输入序列的长度因此，当我的输入是像google.com这样的词时，每个字符都由一个整数表示[5,2,2,5,8,3,4,1,2,9]并且可能的最大字长是75。可能的最大字符数为38。input_dim、output_dim和input_length应该怎么决定？

python Keras code output_dim input deep-learning

32 33 343536 37 38