Infogainloss_草庐IT

我正在尝试通过班级失衡来训练网络进行语义细分。为此，我尝试实现Infogainloss层，并指定了Infogain_matrix这里，而是为每个对角线元素使用1-频率（类）。训练时网但是，即使使用低base_lr，精度和损失都会立即收敛到0，并且网络将所有内容标记为0类（“未知”）。我现在的问题是，是否应像我链接的帖子中指定Infogain_matrix，如果这样，其他原因可能是网络的这种异常行为（我期望损失0准确性1或损失的准确性0）。编辑：因此，当我使用SoftMaxWithloss层而不是Infogainloss运行网络时，它立即开始将所有内容分类为最具代表性的类（Class1为90％）