我正在尝试通过班级失衡来训练网络进行语义细分。为此,我尝试实现Infogainloss层,并指定了Infogain_matrix这里,而是为每个对角线元素使用1-频率(类)。训练时网但是,即使使用低base_lr,精度和损失都会立即收敛到0,并且网络将所有内容标记为0类(“未知”)。我现在的问题是,是否应像我链接的帖子中指定Infogain_matrix,如果这样,其他原因可能是网络的这种异常行为(我期望损失0准确性1或损失的准确性0)。编辑:因此,当我使用SoftMaxWithloss层而不是Infogainloss运行网络时,它立即开始将所有内容分类为最具代表性的类(Class1为90%)