草庐IT

Pytorch教程入门系列11----模型评估

CV_Today 2023-04-28 原文

文章目录


前言


一、模型评估概要

在模型训练完成后,需要使用模型来预测新数据,并评估模型的性能。在这种情况下,需要使用模型评估来检查模型的性能。

模型评估包括使用模型对新数据进行预测,并使用与训练过程相同的指标来检查模型的性能。例如,如果在训练过程中使用了精度作为指标,则在评估模型时也可以使用精度来检查模型的预测准确率。

二、评估方法

在 PyTorch 中,有许多内置的指标可以用于评估模型性能,这些指标可以帮助我们了解模型的表现。

1.准确率(Accuracy)

准确率(Accuracy)是一种评估模型性能的指标,它表示模型的预测结果与真实结果的匹配程度。通常,准确率越高,模型的性能就越好。

使用 torch.nn.functional.accuracy() 函数来计算模型的准确率。

# 使用模型对数据进行预测
outputs = model(inputs)

# 计算准确率
accuracy = torch.nn.functional.accuracy(outputs, labels)

#打印准确率,准确率的值可以通过调用 accuracy.item() 来获取。
print(accuracy.item())

2.ROC(Receiver Operating Characteristic)

ROC(Receiver Operating Characteristic)曲线是一种用来衡量二分类器性能的曲线。ROC曲线绘制的是分类器的真正率(true positive rate)和假正率(false positive rate)。真正率是分类器将正样本正确分类的概率,假正率是将负样本错误分类成正样本的概率。

可以使用torch.nn.functional.roc_auc_score函数来计算ROC曲线下的面积(AUC)。这个函数接收两个参数:

y_true:一个包含真实标签的Tensor。标签取值可以是0或1。
y_score:一个包含分类器预测得分的Tensor。这个得分可以是分类器对样本的预测概率,也可以是分类器对样本的预测类别。

如果要绘制ROC曲线,可以使用scikit-learn中的roc_curve函数。它需要接收三个参数:

y_true:一个包含真实标签的数组。标签取值可以是0或1。
y_score:一个包含分类器预测得分的数组。这个得分可以是分类器对样本的预测概率,也可以是分类器对样本的预测类别。
pos_label:正样本的标签值。

roc_curve函数会返回三个值:

fpr:一个数组,包含每个ROC曲线绘制的真正率(true positive rate)和假正率(false positive rate)。绘制ROC曲线时,我们需要将真正率作为横坐标,假正率作为纵坐标,并将它们作为一个散点图绘制出来。

tpr:一个数组,包含真正率的值。
thresholds:一个数组,包含每个阈值对应的真正率和假正率。

绘制完ROC曲线之后,我们还可以通过计算曲线下的面积(AUC)来评估分类器的性能。AUC越大,分类器的性能就越好。通常,AUC的取值范围是0~1。当AUC=1时,说明分类器性能最优;当AUC=0.5时,说明分类器的性能比随机猜测差不多。

# 定义真实标签
y_true = torch.Tensor([0, 0, 1, 1])

# 定义预测得分
y_score = torch.Tensor([0.1, 0.4, 0.35, 0.8])

# 计算AUC值
auc = torch.nn.functional.roc_auc_score(y_true, y_score)

# 绘制ROC曲线
fpr, tpr, thresholds = sklearn.metrics.roc_curve(y_true, y_score, pos_label=1)
plt.plot(fpr, tpr)
plt.show()

3.混淆矩阵(confusion_matrix)

混淆矩阵是一种用来评估分类器性能的矩阵。它统计了分类器的真正率和假正率,并将它们作为矩阵的四个值:真正类(true positive)、真负类(true negative)、假正类(false positive)和假负类(false negative)。
在pytorch中,可以使用torch.nn.functional.confusion_matrix函数来计算混淆矩阵。这个函数接收两个参数:

y_true:一个包含真实标签的Tensor。标签取值可以是0或1。
y_pred:一个包含预测标签的Tensor。标签取值可以是0或1。

confusion_matrix函数会返回一个二维的Tensor,包含4个值。

# 定义真实标签
y_true = torch.Tensor([0, 0, 1, 1])

# 定义预测标签
y_pred = torch.Tensor([0, 1, 0, 1])

#计算混淆矩阵
confusion_matrix = torch.nn.functional.confusion_matrix(y_true, y_pred)

#打印结果
print(confusion_matrix)

输出结果为:

#这个矩阵的值依次是:真正类(1)、假负类(1)、假正类(1)和真负类(1)。
tensor([[1, 1],
        [1, 1]])

4.精度(Precision)

精度(Precision)是一种评估模型性能的指标,它表示模型预测为正的样本中,真实为正的样本的比例。通常,精度越高,模型的性能就越好。

可以使用sklearn.metrics.precision_score() 函数来计算模型的精度。

5.召回率(Recall)

召回率(Recall)是一种评估模型性能的指标,它表示真实为正的样本中,被模型预测为正的样本的比例。通常,召回率越高,模型的性能就越好。

可以使用 sklearn.metrics.recall_score() 函数来计算模型的召回率。

6.F1值(F1 Score)

F1 值(F1 Score)是一种评估模型性能的指标,它表示模型的精度和召回率的调和平均值。通常,F1 值越高,模型的性能就越好。

可以使用sklearn.metrics.f1_score()函数来计算模型的精度。

三、举例

使用以下代码来评估 PyTorch 模型:

# 禁用自动求导
with torch.no_grad():
    # 将模型设置为评估模式
    model.eval()

    # 使用模型对数据进行预测
    outputs = model(inputs)

    # 计算损失
    loss = criterion(outputs, labels)

    # 计算准确率
    accuracy = torch.nn.functional.accuracy(outputs, labels)

    # 计算精度、召回率和 F1 值
    precision = sklearn.metrics.precision_score(labels, outputs)
    recall = sklearn.metrics.recall_score(labels, outputs)
	f1 = sklearn.metrics.f1_score(labels, outputs)
    # 输出指标值
    print("Loss:", loss.item())
    print("Accuracy:", accuracy.item())
    print("Precision:", precision)
    print("Recall:", recall)
   	print("F1:", f1)

我们首先禁用了自动求导,然后将模型设置为评估模式。然后,我们使用模型对数据进行预测,并使用 torch.nn.CrossEntropyLoss 类计算损失。接着,我们计算了模型的准确率、精度和召回率,并输出这些指标的值。


总结

PyTorch提供了一系列用来评估模型性能的函数。这些函数可以帮助我们了解模型在训练和测试数据上的表现情况,从而决定模型是否需要进一步改进。常用的评估指标包括准确率、混淆矩阵和ROC曲线。在PyTorch中,可以使用accuracy_score、confusion_matrix和roc_auc_score等函数来计算这些指标。此外,PyTorch还提供了一些其他的评估函数,如F1-score、precision和recall等,可以根据实际需要选择使用。

有关Pytorch教程入门系列11----模型评估的更多相关文章

  1. python - 如何使用 Ruby 或 Python 创建一系列高音调和低音调的蜂鸣声? - 2

    关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题?更新问题,以便editingthispost可以用事实和引用来回答它.关闭4年前。Improvethisquestion我想在固定时间创建一系列低音和高音调的哔哔声。例如:在150毫秒时发出高音调的蜂鸣声在151毫秒时发出低音调的蜂鸣声200毫秒时发出低音调的蜂鸣声250毫秒的高音调蜂鸣声有没有办法在Ruby或Python中做到这一点?我真的不在乎输出编码是什么(.wav、.mp3、.ogg等等),但我确实想创建一个输出文件。

  2. ruby-on-rails - Rails - 子类化模型的设计模式是什么? - 2

    我有一个模型:classItem项目有一个属性“商店”基于存储的值,我希望Item对象对特定方法具有不同的行为。Rails中是否有针对此的通用设计模式?如果方法中没有大的if-else语句,这是如何干净利落地完成的? 最佳答案 通常通过Single-TableInheritance. 关于ruby-on-rails-Rails-子类化模型的设计模式是什么?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.co

  3. ruby-on-rails - Rails - 一个 View 中的多个模型 - 2

    我需要从一个View访问多个模型。以前,我的links_controller仅用于提供以不同方式排序的链接资源。现在我想包括一个部分(我假设)显示按分数排序的顶级用户(@users=User.all.sort_by(&:score))我知道我可以将此代码插入每个链接操作并从View访问它,但这似乎不是“ruby方式”,我将需要在不久的将来访问更多模型。这可能会变得很脏,是否有针对这种情况的任何技术?注意事项:我认为我的应用程序正朝着单一格式和动态页面内容的方向发展,本质上是一个典型的网络应用程序。我知道before_filter但考虑到我希望应用程序进入的方向,这似乎很麻烦。最终从任何

  4. ruby-on-rails - 在混合/模块中覆盖模型的属性访问器 - 2

    我有一个包含模块的模型。我想在模块中覆盖模型的访问器方法。例如:classBlah这显然行不通。有什么想法可以实现吗? 最佳答案 您的代码看起来是正确的。我们正在毫无困难地使用这个确切的模式。如果我没记错的话,Rails使用#method_missing作为属性setter,因此您的模块将优先,阻止ActiveRecord的setter。如果您正在使用ActiveSupport::Concern(参见thisblogpost),那么您的实例方法需要进入一个特殊的模块:classBlah

  5. ruby-on-rails - 如何验证非模型(甚至非对象)字段 - 2

    我有一个表单,其中有很多字段取自数组(而不是模型或对象)。我如何验证这些字段的存在?solve_problem_pathdo|f|%>... 最佳答案 创建一个简单的类来包装请求参数并使用ActiveModel::Validations。#definedsomewhere,atthesimplest:require'ostruct'classSolvetrue#youcouldevencheckthesolutionwithavalidatorvalidatedoerrors.add(:base,"WRONG!!!")unlesss

  6. ruby-on-rails - form_for 中不在模型中的自定义字段 - 2

    我想向我的Controller传递一个参数,它是一个简单的复选框,但我不知道如何在模型的form_for中引入它,这是我的观点:{:id=>'go_finance'}do|f|%>Transferirde:para:Entrada:"input",:placeholder=>"Quantofoiganho?"%>Saída:"output",:placeholder=>"Quantofoigasto?"%>Nota:我想做一个额外的复选框,但我该怎么做,模型中没有一个对象,而是一个要检查的对象,以便在Controller中创建一个ifelse,如果没有检查,请帮助我,非常感谢,谢谢

  7. ruby-on-rails - 使用一系列等级计算字母等级 - 2

    这里是Ruby新手。完成一些练习后碰壁了。练习:计算一系列成绩的字母等级创建一个方法get_grade来接受测试分数数组。数组中的每个分数应介于0和100之间,其中100是最大分数。计算平均分并将字母等级作为字符串返回,即“A”、“B”、“C”、“D”、“E”或“F”。我一直返回错误:avg.rb:1:syntaxerror,unexpectedtLBRACK,expecting')'defget_grade([100,90,80])^avg.rb:1:syntaxerror,unexpected')',expecting$end这是我目前所拥有的。我想坚持使用下面的方法或.join,

  8. ruby-on-rails - 如何将验证与模型分开 - 2

    我有一些非常大的模型,我必须将它们迁移到最新版本的Rails。这些模型有相当多的验证(User有大约50个验证)。是否可以将所有这些验证移动到另一个文件中?说app/models/validations/user_validations.rb。如果可以,有人可以提供示例吗? 最佳答案 您可以为此使用关注点:#app/models/validations/user_validations.rbrequire'active_support/concern'moduleUserValidationsextendActiveSupport:

  9. ruby-on-rails - Rails 模型——非持久类成员或属性? - 2

    对于Rails模型,是否可以/建议让一个类的成员不持久保存到数据库中?我想将用户最后选择的类型存储在session变量中。由于我无法从我的模型中设置session变量,我想将值存储在一个“虚拟”类成员中,该成员只是将值传递回Controller。你能有这样的类(class)成员吗? 最佳答案 将非持久属性添加到Rails模型就像任何其他Ruby类一样:classUser扩展解释:在Ruby中,所有实例变量都是私有(private)的,不需要在赋值前定义。attr_accessor创建一个setter和getter方法:classUs

  10. ruby-on-rails - Rails - 从另一个模型中创建一个模型的实例 - 2

    我有一个正在构建的应用程序,我需要一个模型来创建另一个模型的实例。我希望每辆车都有4个轮胎。汽车模型classCar轮胎模型classTire但是,在make_tires内部有一个错误,如果我为Tire尝试它,则没有用于创建或新建的activerecord方法。当我检查轮胎时,它没有这些方法。我该如何补救?错误是这样的:未定义的方法'create'forActiveRecord::AttributeMethods::Serialization::Tire::Module我测试了两个环境:测试和开发,它们都因相同的错误而失败。 最佳答案

随机推荐