Python第三方库之MedPy

Albert Darren 2023-05-05 原文

文章目录

1.MedPy简介

MedPy 是一个图像处理库和针对医学(如高维)图像处理的脚本集合，此处主要讨论利用该库计算常见的医学图像分割任务评价指标，如Dice、Jaccard、Hausdorff Distance、Sensitivity、Specificity、Positive predictive value等。

论文表格的表头一般使用评价指标的英文全称首字母大写简写，如PPV代表阳性预测值，故此处也给出。

Dice相似系数(Dice Similarity Coefficient，DSC)或Dice系数(Dice Coefficient，DC)

也称为索伦森-骰子系数是用于衡量两个样本相似性的统计量。它是由植物学家Thorvald Sørensen和Lee Raymond Dice独立开发的，他们分别于1948年和1945年发表。是最常用的一项评价指标，用于有效衡量分割算法预测标签与真实标注标签的空间重叠程度，其对应值越大表示分割精度越高。该指标最初应用于离散数据，给定两个集合A 和B，则定义为两个集合共有的元素数除以每个集合中元素数之和的两倍
$DSC=\frac{2|A\cap B|}{|A|+|B|}$
其中， $∣ A ∣$ 和 $∣ B ∣$ 是两个集合的基数（即每个集合中的元素数)

当应用于布尔数据时，使用真阳性 (TP)、假阳性(FP) 和假阴性(FN) 的定义，它可以写为
$C=\frac{2 T P}{2 T P+F P+F N}$
Jaccard相似系数(Jaccard Similarity Coefficient，JSC)或Jaccard系数(Jaccard Coefficient，JC)

与 Dice 相似系数指标相似，也是一种衡量两幅图像相似程度的指标，其由实际分割结果与真实标签的交集同二者并集的比值得出，反映了分割方法的准确程度，其值越高，分割结果越准确。设TP表示正确预测为正例的数量，FP表示错误预测为正例的数量，FN表示错误预测为反例的数量，则定义为

$\text { Jaccard}=\frac{T P}{T P+F P+F N}$
豪斯多夫距离(Hausdorff distance，HD)

表示预测分割区域边界与真实肿瘤区域边界之间的最大距离，其值越小代表脑肿瘤边界分割误差越小、质量越好。设 X 和 Y 是度量空间 $(M, d)$ 的两个非空子集，则定义他们的Hausdorff distance $d_H(X,Y)$ 为
$d_H(X, Y)=\max \left\{d_{X Y}, d_{Y X}\right\}=\max \left\{\max _{x \in X} \min_{y \in Y}d(x, y), \max _{y \in Y} \min _{x \in X} d(x, y)\right\}$
计算绿色曲线 X 和蓝色曲线 Y 之间的豪斯多夫距离的分量过程如下图所示。

首先，对点集X中的每一个点 $x$ 计算其到点集Y中的每一个点 $y$ 的距离，保留最短距离 $\inf_{x \in X}d(x,y)$ ，然后找出保留的最短距离中的最大距离 $\sup_{y \in Y}{\inf_{x \in X}d(x,y)}$ 记为 $d_{XY}$ 。然后，对点集Y中的每一个点 $y$ 计算其到点集X中的每一个点 $x$ 的距离，保留最短距离 $\inf_{y \in Y}d(x,y)$ ，然后找出保留的最短距离中的最大距离 $\sup_{x \in X}{\inf_{y \in Y}d(x,y)}$ 记为 $d_{YX}$ 。最后，取 $d_{XY}$ 和 $d_{YX}$ 最大值作为点集X和Y之间的豪斯多夫距离。

95％豪斯多夫距离(95％ Hausdorff distance，HD95)

为了排除一些离群点造成的不合理距离，保持整体数值稳定性，一般选择从小到大排名前 95%的距离作为实际豪斯多夫距离，称之为 95% 豪斯多夫距离。
灵敏度(Sensitivity)

也称真阳性率(True Positive Rate)、命中率(hit rate)和召回率(Recall)，表示预测为正的肿瘤标签占真实肿瘤标签的比例，其值越大，漏检率越低。设P表示数据中真阳样例的数量，TP表示正确预测为正例的数量，FN表示错误预测为反例的数量，则定义为
$\mathrm{Sensitivity}=\mathrm{TPR}=\mathrm{Recall}=\frac{\mathrm{TP}}{\mathrm{P}}=\frac{\mathrm{TP}}{\mathrm{TP}+\mathrm{FN}}=1-\mathrm{FNR}$
特异度(Specificity)

也称真阴性率(True Negative Rate)和选择性(Selectivity)，表示预测为正的背景标签占所有真实背景标签的比例，其值越高则误诊率越低。设N表示数据中真阴样例的数量，TN表示正确预测为负例的数量，FP表示错误预测为正例的数量，则定义为
$\mathrm{Specificity}=\mathrm{Selectivity}=\mathrm{TNR}=\frac{\mathrm{TN}}{\mathrm{N}}=\frac{\mathrm{TN}}{\mathrm{TN}+\mathrm{FP}}=1-\mathrm{FPR}$
阳性预测值(Positive Predictive Value，PPV)

也称精确度(Precision)，指在所有样本的预测结果中，真阳性占所有阳性样本的比例，其值越大越好。设TP表示正确预测为正例的数量，FP表示错误预测为正例的数量，则定义为
$\mathrm{Precision}=\mathrm{PPV}=\frac{\mathrm{TP}}{\mathrm{TP}+\mathrm{FP}}=1-\mathrm{FDR}$

2.MedPy安装

medpy安装较为简单，此处以Ubuntu 18.04.5 LTS系统的root用户为例，其他情况详见参考文献安装即可。

为了启用graph-cut包，我们需要安装下列软件包

sudo apt-get install libboost-python-dev build-essential

然后使用阿里云镜像源高速安装medpy

sudo pip install medpy -i http://mirrors.aliyun.com/pypi/simple/ --trusted-host mirrors.aliyun.com

3.MedPy常用函数

3.1 `medpy.io.load(image)`

加载图像并返回包含图像像素内容以及头部对象的 ndarray

import os
from medpy.io import load,save
# 文件夹路径和文件名
dirname="/dataset/RSNA_ASNR_MICCAI_BraTS2021_TrainingData_16July2021/BraTS2021_00000/"
basename="BraTS2021_00000_seg.nii.gz"
full_path=os.path.join(dirname,basename)
# 加载脑肿瘤标记图像返回图像数据数组和头部信息
image_data, image_header = load(full_path)

print("图像数据类型为{},图像数据形状为{}".format(type(image_data),image_data.shape))

# 获取一个切片数组
slice_0=image_data[:,:,77]
print("切片数组的形状为{},切片数组的数据类型为{}".format(slice_0.shape,slice_0.dtype))

# 转置显示灰度图
plt.imshow(slice_0.T, cmap="gray")

# 将纵坐标设置为对数尺度，等宽区间数量设置为为8个绘制切片数组灰度直方图
plt.hist(image_data.flatten(), bins=8, log=True)

3.2 `medpy.metric.binary.dc(result, reference)`

计算二值图像之间的Dice系数（也称为索伦森指数）

首先编辑第三方库源代码在最后追加一行输出语句，保存退出后重启kernel。该输出语句指示此时调用的numpy定义，若调用dc函数前有输出，则表示调用依赖numpy的函数，否则调用依赖jax.numpy的兼容函数实现加速运算

vim /opt/conda/lib/python3.7/site-packages/medpy/metric/binary.py

然后定义统一的一个数组大小参数，最后使用魔术命令%%timeit评估CPU和GPU计算两种方法的运行效率

# 设置数组形状为10000*10000的元组
tup=(10000,10000)

调用依赖numpy的函数

%%timeit
from medpy.metric.binary import dc
import numpy as np
# 设置伪随机数种子
seed=np.random.seed(6)
# 定义预测结果和真实标记数组
predict=np.random.randint(0,4,size=tup)
ground_truth=np.random.randint(0,4,size=tup)
# 计算Dice相似系数
dice1=dc(predict,ground_truth)
print("Dice相似系数为{}".format(dice1))

调用依赖jax.numpy的兼容函数

%%timeit
from medpy.metric.binary import dc
import jax.numpy as numpy # 重载numpy定义使得dc函数底层可以加速计算
from jax import random
# 设置伪随机数种子
rng1=random.PRNGKey(1)
rng2=random.PRNGKey(2)
# 定义预测结果和真实标记数组
predict=random.randint(key=rng1,shape=tup,minval=0,maxval=4)
ground_truth=random.randint(key=rng2,shape=tup,minval=0,maxval=4)
# 计算Dice相似系数
dice2=dc(predict,ground_truth)
print("Dice相似系数为{}".format(dice2))

3.3 `medpy.metric.binary.jc(result, reference)`

计算两个图像中二值对象间的Jaccard系数，下面通过两种方式计算

直接调用第三方库函数计算jaccard系数

%%timeit
from medpy.metric.binary import jc
import jax.numpy as numpy
from jax import random
# 设置伪随机数种子
rng1=random.PRNGKey(1)
rng2=random.PRNGKey(2)
# 定义预测结果和真实标记数组
predict=random.randint(key=rng1,shape=tup,minval=0,maxval=4)
ground_truth=random.randint(key=rng2,shape=tup,minval=0,maxval=4)
# 直接计算Jaccard相似系数
jaccard=jc(predict,ground_truth)
print("Jaccard相似系数为{}".format(jaccard))

通过Dice系数和Jaccard系数的如下关系推导计算

$Jaccard=\frac{Dice}{2-Dice}\nonumber$

%%timeit
from medpy.metric.binary import dc
import jax.numpy as numpy
from jax import random
# 设置伪随机数种子
rng1=random.PRNGKey(1)
rng2=random.PRNGKey(2)
# 定义预测结果和真实标记数组
predict=random.randint(key=rng1,shape=tup,minval=0,maxval=4)
ground_truth=random.randint(key=rng2,shape=tup,minval=0,maxval=4)
# 通过Dice相似系数推导Jaccard相似系数
dice=dc(predict,ground_truth)
jaccard=dice/(2-dice)
print("通过Dice相似系数推导Jaccard相似系数为{}".format(jaccard))

对比两种计算结果、源代码实现、运行效率可知，两种方式结果一样但通过Dice系数推导Jaccard系数运行效率更高，其原因是将一个统计非零值的 $O (n)$ 时间复杂度的函数替换成了 $O (1)$ 时间复杂度的简单推导。

3.4 `medpy.metric.binary.hd(result,reference,voxelspacing=None,connectivity=1,)`

计算两个图像中二值对象之间的(对称)豪斯多夫距离(HD)。它被定义为对象之间的最大表面距离。

%%timeit
from medpy.metric.binary import hd,hd95
import jax.numpy as numpy
from jax import random
# 设置伪随机数种子
rng1=random.PRNGKey(1)
rng2=random.PRNGKey(2)
# 定义预测结果和真实标记数组
predict=random.randint(key=rng1,shape=(50,50),minval=0,maxval=4)
ground_truth=random.randint(key=rng2,shape=(50,50),minval=0,maxval=4)
# 计算豪斯多夫距离
hausdorff_distance=hd(predict,ground_truth)
print("豪斯多夫距离为{}".format(hausdorff_distance))

3.5 `medpy.metric.binary.hd95(result,reference,voxelspacing=None,connectivity=1,)`

计算两个图像中二值对象之间的（对称）豪斯多夫距离（HD）的第 95 个百分位数。与豪斯多夫距离相比，该指标对于小异常值稍微稳定一些，通常用于生物医学分割挑战。

%%timeit
from medpy.metric.binary import hd,hd95
import jax.numpy as numpy
from jax import random
# 设置伪随机数种子
rng1=random.PRNGKey(1)
rng2=random.PRNGKey(2)
# 定义预测结果和真实标记数组
predict=random.randint(key=rng1,shape=(50,50),minval=0,maxval=4)
ground_truth=random.randint(key=rng2,shape=(50,50),minval=0,maxval=4)
# 计算95%豪斯多夫距离
hausdorff_distance95=hd95(predict,ground_truth)
print("95%豪斯多夫距离为{}".format(hausdorff_distance95))

3.6 `medpy.metric.binary.recall(result, reference)`

返回召回率

%%timeit
from medpy.metric.binary import recall
import jax.numpy as numpy
from jax import random
# 设置伪随机数种子
rng1=random.PRNGKey(1)
rng2=random.PRNGKey(2)
# 定义预测结果和真实标记数组
predict=random.randint(key=rng1,shape=(50,50),minval=0,maxval=4)
ground_truth=random.randint(key=rng2,shape=(50,50),minval=0,maxval=4)
# 计算召回率/灵敏度/真阳性率
sensitivity=recall(predict,ground_truth)
print("召回率/灵敏度/真阳性率为{}".format(sensitivity))

3.7 `medpy.metric.binary.sensitivity(result, reference)`

返回灵敏度，内部实现直接调用recall

%%timeit
from medpy.metric.binary import sensitivity
import jax.numpy as numpy
from jax import random
# 设置伪随机数种子
rng1=random.PRNGKey(1)
rng2=random.PRNGKey(2)
# 定义预测结果和真实标记数组
predict=random.randint(key=rng1,shape=(50,50),minval=0,maxval=4)
ground_truth=random.randint(key=rng2,shape=(50,50),minval=0,maxval=4)
# 计算召回率/灵敏度/真阳性率
recall=sensitivity(predict,ground_truth)
print("召回率/灵敏度/真阳性率为{}".format(recall))

3.8`medpy.metric.binary.true_positive_rate(result, reference)`

返回真阳性率，内部实现直接调用recall

%%timeit
from medpy.metric.binary import true_positive_rate
import jax.numpy as numpy
from jax import random
# 设置伪随机数种子
rng1=random.PRNGKey(1)
rng2=random.PRNGKey(2)
# 定义预测结果和真实标记数组
predict=random.randint(key=rng1,shape=(50,50),minval=0,maxval=4)
ground_truth=random.randint(key=rng2,shape=(50,50),minval=0,maxval=4)
# 计算召回率/灵敏度/真阳性率
sensitivity=true_positive_rate(predict,ground_truth)
print("召回率/灵敏度/真阳性率为{}".format(sensitivity))

3.9`medpy.metric.binary.specificity(result, reference)`

返回特异度

%%timeit
from medpy.metric.binary import specificity
import jax.numpy as numpy
from jax import random
# 设置伪随机数种子
rng1=random.PRNGKey(1)
rng2=random.PRNGKey(2)
# 定义预测结果和真实标记数组
predict=random.randint(key=rng1,shape=(50,50),minval=0,maxval=4)
ground_truth=random.randint(key=rng2,shape=(50,50),minval=0,maxval=4)
# 计算特异度/真阴性率
tnr=specificity(predict,ground_truth)
print("特异度/真阴性率为{}".format(tnr))

3.10`medpy.metric.binary.true_negative_rate(result, reference)`

返回真阴性率

%%timeit
from medpy.metric.binary import true_negative_rate
import jax.numpy as numpy
from jax import random
# 设置伪随机数种子
rng1=random.PRNGKey(1)
rng2=random.PRNGKey(2)
# 定义预测结果和真实标记数组
predict=random.randint(key=rng1,shape=(50,50),minval=0,maxval=4)
ground_truth=random.randint(key=rng2,shape=(50,50),minval=0,maxval=4)
# 计算特异度/真阴性率
specifity=true_negative_rate(predict,ground_truth)
print("特异度/真阴性率为{}".format(specifity))

3.11`medpy.metric.binary.precision(result, reference)`

返回精确度

%%timeit
from medpy.metric.binary import precision
import jax.numpy as numpy
from jax import random
# 设置伪随机数种子
rng1=random.PRNGKey(1)
rng2=random.PRNGKey(2)
# 定义预测结果和真实标记数组
predict=random.randint(key=rng1,shape=(50,50),minval=0,maxval=4)
ground_truth=random.randint(key=rng2,shape=(50,50),minval=0,maxval=4)
# 计算精确度/阳性预测值
Precision=precision(predict,ground_truth)
print("精确度/阳性预测值为{}".format(Precision))

3.12 `medpy.metric.binary.positive_predictive_value(result, reference)`

返回阳性预测值

%%timeit
from medpy.metric.binary import positive_predictive_value
import jax.numpy as numpy
from jax import random
# 设置伪随机数种子
rng1=random.PRNGKey(1)
rng2=random.PRNGKey(2)
# 定义预测结果和真实标记数组
predict=random.randint(key=rng1,shape=(50,50),minval=0,maxval=4)
ground_truth=random.randint(key=rng2,shape=(50,50),minval=0,maxval=4)
# 计算精确度/阳性预测值
ppv=positive_predictive_value(predict,ground_truth)
print("精确度/阳性预测值为{}".format(ppv))

3.13 `medpy.io.save(arr, filename, hdr=False, force=True, use_compression=False)`

使用“hdr”中编码的信息将图像“arr”保存为文件名。目标图像格式由“文件名”后缀确定。如果“force”参数设置为 true，以静默方式覆盖已存在的映像。否则将引发错误。

import os
from medpy.io import load,save
# 文件夹路径和文件名
dirname="/dataset/RSNA_ASNR_MICCAI_BraTS2021_TrainingData_16July2021/BraTS2021_00000/"
basename="BraTS2021_00000_seg.nii.gz"
full_path=os.path.join(dirname,basename)
# 加载脑肿瘤标记图像返回图像数据数组和头部信息
image_data, image_header = load(full_path)
# 将图像数据保存为BraTS2021_00000_seg.nii
save(image_data,"BraTS2021_00000_seg.nii")

4.参考文献

有关Python第三方库之MedPy的更多相关文章

python - 如何使用 Ruby 或 Python 创建一系列高音调和低音调的蜂鸣声？ - 2
关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题？更新问题，以便editingthispost可以用事实和引用来回答它.关闭4年前。Improvethisquestion我想在固定时间创建一系列低音和高音调的哔哔声。例如:在150毫秒时发出高音调的蜂鸣声在151毫秒时发出低音调的蜂鸣声200毫秒时发出低音调的蜂鸣声250毫秒的高音调蜂鸣声有没有办法在Ruby或Python中做到这一点？我真的不在乎输出编码是什么(.wav、.mp3、.ogg等等)，但我确实想创建一个输出文件。
Python 相当于 Perl/Ruby ||= - 2
这个问题在这里已经有了答案:关闭10年前。PossibleDuplicate:Pythonconditionalassignmentoperator对于这样一个简单的问题表示歉意，但是谷歌搜索||=并不是很有帮助；)Python中是否有与Ruby和Perl中的||=语句等效的语句？例如:foo="hey"foo||="what"#assignfooifit'sundefined#fooisstill"hey"bar||="yeah"#baris"yeah"另外，类似这样的东西的通用术语是什么？条件分配是我的第一个猜测，但Wikipediapage跟我想的不太一样。
java - 什么相当于 ruby 的 rack 或 python 的 Java wsgi？ - 2
什么是ruby的rack或python的Java的wsgi？还有一个路由库。最佳答案来自Python标准PEP333:Bycontrast,althoughJavahasjustasmanywebapplicationframeworksavailable,Java's"servlet"APImakesitpossibleforapplicationswrittenwithanyJavawebapplicationframeworktoruninanywebserverthatsupportstheservletAPI.ht
华为OD机试用Python实现 -【明明的随机数】 2023Q1A - 2
华为OD机试题本篇题目：明明的随机数题目输入描述输出描述：示例1输入输出说明代码编写思路最近更新的博客华为od2023|什么是华为od，od薪资待遇，od机试题清单华为OD机试真题大全，用Python解华为机试题|机试宝典【华为OD机试】全流程解析+经验分享,题型分享,防作弊指南华为o
python - 如何读取 MIDI 文件、更改其乐器并将其写回？ - 2
我想解析一个已经存在的.mid文件，改变它的乐器，例如从“acousticgrandpiano”到“violin”，然后将它保存回去或作为另一个.mid文件。根据我在文档中看到的内容，该乐器通过program_change或patch_change指令进行了更改，但我找不到任何在已经存在的MIDI文件中执行此操作的库.他们似乎都只支持从头开始创建的MIDI文件。最佳答案 MIDIpackage会为您完成此操作，但具体方法取决于midi文件的原始内容。一个MIDI文件由一个或多个音轨组成，每个音轨是十六个channel中任何一个上的
「Python｜Selenium｜场景案例」如何定位iframe中的元素？ - 2
本文主要介绍在使用Selenium进行自动化测试或者任务时，对于使用了iframe的页面，如何定位iframe中的元素文章目录场景描述解决方案具体代码场景描述当我们在使用Selenium进行自动化测试的时候，可能会遇到一些界面或者窗体是使用HTML的iframe标签进行承载的。对于iframe中的标签，如果直接查找是无法找到的，会抛出没有找到元素的异常。比如近在咫尺的例子就是，CSDN的登录窗体就是使用的iframe，大家可以尝试通过F12开发者模式查看到的tag_name,class_name,id或者xpath来定位中的页面元素，会抛出NoSuchElementException异常。解决
python ffmpeg 使用 pyav 转换一组图像到视频 - 2
2022/8/4更新支持加入水印水印必须包含透明图像，并且水印图像大小要等于原图像的大小pythonconvert_image_to_video.py-f30-mwatermark.pngim_dirout.mkv2022/6/21更新让命令行参数更加易用新的命令行使用方法pythonconvert_image_to_video.py-f30im_dirout.mkvFFMPEG命令行转换一组JPG图像到视频时，是将这组图像视为MJPG流。我需要转换一组PNG图像到视频，FFMPEG就不认了。pyav内置了ffmpeg库，不需要系统带有ffmpeg工具因此我使用ffmpeg的python包装p
Python 刷Leetcode题库，顺带学英语单词（31） - 2
ValidPalindromeGivenastring,determineifitisapalindrome,consideringonlyalphanumericcharactersandignoringcases. [#125]Example:"Aman,aplan,acanal:Panama"isapalindrome."raceacar"isnotapalindrome.Haveyouconsiderthatthestringmightbeempty?Thisisagoodquestiontoaskduringaninterview.Forthepurposeofthisproblem
python - 是否可以使用 Ruby 或 Python 禁用 anchor /引用来发出有效的 YAML？ - 2
是否可以在PyYAML或Ruby的Psych引擎中禁用创建anchor和引用(并有效地显式列出冗余数据)？也许我在网上搜索时遗漏了一些东西，但在Psych中似乎没有太多可用的选项，而且我也无法确定PyYAML是否允许这样做.基本原理是我必须序列化一些数据并将其以可读的形式传递给一个不是真正的技术同事进行手动验证。有些数据是多余的，但我需要以最明确的方式列出它们以提高可读性(anchor和引用是提高效率的好概念，但不是人类可读性)。Ruby和Python是我选择的工具，但如果有其他一些相当简单的方法来“展开”YAML文档，它可能就可以了。最佳答案
.net - .NET 将如何影响 Python 和 Ruby 应用程序？ - 2
我很好奇.NET将如何影响Python和Ruby应用程序。用IronPython/IronRuby编写的应用程序是否会非常特定于.NET环境，以至于它们实际上将变得特定于平台？如果他们不使用任何.NET功能，那么IronPython/IronRuby相对于非.NET同类产品的优势是什么？最佳答案我不能说任何关于IronRuby的东西，但是大多数Python实现(如IronPython、Jython和PyPy)都试图尽可能忠实于CPython实现。不过，IronPython正在迅速成为这方面的佼佼者之一，并且在PlanetPyth

Python第三方库之MedPy

文章目录

1.MedPy简介

2.MedPy安装

3.MedPy常用函数

3.1 medpy.io.load(image)

3.2 medpy.metric.binary.dc(result, reference)

3.3 medpy.metric.binary.jc(result, reference)

3.4 medpy.metric.binary.hd(result,reference,voxelspacing=None,connectivity=1,)

3.5 medpy.metric.binary.hd95(result,reference,voxelspacing=None,connectivity=1,)

3.6 medpy.metric.binary.recall(result, reference)

3.7 medpy.metric.binary.sensitivity(result, reference)

3.8medpy.metric.binary.true_positive_rate(result, reference)

3.9medpy.metric.binary.specificity(result, reference)

3.10medpy.metric.binary.true_negative_rate(result, reference)

3.11medpy.metric.binary.precision(result, reference)

3.12 medpy.metric.binary.positive_predictive_value(result, reference)

3.13 medpy.io.save(arr, filename, hdr=False, force=True, use_compression=False)