草庐IT

linux - 命令行日志文件中时间的分箱直方图

为了从Linux服务器上的日志文件快速评估各种操作的时间,我想从日志中提取它们并创建一个文本/tsv样式的直方图。为了更好地了解计时的分布方式,我想将它们分为0-10毫秒、10-20毫秒等范围。输出应该是这样的:12110392012307401100如何使用常用的unix命令行工具集实现这一目标? 最佳答案 快速回答:cat|egrep-o[0-9]+|sed"s/$/\/10*10/"|bc|sort-n|uniq-c详细答案:grep时间或数字的模式。您可能需要执行多个grep步骤才能从日志中准确提取所需的数字。使用sed添加

linux - AWK 初级条形图/直方图

我已经被分配了这个提示作为我的第一个真正的awk程序,我什至不知道从哪里开始。非常感谢任何入门帮助。编写一个名为hist.awk的awk程序,该程序读取数字文件并打印出现次数的直方图。对于如下所示的输入:1450246813246723344输出将是:0:1***1:2******2:3********3:3********4:5**************5:1***6:2******7:1***8:1***第一列包含文件中的数字。第二个包含该数字出现的次数。该图显示总数的百分比,比例为50,因此50个星号表示100%,25个星号表示50%,依此类推。 最

linux - 二维直方图制作

我有一个包含两列的数据文件,例如1.12.23.14.51.24.53.24.61.12.34.24.94.21.1我想从两列制作直方图,即获得此输出(如果步长(或bin大小,正如我们谈论直方图)等于0.1在这种情况下)1.01.001.01.101.01.20...1.11.001.11.101.11.20...1.12.001.12.101.12.21......有人可以给我一些建议吗?如果我可以设置colmuns的值范围,那就太好了。在上面的例子中,第一列的值从1到4,与第二列相同。已编辑:已更新以处理更一般的数据输入,例如float。上述情况下的步长为0.1,但如果它可以针对其

python - 图像 "Black Ink Level"的横轴直方图

我有一张黑白图像(或pdf)文件,想要获取图像水平剖面的直方图。也就是说,对于图像中的每一列,我想要列中像素的灰度值之和。如果图像是XxY像素,我将以0(对于全黑列)和255*Y(对于全白列)之间的X数字结束。请看thiscomic的第二屏|我想要这样的直方图,但每个bin都代表图像中该x坐标(像素)处的所有“黑色墨水”。作为一名贫穷的研究生,我只能使用Linux命令行、FOSS程序(ImageMagick、gnuplot、Perl、g++等)。像GIMP这样的东西只有在我可以通过终端运行命令时才有用,因为我无法访问GUI。可视化输出文件对以后有帮助,但不是必需的。有谁知道我可以提取这

java - 如何以编程方式获取 jmap 直方图?

我想从受监控的应用程序内部以编程方式获取与jmap-histo的输出等效的内容。我看到可以通过HotSpot诊断bean触发堆转储,但我看不到如何获取直方图数据。有可能吗? 最佳答案 它可能不是最好的示例/代码,但请查看this(我认为它只适用于HotspotJVM) 关于java-如何以编程方式获取jmap直方图?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/9417038/

python - Pyspark:显示数据框列的直方图

在pandas数据框中,我使用以下代码绘制列的直方图:my_df.hist(column='field_1')在pyspark数据框中有什么东西可以实现相同的目标吗?(我在JupyterNotebook中)谢谢! 最佳答案 不幸的是,我认为PySparkDataframesAPI中没有干净的plot()或hist()函数,但我希望事情最终会发生往那个方向走。目前,您可以在Spark中计算直方图,并将计算出的直方图绘制为条形图。示例:importpandasaspdimportpyspark.sqlassparksql#Let'sus

python - 使用 Keras 和 fit_generator 的 TensorBoard 分布和直方图

我正在使用Keras使用fit_generator函数训练CNN。好像是knownissueTensorBoard在此设置中不显示直方图和分布。有没有人想办法让它发挥作用? 最佳答案 没有简单的方法只用一行代码插入它,您必须手动编写摘要。好消息是它并不难,您可以使用TensorBoardcallbackcode在Keras作为引用。(还有一个version2为TensorFlow2.x做好准备。)基本上,编写一个函数,例如write_summaries(model)并在您想编写摘要时调用它(例如,在您的fit_generator()

python - Pandas 中的多个直方图

我想创建以下直方图(见下图),取自“ThinkStats”一书。但是,我不能让他们在同一个情节上。每个DataFrame都有自己的子图。我有以下代码:importnsfgimportmatplotlib.pyplotaspltdf=nsfg.ReadFemPreg()preg=nsfg.ReadFemPreg()live=preg[preg.outcome==1]first=live[live.birthord==1]others=live[live.birthord!=1]#fig=plt.figure()#ax1=fig.add_subplot(111)first.hist(col

python - 如何在直方图 bin 中获取数据

我想获取直方图bin中包含的数据列表。我正在使用numpy和Matplotlib。我知道如何遍历数据并检查bin边缘。但是,我想为2D直方图执行此操作,并且执行此操作的代码相当难看。numpy有什么结构可以让这更容易吗?对于一维情况,我可以使用searchsorted()。但是逻辑并没有那么好,我真的不想在不需要的时候对每个数据点进行二分搜索。大多数讨厌的逻辑是由于bin边界区域造成的。所有区域都有这样的边界:[左边缘,右边缘)。除了最后一个bin,它有一个像这样的区域:[leftedge,rightedge]。这里是一维案例的一些示例代码:importnumpyasnpdata=[0

python - 更改直方图 matplotlib 中的默认 x 范围

我想更改直方图的默认x范围。数据的范围是从7到12。但是,默认情况下,直方图从7开始,到13结束。我希望它从6.5开始,到12.5结束。但是,刻度应该从7变为12。我该怎么做?importasciitableimportnumpyasnpimportmatplotlib.pyplotaspltimportmatplotlib.mlabasmlabimportpylabfrompylabimportxticksdata=asciitable.read(file)hmag=data['col8']visits=data['col14']origin=data['col13']n,bins,