草庐IT

Statistics

全部标签

hadoop - spark 独立模式下 50-60 gb 的数据

我正在尝试分析大约50-60GB的数据。我想过使用spark来做到这一点,但我无权访问集群中的多个节点。这种级别的处理可以使用spark独立模式完成吗?如果是,我想知道处理数据所需的估计时间。谢谢! 最佳答案 简短的回答:是的。Spark会将此文件分成许多较小的block。在您的情况下,一次只会执行几个block。这几个block应该适合内存(您需要使用配置来获得正确的结果)总而言之,您将能够做到,但如果您有更多的内存/核心,那么您可以并行处理更多事情,速度会更快。 关于hadoop-s

hadoop - 何时在 Hive 表上创建布隆过滤器?

我在4个不同的列上创建了一个带有布隆过滤器的Hive表,稍后决定使用alter命令添加更多。但我不确定如何在Hive上刷新/重新生成布隆过滤器。是否在插入数据时创建布隆过滤器?它是在我们收集统计数据时创建的吗?列级还是表级?或者我完全没有理解布隆过滤器并且它是即时创建的?我已经阅读了文档,但还没有找到关于此的更多信息。尝试在没有运气的情况下浏览代码并找到触发方法的位置。 最佳答案 Isthebloomfiltercreatedduringinsertionofdata?是的。当我们向表中插入行时,布隆过滤器和orc文件中的索引数据是

hadoop - 在 map reduce 中计算中位数

有人可以举例说明mapreduce中中位数/分位数的计算吗?我对Datafu中位数的理解是,'n'个映射器对数据并将数据发送到负责排序的“1”reducer来自n个映射器的所有数据并找到中位数(中间值)我的理解正确吗?,如果是这样,这种方法是否适用于海量数据,我可以清楚地看到一个单一的reducer努力完成最后的任务。谢谢 最佳答案 试图在一系列中找到中位数(中间数)将需要1个reducer传递整个数字范围以确定哪个是“中间”值。根据输入集中值的范围和唯一性,您可以引入组合器来输出每个值的频率-减少发送到单个缩减器的映射输出数量。然

php - PHP 数学统计库

按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visitthehelpcenter指导。关闭9年前。我想知道,是否有像这样的统计测试库t检验方差分析柯尔莫哥洛夫·斯米尔诺夫ETC.....用于PHP?我找到了一个pecl扩展:http://php.net/manual/de/book.stats.php,给出了一些基本参数,但是还没有找到测试

javascript - 如何在 JavaScript(或 PHP)中获取数组的中位数和四分位数/百分位数?

ThisquestionisturnedintoaQ&A,becauseIhadstrugglefindingtheanswer,andthinkitcanbeusefulforothers我有一个JavaScript值数组,需要用JavaScript计算它的Q2(第50个百分位又名MEDIAN)、Q1(第25个百分位)和Q3(第75个百分位数)值。 最佳答案 我更新了第一个答案的JavaScript翻译,以使用箭头函数和更简洁的符号。功能基本保持不变,除了std,它现在计算样本标准偏差(除以arr.length-1而不是仅仅arr

android - 跟踪 Android 应用的使用情况

我们的Android应用程序有很多不同的设置。我们想简化它,只让最常用的可见,而在某些高级模式下隐藏其他的。为此,我们需要知道用户最常使用的设置是什么。所以我们需要找到一种方法来获取应用程序使用情况的统计信息。该应用程序包含GoogleAnalytics(GA),因此自然选择为此使用GA。但是,GA似乎更适合跟踪事件,而不是应用程序中的常量设置。换句话说,使用GA,我们可以通过跟踪设置上的点击来轻松跟踪用户何时更改某个设置的值。但不是设置的状态。我们所有的设置都保存为共享首选项,它基本上是一个键/值对模式。没有私有(private)信息。有没有什么简单的方法可以将这些键/值对发送给我们

android - 是否有 API 可以获取 Google Play 上的销售报告?

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。关闭3年前。Improvethisquestion我们在GooglePlay上有一个Android应用程序,我想以编程方式检索销售报告。Apple提供了Autoingestion工具,它允许Java应用程序检索它们,甚至还有一个Ruby端口:https://github.com/siuying/itunes-auto-ingestion有人知道Android是否有类似的东西或至少有一个API吗?我找不到。非常感谢,若

Android 市场统计 API?

按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visitthehelpcenter指导。关闭10年前。我们是否可以使用API或网络服务来获取有关Android电子市场中应用程序的统计信息?像AndroidZoom.com和AndroLib.com。这两个站点都有很多关于应用程序的信息。数据从何而来?感谢您的回复。问候,瑞克

android - Google Play 开发者统计 API

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。关闭4年前。Improvethisquestion是否有任何API可以让人们从GooglePlay获取其应用的统计信息?我认为Android应用程序Andlytics会做类似的事情(尽管由于控制台内部的变化,它们有很多更新......)但这也可以通过某种方式使用API进行开发吗?

iphone - iPhone App移植到Android的需求?

虽然这不是一个真正的编程问题,但我相信很多开发人员都会遇到这个问题,因此会给出最佳答案。目前我正在为我工​​作的组织开发iPhone应用程序。它即将发布,当我展示它时有很多人感兴趣,但偶尔会有人问我是否要把它移植到Android上。我的回答是我愿意,但根据网络统计,超过90%的访问我们网站的手机是iPhone,另外10%的手机正在下降(可能是人们从黑莓手机迁移,最后一次统计是98%是iOS)现在,如果您阅读媒体,很多人希望您相信它是Android和iPhone之间的split市场,但这可能只是在美国,iPhone的单一运营商限制了其消费者的接受度,因为所有可用的信息对我们(至少在我的组