dynamic-data_草庐IT

Hadoop 纱 : How to limit dynamic self allocation of resources with Spark?

在我们在Yarn下运行的Hadoop集群中，我们遇到了一个问题，即一些“更聪明”的人能够通过在pySparkJupyter笔记本中配置Spark作业来消耗大得多的资源block，例如:conf=(SparkConf().setAppName("name").setMaster("yarn-client").set("spark.executor.instances","1000").set("spark.executor.memory","64g"))sc=SparkContext(conf=conf)这导致了这些人从字面上排挤其他不那么“聪明”的人的情况。有没有办法禁止用户自行分配资

hadoop - Hbase 与 Cassandra : Which is better for a timeseries data storage?

我使用我的API日志提取如下信息:这段时间内我的API有多少用户？或者在这段时间里，什么类型的服务被调用最多？我提取的几乎所有信息都取决于时间戳。实际上，我使用MongoDB并将时间戳添加为索引(对于80GB，索引大小为12GB)。有人向我推荐迁移到cassandra或Hbase。我想知道哪个更适合我的用例:时间序列数据分析。需要良好的写入和读取性能。可以使用hadoop进行数据分析。感谢您分享您的观点或经验。最佳答案 Cassandra的优势:Cassandra通常表现出更好的性能(尽管两者都非常出色)。从操作的角度来看，Cas

timeseries Cassandra section hadoop hbase analytics bigdata

hadoop - java.lang.OutOfMemoryError : unable to create new native thread for big data set 错误

我运行的hive查询对于小型数据集运行良好。但我正在运行2.5亿条记录，我在日志中遇到的错误低于此FATALorg.apache.hadoop.mapred.Child:Errorrunningchild:java.lang.OutOfMemoryError:unabletocreatenewnativethreadatjava.lang.Thread.start0(NativeMethod)atjava.lang.Thread.start(Thread.java:640)atorg.apache.hadoop.mapred.Task$TaskReporter.startCommuni

OutOfMemoryError hadoop java apache hive

hadoop - "code moving to data"而不是数据转码的原理是什么？

在最近关于分布式处理和流的讨论中，我遇到了“代码移动到数据”的概念。有人可以帮忙解释一下吗？此短语的引用是MapReduceWay.在Hadoop方面，it'sstatedinaquestion但仍然无法以技术不可知的方式找出对原理的解释。最佳答案基本思想很简单:如果代码和数据在不同的机器上，则必须先将其中一个移动到另一台机器上，然后才能在数据上执行代码。如果代码小于数据，最好将代码发送到保存数据的机器，而不是相反，如果所有机器都同样快且代码兼容。[可以说您可以根据需要发送源代码和JIT编译]。在大数据的世界里，代码几乎总是比数

amp hadoop section stackoverflow noreferrer architecture mapreduce distributed-computing design-principles

Hadoop- hive : Delete data which is older than specified no of days

我正在从事一个电信项目，该项目使用Hadoop-hive进行数据分析。一天，我们将获得数百万条记录。在指定的天数之后，我们需要删除旧数据，因为我们没有存储容量。删除记录的最佳方法是什么？附加信息:这些配置单元表将有一个包含填充日期的列。最佳答案我认为您的用例非常适合在Hive表中使用“日”分区。如果“天”只是一列，那么维护和清理表格将变得困难。分区在Hive中的真正含义是每个“天”都有一个目录例如:createtablemytable(...)partitionedby(daystring)因此，当您添加数据时，您将在HDFS中

specified Hadoop code section mytable hive bigdata

sql - 配置单元中 `load data inpath ` 和 `location` 之间的区别？

在我的公司，我经常看到这两个命令，我想知道它们之间的区别，因为它们的功能对我来说似乎是一样的:1createtable(namestring,numberdouble);loaddatainpath'/directory-path/file.csv'into;2createtable(namestring,numberdouble);location'/directory-path/file.csv';它们都将数据从HDFS上的目录复制到HIVE上的表目录中。使用这些时是否应该注意差异？谢谢你。最佳答案是的，它们的用途完全不同。

配置单 location strong section code sql hadoop hive hdfs hiveql

shell - get "ERROR: Can' t 从 ZooKeeper 获取主地址； znode data == null"使用 Hbase shell 时

我安装了Hadoop2.2.0和Hbase0.98.0，这是我所做的:$./bin/start-hbase.sh$./bin/hbaseshell2.0.0-p353:001>list然后我得到了这个:ERROR:Can'tgetmasteraddressfromZooKeeper;znodedata==null为什么我会收到这个错误？另一个问题:我需要在运行base之前运行./sbin/start-dfs.sh和./sbin/start-yarn.sh吗？另外，./sbin/start-dfs.sh和./sbin/start-yarn.sh有什么用？这是我的一些conf文档:hbas

amp shell code gt lt hadoop hbase

hadoop/hdfs/name 处于不一致状态 : storage directory(hadoop/hdfs/data/) does not exist or is not accessible

我已经尝试了stackoverflow提供的关于这个主题的所有不同解决方案，但没有帮助再次询问具体日志和详细信息感谢任何帮助我的Hadoop集群中有一个主节点和5个从节点。ubuntu用户和ubuntu组是~/Hadoop文件夹的所有者~/hadoop/hdfs/data&~/hadoop/hdfs/name文件夹都存在两个文件夹的权限都设置为755在启动脚本start-all.sh之前成功格式化namenode脚本无法启动“名称节点”这些都在主节点上运行ubuntu@master:~/hadoop/bin$jps7067TaskTracker6914JobTracker7237Jps

hadoop hdfs namenode apache nodes

attributeError：'modulespec'对象没有属性'load_data_wrapper'

这有点长，所以请忍受我。我正在尝试学习Python和Linux，并且对两者都是非常新的。我目前正在阅读以下深入学习：http://neuralnetworksanddeeplearning.com/chap1.html我正在尝试导入mnist_loader包装使用关联的数据来测试先前编写的脚本。但是，打字后importmnist_loader进入Linux命令行，我得到了以下内容：“该程序'导入可以在以下软件包中找到：”在这一点上，它列出了一些软件包。因为我是Linux的新手，并且没有管理员特权，所以我决定走一条我更好地理解的路线。那就是创建一个新的python脚本，并简单地使用“导入命令”（

039 load_data_wrapper mnist_loader code loader

php - How to implement dynamic chat application in Ios using php, 类似Skype的应用

我正在尝试在IOS中实现聊天应用程序。一般来说，我们使用两个php文件，一个用于发布消息(发送者)，另一个用于检索消息(接收者)。我想完成以下任务:考虑A(发送方)和B(接收方)。A向B发送了消息。而A正在等待B的回复。所以我需要调用post-api.php来发送消息，在接收方(B)我需要使用getapi.php进行检索>当B回复A时，它必须自动出现在我的A的收件箱(实时聊天框)中，而无需调用getapi.php.我知道这种情况是不可能的。但是是否有任何解决方案或方法可以让我的聊天应用程序像skype或facebookchat一样工作。最佳答案

application php strong section 收方 iphone web-services chat livechat