草庐IT

bins_limits

全部标签

hadoop - Spark SQL "Limit"

环境:使用Hadoop的spark1.6。Hortonworks数据平台2.5我有一个有100亿条记录的表,我想获取3亿条记录并将它们移动到一个临时表。sqlContext.sql("select....frommy_tablelimit300000000").repartition(50).write.saveAsTable("temporary_table")我看到Limit关键字实际上会让spark只使用一个执行器!!!这意味着将3亿条记录移动到一个节点并将其写回Hadoop。我怎样才能避免这种减少,但在拥有多个执行者的情况下仍然只能获得3亿条记录。我希望所有节点都写入hadoo

hadoop - 文件夹不是用 $HADOOP_HOME/bin/hadoop fs -mkdir/user/hive/warehouse 创建的

嘿,我正在Hadoop2.7.3单节点集群中安装HIVE,但我无法使用创建文件夹$HADOOP_HOME/bin/hadoopfs-mkdir/user/hive/warehouse16/11/1114:43:25WARNutil.NativeCodeLoader:Unabletoloadnative-hadooplibraryforyourplatform...usingbuiltin-javaclasseswhereapplicablemkdir:`/user/hive/warehouse':NosuchfileordirectoryHadoop的JPS运行良好:jps15411N

ubuntu - "./bin/spark-shell "无法在 ubuntu 14.04 上使用带有 Hadoop 2.6+ 的预构建版本的 Spark 1.6

在Ubuntu14.04上将带有Hadoop2.6+的预构建版本的Spark1.6下载到桌面上。我导航到sparkshell并根据下面给出的链接启动了sparkQuickStartSparkLink使用./bin/spark-shell我收到以下错误。我看到一个针对MacOSX的类似问题here.ashwin@Console:~/Desktop/spark-1.6.0-bin-hadoop2.6$./bin/spark-shelllog4j:WARNNoappenderscouldbefoundforlogger(org.apache.hadoop.metrics2.lib.Mutab

garbage-collection - Hadoop .20 数据节点上的 "GC Overhead limit exceeded"

我搜索过,但没有找到太多与HadoopDatanode进程因超出GC开销限制而死掉相关的信息,所以我想我应该发布一个问题。我们正在运行一项测试,我们需要确认我们的Hadoop集群可以处理存储在其上的约300万个文件(目前是一个4节点集群)。我们使用的是64位JVM,我们已经为名称节点分配了8g。然而,当我的测试程序向DFS写入更多文件时,数据节点开始因以下错误而消失:线程“DataNode:[/var/hadoop/data/hadoop/data]”中的异常java.lang.OutOfMemoryError:GCoverheadlimitexceeded我看到了一些关于某些选项的帖

hadoop - 为什么 ./bin/spark-shell 给出 WARN NativeCodeLoader : Unable to load native-hadoop library for your platform?

在MacOSX上,我使用以下命令从源代码编译了Spark:jacek:~/oss/spark$SPARK_HADOOP_VERSION=2.4.0SPARK_YARN=trueSPARK_HIVE=trueSPARK_GANGLIA_LGPL=truexsbt...[info]Setcurrentprojecttoroot(inbuildfile:/Users/jacek/oss/spark/)>;clean;assembly...[info]Packaging/Users/jacek/oss/spark/examples/target/scala-2.10/spark-example

sql - 在 Microsoft SQL Server 2000 中模拟 MySQL LIMIT 子句

当我在ZendFramework'sdatabasecomponent工作时,我们试图抽象出MySQL、PostgreSQL和SQLite支持的LIMIT子句的功能。也就是说,可以这样创建查询:$select=$db->select();$select->from('mytable');$select->order('somecolumn');$select->limit(10,20);当数据库支持LIMIT时,会产生如下SQL查询:SELECT*FROMmytableORDERBYsomecolumnLIMIT10,20这对于不支持LIMIT的数据库品牌来说更为复杂(顺便说一下,该子

sql - 在 Microsoft SQL Server 2000 中模拟 MySQL LIMIT 子句

当我在ZendFramework'sdatabasecomponent工作时,我们试图抽象出MySQL、PostgreSQL和SQLite支持的LIMIT子句的功能。也就是说,可以这样创建查询:$select=$db->select();$select->from('mytable');$select->order('somecolumn');$select->limit(10,20);当数据库支持LIMIT时,会产生如下SQL查询:SELECT*FROMmytableORDERBYsomecolumnLIMIT10,20这对于不支持LIMIT的数据库品牌来说更为复杂(顺便说一下,该子

php - set_time_limit(0) 和 "Maximum execution time"PHP

我有一个我设置的脚本:set_time_limit(0)但还是得到Fatalerror:Maximumexecutiontimeof90secondsexceededin/home/Feed.phponline234我也试过设置:php_valuemax_execution_time120在.htaccess文件中,但仍然无法阻止此错误-知道为什么这没有被覆盖吗? 最佳答案 很可能,您的主机正在运行安装了Suhoshin补丁的PHP副本。此补丁为PHP提供了大量安全性和操作增强功能,包括允许主机禁用set_time_limit()等

php - set_time_limit() 是全局的还是只针对当前运行的脚本?

我有一个非常难看的页面,目前我不得不在PHP中将最大超时设置为2分钟。我正在使用set_time_limit()函数,但是来自officialdocumentation我不清楚“设置”的全局性。这个宣传语似乎暗示它仅限于特定的脚本:Theset_time_limit()functionandtheconfigurationdirectivemax_execution_timeonlyaffecttheexecutiontimeofthescriptitself.Anytimespentonactivitythathappensoutsidetheexecutionofthescript

php - 即使设置了 set_time_limit(0),PHP 脚本也能终止吗?

我正在尝试追踪一个看起来非常奇怪的错误。我有一个大致如下结构的应用程序:set_time_limit(0);register_shutdown_function('logScriptCompletion');functionlogScriptCompletion(){log('scriptcompleted');}log('scriptstarted');//dosomecalculationsperiodicallyprintingoutprogress脚本可能需要一段时间才能运行。期望的行为是脚本继续计算直到结束,即使按下停止按钮或断开连接也是如此。99%的时间它都按预期工作。偶尔