instance_exec_草庐IT

hadoop - Apache spark 1.2.1 独立集群中的剂量， 'number of executors equals to number of SPARK_WORKER_INSTANCES'？

Apachespark1.2.1Standalone集群中的Dose，“执行程序的数量等于SPARK_WORKER_INSTANCES的数量”？Ihavedonebelowsettinginconf/spark-env.shSPARK_EXECUTOR_CORES=4SPARK_NUM_EXECUTORS=3SPARK_EXECUTOR_MEMORY=2G如果没有，谁能告诉我如何增加独立集群中的执行程序数量？提前致谢。最佳答案在独立模式下，总执行器数量等于集群中的总工作器数量。spark-env.sh中的SPARK_WORKER

hadoop - Hive 存档分区(动态)失败 : Execution Error, 从 org.apache.hadoop.hive.ql.exec.DDLTask 返回代码 1

我正在尝试从我的表中归档一些旧数据。使用ALTERTABLETABLE_NAMEARCHIVEPARTITION(part_col)查询。Hadoopversion-2.7.3Hiveversion-1.2.1表结构如下，hive>descclicks_fact;OKtimetimestampuser_idvarchar(32)advertiser_idintbuy_idintad_idintcreative_idintcreative_versionsmallintcreative_sizevarchar(10)site_idintpage_idintkeywordvarchar(4

hadoop - 无法在 oozie 中运行 "sqoop job --exec"

需要一些建议我正在尝试在oozie中运行sqoop作业，但它突然被杀死并且oozie-error.log中有这个警告2018-01-2117:30:12,473WARNSqoopActionExecutor:523-SERVER[edge01.domain.com]USER[linknet]GROUP[-]TOKEN[]APP[sqoop-wf]JOB[0000006-180121122345026-oozie-link-W]ACTION[0000006-180121122345026-oozie-link-W@sqoop-node]LauncherERROR,reason:Mainc

java - 使用 Runtime.exec 从 JAVA 运行 hadoop jar 命令

我正在尝试使用Runtime.exec从JAVA运行hadoopjar命令。下面是示例代码:Runtime.getRuntime().exec(newString[]{"bin/hadoop","jar/home/hadoop/jar/test.jar/user/hduser/myinput/input/user/hduser/newoutput"});但是我没有得到想要的输出。下面是我想从JAVA执行的hadoop命令:bin/hadoopjar/home/hadoop/jar/test.jar/user/hduser/myinput/input/user/hduser/newout

hadoop - 从 org.apache.hadoop.hive.ql.exec.DDLTask 创建配置单元表 : FAILED: Execution Error, 返回代码 1 时出错。元异常

我有一个多节点hadoop集群，现在我在namenode上安装了hive。我试图从存储在hdfs中的文件创建一些配置单元表，但我收到了这个奇怪的错误:FAILED:ExecutionError,returncode1fromorg.apache.hadoop.hive.ql.exec.DDLTask.MetaException(message:hdfs://namenode-VirtualBox:9000/data/posts/posts.tblisnotadirectoryorunabletocreateone)hive>但是，然后我尝试从存储在hdfs中的文件创建一个表，只有2kb

hadoop - 失败 : Execution Error, 从 org.apache.hadoop.hive.ql.exec.DDLTask 返回代码 1。组织/apache/hadoop/hive/serde2/SerDe

我正在将Twitter数据处理到Hive外部表，但在创建Hive外部表时出现错误。请查看下面的我的代码。添加了jar文件以移动hive/lib位置。使用以下命令添加到jar文件配置单元我在配置单元库目录中添加了流动的jar:ADDJAR/usr/local/hive/lib/hive-serdes-1.0-SNAPSHOT.jar;请找到外部配置单元表:CREATEEXTERNALTABLEMytweets_raw(idBIGINT,created_atSTRING,sourceSTRING,favoritedBOOLEAN,retweet_countINT,retweeted_sta

SQL 查询 : How to select multiple instances of a single item without collapsing into a group?

我正在尝试在Impala中执行SQL查询。我有一个数据表，其中(除其他外)有两列，其值相交多次。例如，假设我们有一个表，其中包含两列相关的姓名和电话号码:姓名电话号码约翰·史密斯(123)456-7890罗伯·约翰逊(123)456-7890格雷格·jackson(123)456-7890汤姆格林(123)456-7890jack·马西斯(123)456-7890约翰·史密斯(234)567-8901罗伯·约翰逊(234)567-8901乔·沃尔夫(234)567-8901迈克·托马斯(234)567-8901吉姆·摩尔(234)567-8901约翰·史密斯(345)678-9012罗

hadoop - 使用 Java Runtime.exec() 在 Hadoop 上运行命令

有一个名为“cufflinks”的程序运行如下:cufflinks-o此程序将1个文件作为输入，并在“output-dir”中生成4个文件作为输出。我正在尝试使用映射器类中的Runtime.exec()在Hadoop集群上运行相同的程序。我在设置output-dir=/some/path/on/HDFS我原以为这4个文件将作为o/p在HDFS上生成。然而，事实并非如此，HDFS上的o/p目录不包含这4个文件中的任何一个。然后我尝试设置output-dir=/tmp/output/它奏效了。谁能建议为什么它不能在HDFS上运行？我需要做什么才能让它在HDFS上运行？谢谢。

hadoop - 失败 : Execution Error, 从 org.apache.hadoop.hive.ql.exec.spark.SparkTask 返回代码 2

我在跑apache-hive-1.2.1-binhadoop-2.7.1spark-1.5.1-bin-hadoop2.6我能够在Spark上配置配置单元，但是当我尝试执行查询时，它会给我以下错误消息。hive>SELECTCOUNT(*)ASrcount,yomFromserviceGROUPBYyom;QueryID=hduser_20160110105649_4c90528a-76ba-4127-8849-54f2152be817Totaljobs=1LaunchingJob1outof1Inordertochangetheaverageloadforareducer(inbyt

java.lang.NoSuchFieldError : INSTANCE in HttpClient when running Oozie 错误

我有一个Java应用程序(作为Maven项目)，它使用HttpClient(v4.5)访问RESTAPI，然后将GET响应作为JSON写入HDFS。这在EclipseIDE中工作正常。这是我的依赖项:org.apache.httpcomponentshttpclient4.5com.google.code.gsongson2.3.1org.apache.hadoophadoop-client2.2.0当我尝试将它与Oozie集成时，因为我计划定期进行RESTAPI调用和HDFS写入，我遇到了:Causedby:java.lang.NoSuchFieldError:INSTANCEato