shell-mode_草庐IT

hadoop - 通过 Bash Shell 创建 Hive 表错误

谁能告诉我为什么在从bashshell创建分区表时出现错误。[cloudera@localhost~]$hive-e"createtablepeoplecountry(name1string,name2string,salaryint,countrystring)partitionedby(countrystring)rowformatdelimitedcolumnterminatedby'\n'";Logginginitializedusingconfigurationinjar:file:/usr/lib/hive/lib/hive-common-0.10.0-cdh4.7.0.j

shell - hadoop 命令手动运行但在 cron 中不运行

我正在尝试执行定期运行我的hadoop作业的shell脚本，我将我的脚本放在crontab中，但所有hadoop命令都没有运行。当我手动(从cli)执行我的脚本shell时，hadoop命令运行正常我正在使用ubuntu14.04 最佳答案如果你看到脚本在terminal上执行正常，而通过cron执行时失败，那么问题可能主要是因为terminal和cronenv的环境差异。问题可能是因为您直接调用hadoop命令的PATH变量可能没有完全传送到cronenv。我的建议是在您的shell脚本中使用hadoop命令的绝对路径(完整路径

hadoop shell section code ubuntu

Hadoop 可以列出 s3 内容，但 spark-shell 抛出 ClassNotFoundException

我的传奇还在继续-简而言之，我正在尝试为spark创建一个测试堆栈-旨在从s3存储桶中读取文件，然后将其写入另一个存储桶。Windows环境。我在尝试访问S3或S3n时反复遇到错误，因为抛出了ClassNotFoundException。这些类作为s3和s3n.impl添加到core-site.xml我将hadoop/share/tools/lib添加到类路径中无济于事，然后我将aws-java-jdk和hadoop-awsjar添加到share/hadoop/common文件夹，我现在可以在命令行上使用haddop列出存储桶的内容。hadoopfs-ls"s3n://bucket"显

ClassNotFoundException spark-shell hadoop code amazon-web-services amazon-s3 apache-spark

hadoop - 输出状态为 : ACCEPTED in YARN MODE 的 Spark Hang

我的Spark环境Spark->2.1.0Hadoop->2.8.1Eclipse->Neon2我在yarn模式下获取spark上下文时卡住了，如何在yarn模式下获取spark上下文，请帮我解决。我的Hadoop、Yarn和Spark安装成功。$jps3200NameNode5264ExecutorLauncher5328CoarseGrainedExecutorBackend3555SecondaryNameNode5316CoarseGrainedExecutorBackend7590Jps3357DataNode4045NodeManager5118SparkSubmit372

ACCEPTED hadoop section spark code apache-spark hadoop-yarn

shell - 抑制 hadoop fs -get -p 命令的警告

我正在使用hadoopfs-get-p命令复制大量文件。我想保留(时间戳，所有权)很多文件无法保留权限因为userid在本地机器上不可用。因此，对于这些文件，我得到“get:chown:changingownership/a/b/c.txtOperationnotpermitted”是否可以抑制该错误，因为我可能还会遇到其他问题。如果我执行2>/dev/null，这将抑制所有问题所以我不想使用这个选项。有什么办法可以只抑制与权限相关的问题。？任何提示真的很有帮助吗？最佳答案不是很优雅，但功能正常，使用grep-vyour_und

抑制 hadoop section code shell unix

hadoop - 如何使用 HBase shell 获取多个列

我有带有2个家庭列的Randonnee表Info:Name,region,suiteTech:distance,denivele我的Randonnee表上有这些数据(id,Name,region,distance,denivele,suite)(1,'MontsduDjurdjura','TiziOuzou',35,1000,NULL);(2,'CircuitdeMisserghin','Oran',25,514,NULL);(3,'MontagnedeMurdjadju','Oran',31,1100,NULL);(4,'Canastel','Oran',18,890,3);(5,'

hadoop HBase 39 code section nosql bigdata cloudera

unix - 将同一配置单元 session 中的多个查询输出导出到 shell 脚本？

有没有办法将hiveCLI中多个hive查询的输出导出到shell脚本？目前，我有shell脚本，其中有多个我触发的配置单元查询:VAR1=`hive-e"selectcount(*)fromtable1;"`VAR2=`hive-e"selectcount(*)fromtable2;"`VAR3=`hive-e"selectcount(*)fromtable3;"`这将在单独的配置单元session中运行所有查询，这将导致它等待yarn中的资源。相反，我想在同一个配置单元session中运行它们`hive-e"selectcount(*)fromtable1;selectcount(

配置单 session select section unix hadoop hive hadoop-yarn

Scala - 如何将字符串值传递给数据框过滤器 (Spark-Shell)

我在Spark-Shell环境中使用Spark2.2.0和Scala2.11.8。我有一个数据框df，我需要根据'date'列的值过滤掉前一天的数据，然后将数据附加到HDFS位置。(比如今天是2018-06-28，我需要2018-06-27的数据)代码如下:df.filter($"date"==="2018-06-27").write.mode(SaveMode.Append).parquet("hdfs:/path..../date=2018-06-27")Ineedthecodeaboveforautomation,soIneedtoreplace"2018-06-27"forth

Spark-Shell 递给 34 date section scala apache-spark hadoop hdfs

shell - 在 yarn 客户端错误上运行 spark shell

我有Spark1.6.1并且我已经设置了exportHADOOP_CONF_DIR=/folder/location现在，如果我运行sparkshell:$./spark-shell--masteryarn--deploy-mode客户端我得到这种类型的错误(相关部分)$16/09/1815:49:18INFOimpl.TimelineClientImpl:Timelineserviceaddress:http://URL:PORT/ws/v1/timeline/16/09/1815:49:18INFOclient.RMProxy:ConnectingtoResourceManager

shell spark hadoop FSPermissionChecker section apache-spark hadoop-yarn

hadoop - 如何记录我编写的 Pig Latin grunt shell 命令？

我是Pig和PigLatin的新手。我想记录我在交互式gruntshell中编写的命令，以便我可以拼凑工作的PigLatin脚本。这可能吗？是否有一个文件存储我编写的命令的历史记录，类似于我的“.bash_history”文件？我想访问“.grunt_history”，如果存在这样的东西，或者以某种方式打开记录到文件。最佳答案 Pig历史文件位于~/.pig_history中。因此，如果您的用户家是/home/joe，则路径是/home/joe/.pig_history。但是，您需要注意定位用户主目录。您可以从/etc/passw

编写 hadoop section code history apache-pig