草庐IT

find_end

全部标签

Hadoop Kerberos : hdfs command 'Failed to find any Kerberos tgt' even though I had got one ticket using kinit

我为Hadoop集群设置了Kerberos身份验证。当我尝试使用kinit获取kerberos票证时,它将票证存储在krb5cc_0中$sudoklistTicketcache:FILE:/tmp/krb5cc_0Defaultprincipal:hduser/stwhdrm01@FDATA.COMValidstartingExpiresServiceprincipal01/04/201810:15:1401/05/201810:15:14krbtgt/FDATA.COM@FDATA.COM但是当我尝试在命令行上列出HDFS目录时,出现以下错误:$hdfsdfs-ls/openjdkv

java - 错误 : Could not find or load main class org. apache.hadoop.hdfs.server.datanode.DataNode

我是apachehadoop的新手。我正在安装多节点集群,但出现两个错误。我不知道这些是什么类型的错误以及它们产生的原因。我在谷歌上搜索了很多关于这些错误的信息,但我无法找出错误产生背后的原因。Error:Couldnotfindorloadmainclassorg.apache.hadoop.util.PlatformNameError:Couldnotfindorloadmainclassorg.apache.hadoop.hdfs.server.datanode.DataNode这两个错误都是由于datanode或slaves引起的。我需要知道错误的种类、产生的原因以及如何解决它

java - Hadoop WordCount 示例中的 "Cannot find symbol"错误

我正在尝试完成DataAnalyticswithHadoop一书中给出的HadoopMapReduceWordCount示例,它让我设置了一个Hadoop伪分布式开发环境。所以现在我正在尝试运行一个字数统计示例。我从HadoopFundamentals下载了.java文件,WordCount文件夹.书中给出的启动这个过程的代码是:hostname$hadoopcom.sun.tools.javac.MainWordCount.java我运行它并收到以下错误:hadoop@gh0st-VirtualBox:/home/gh0st$hadoopcom.sun.tools.javac.Mai

java - 为什么 ./sbin/start-master.sh 给出 "Error: Could not find or load main class org.apache.spark.launcher.Main"?

我是新手。我在单个节点上安装spark-1.5.2-bin-without-hadoop.tgz。我已完成配置。当我要使用以下命令启动我的主节点时,它向我显示错误。请帮助我。Command:./sbin/start-master.shstartingorg.apache.spark.deploy.master.Master,loggingto/usr/local/spark/sbin/../logs/spark-jalaj-org.apache.spark.deploy.master.Master-1-CIPL367.outfailedtolaunchorg.apache.spark.

scala - Spark : Calculate event end time on 30-minute intervals based on start time and duration values in previous rows

我有一个带有event_time字段的文件,每条记录每30分钟生成一次,并指示事件持续了多少秒。示例:Event_time|event_duration_seconds09:00|80009:30|180010:00|270012:00|100013:00|1000我需要将连续的事件转换为一个具有持续时间的事件。输出文件应如下所示:Event_time_start|event_time_end|event_duration_seconds09:00|11:00|530012:00|12:30|100013:00|13:30|1000ScalaSpark中是否有一种方法可以将数据帧记录与

java - Hadoop : JPS can not find Java installed

我的配置是hduser@worker1:/usr/local/hadoop/conf$jpsTheprogram'jps'canbefoundinthefollowingpackages:*openjdk-6-jdk*openjdk-7-jdkAskyouradministratortoinstalloneofthem虽然我安装了javahduser@worker1:/usr/local/hadoop/conf$java-versionjavaversion"1.6.0_23"OpenJDKRuntimeEnvironment(IcedTea61.11pre)(6b23~pre10-0

hadoop - 带有 Yarn 的 Spark Shell - 错误 : Yarn application has already ended! 它可能已被杀死或无法启动应用程序主机

作为this的后续行动问题,当我尝试在我的单节点机器上使用Spark2.1.1overYarn(Hadoop2.8.0)时出现新错误。如果我使用启动SparkShellspark-shell它开始没有问题。在使用通常的start-dfs.sh和start-yarn.sh启动Hadoop之后,如果我使用spark-shell--masteryarn我收到以下错误:17/06/1012:00:07WARNNativeCodeLoader:Unabletoloadnative-hadooplibraryforyourplatform...usingbuiltin-javaclasseswhe

java - hadoop MapReduce : find max key value pair from output of mapper

这听起来像是一项简单的工作,但使用MapReduce似乎并不那么简单。我有N个文件,其中每个文件只有一行文本。我希望Mapper输出键值对,如,其中'score'是根据文本行计算的整数。作为旁注,我正在使用以下代码片段来执行此操作(希望它是正确的)。FileSplitfileSplit=(FileSplit)reporter.getInputSplit();StringfileName=fileSplit.getPath().getName();假设映射器正确地完成了它的工作,它应该输出N个键值对。现在的问题是我应该如何对Reducer进行编程以输出具有最大“分数”的一对键值对?据我所

hadoop - 配置单元/DynamoDB 错误 "Could not find column mapping for column"

我在AmazonElasticMapReduceEC2实例上运行以下Hive查询:CREATEEXTERNALTABLEmyExport(access_keystring,activebigint,api_idstring,secret_keystring)STOREDBY'org.apache.hadoop.hive.dynamodb.DynamoDBStorageHandler'TBLPROPERTIES("dynamodb.table.name"="Authentication","dynamodb.column.mapping"="access_key:access_key,a

java - 弹性 map 减少超时java.io.IOException : Unexpected end of stream

我正在运行MAPreduce作业(ElasticmapreduceEMR)服务。该作业适用于小型数据集,但对于大型数据集(文件大小400MB)存在以下异常使用相同的大输入文件运行另一个作业工作正常但是。为什么这样呢?Error:java.io.IOException:Unexpectedendofstreampos=19520590contentLength=458603265atorg.apache.hadoop.fs.s3native.NativeS3FileSystem$NativeS3FsInputStream.read(NativeS3FileSystem.java:313)