草庐IT

hadoop - flume-kite-morphline : com. fasterxml.jackson.core.JsonParseException:意外的输入结束:OBJECT 的预期关闭标记

在使用flume(1.6&1.7)时遇到以下错误2016-12-0200:57:11,634(pool-3-thread-1)[WARN-org.apache.flume.serialization.LineDeserializer.readLine(LineDeserializer.java:143)]Linelengthexceedsmax(2048),truncatingline!2016-12-0200:57:11,777(pool-3-thread-1)[ERROR-org.apache.flume.source.SpoolDirectorySource$SpoolDirec

maven - Cloudera VM 上的 Apache Giraph - org.apache.hadoop 的 POM :hadoop-core:jar:2. 6.0 缺失,无依赖信息

我是Hadoop/Giraph和Java的新手。作为任务的一部分,我在其上下载了ClouderaQuickstartVM和Giraph。我正在使用这本书,名为“使用ApacheGiraph进行实用图形分析;作者:Shaposhnik、Roman、Martella、Claudio、Logothetis、Dionysios”,我尝试从中运行第111页上的第一个示例(TwitterFollowershipGraph)。尝试在集群2.6.0-mr1-cdh5.12.0上使用hadoop版本运行更改后的pom.xml文件时,请发现以下错误`[cloudera@quickstartfirst]$m

hadoop - Oozie java-action 不包含 core-site.xml

在新安装的HadoopHDP2.2.2.4上运行Ooziejava操作时,例如尝试访问hdfs,它会访问错误的文件系统:java.lang.IllegalArgumentException:错误的FS:hdfs:/tmp/text.txt,预期:file:///可以通过在Oozie操作中包含core-site.xml来修复:hdfs:/path-to-core-site.xml-on-hdfs但是原因是什么,正确的解决方法是什么? 最佳答案 core-site.xml不包含在java-action的类路径中的原因是属性mapredu

java - 什么相当于hadoop 2.7.1中的hadoop-core-xxx.jar

我正在研究用于图形分布式处理的斯坦福GPS(图形处理系统)框架。该框架使用hadoop。根据GPS文档,安装GPS需要将hadoop-core-xxx.jar文件复制到其libs目录中。但是,我发现hadoop-core-xxx.jar不存在于hadoop2.7.1中。2.7.1版本的hadoopcore文件相当于什么?提前致谢... 最佳答案 您正在寻找hadoop-common.这是hadoop-common-2.7.1. 关于java-什么相当于hadoop2.7.1中的hadoo

c# - .NET Core SPNEGO 身份验证与 HttpClient

我目前正在编写一个简单的基于.NETCore的客户端,用于通过WebHCat与Hadoop集群进行交互,我正在尝试弄清楚如何使用SPNEGO进行身份验证,就像在curl或PowershellCore中一样。使用Curl我可以像这样查询WebHCat的状态端点:curl"http://10.2.0.9:50111/templeton/v1/status"--negotiate-k-u:同样的请求也可以在PowershellCore中执行:$client=New-ObjectSystem.Net.WebClient;$client.UseDefaultCredentials=$true;$

Hadoop map 作业因 com.datastax.driver.core.exceptions.NoHostAvailableException 而失败

我正在尝试使用hadoopmap-reduce对存储在cassandra中的数据运行分析。为此,我使用了可通过Maven依赖项cassandra-all获得的类CqlInputFormat。目前我们在生产环境中一直使用这个依赖的2.0.10版本。此外,我们正在使用版本为2.1.1的caassandra-driver-core。现在,当我向我的jobtracker提交一个简单的map-reduce作业时,我的所有映射器任务都会失败,并出现以下异常。这里要注意的另一个重要事项是,如果我使用cassandra-all2.0.6中可用的CqlPagingInputFormat,一切正常。但是这

hadoop - YARN vcore中的virtual core是什么意思?

Yarn使用虚拟核心的概念来管理CPU资源。我会问使用虚拟核心有什么好处,YARN使用虚拟核心有什么原因吗? 最佳答案 这是文档中的内容(强调我的)Anode'scapacityshouldbeconfiguredwithvirtualcoresequaltoitsnumberofphysicalcores.Acontainershouldberequestedwiththenumberofcoresitcansaturate,i.e.theaveragenumberofthreadsitexpectstohaverunnablea

maven - hadoop-core.jar 中不存在 org.apache.hadoop.conf.Configuration

我正在用Java编写HBase客户端。第一行,当然,看起来像这样:导入org.apache.hadoop.conf.Configuration;我使用的是ClouderaCDH4.3.1,所以包版本应该是:hadoop-2.0.0+1367hbase-0.94.6+106==已更新==我的pom.xml看起来像这样:org.apache.hadoophadoop-core2.0.0-mr1-cdh4.3.1org.apache.hbasehbase0.94.6-cdh4.3.1但不知何故,在hadoop-core.jar中,我没有看到任何org.apache.hadoop.conf.C

hadoop - 在 core-site.xml 中设置 fs.default.name 将 HDFS 设置为安全模式

我在一台机器上以伪分布式模式安装了ClouderaCDH4发行版并成功测试它是否正常工作(例如可以运行MapReduce程序,在Hive服务器上插入数据等)但是,如果我有机会core-site.xml文件将fs.default.name设置为机器名而不是localhost并重启NameNode服务,HDFS进入安全-模式。在更改fs.default.name之前,我运行了以下命令来检查HDFS的状态:$hadoopdfsadmin-report...ConfiguredCapacity:18503614464(17.23GB)PresentCapacity:13794557952(12

maven - Hadoop-common、Hadoop-core 和 Hadoop-client 之间的区别?

我刚接触Hadoop,想知道Hadoop-common、Hadoop-core和之间有什么区别Hadoop客户端?顺便说一句,对于给定的类,我如何知道Maven中哪个Artifact包含它?例如,哪个包含org.apache.hadoop.io.Text? 最佳答案 从高层次的角度帮助提供有关Hadoop-common、Hadoop-core和Hadoop-client之间差异的一些额外详细信息:Hadoop-common是指支持Hadoop模块的常用实用程序和库。Hadoop-core与Hadoop-common相同;根据http