Hadoop-Solr

hadoop - 作业跟踪器和名称节点不以 start-all.sh 开头

我正在尝试安装hadoop单节点，但它无法正常工作。当我执行start-all.shnamenode和jobtracker时，不要启动。您是否在我的文件中看到什么可能是错误的，所以我得到了这个结果？hadoopjps命令的结果:14878日元14823任务追踪器14605二级名称节点14456数据节点start-all.sh命令的结果:admin@vm-sgd10:/usr/local$start-all.shstartingnamenode,loggingto/usr/local/hadoop/libexec/../logs/hadoop-admin-namenode-vm-10.v

hadoop - Cloudera Manager CDH Parcel 分发错误

我正在尝试使用CentOS6机器在Rackspace云上安装Hadoop集群。从cloudera管理器创建新集群时出现以下错误。有人可以帮忙吗。集群安装安装选定的包裹正在将选定的包裹下载并安装到集群中的所有主机上。CDH5.3.2-1.cdh5.3.2.p0.103个错误Errorwhendistributingtovm-cdh-cluster-3:[Errnosocketerror][Errno-2]Nameorservicenotknown.Errorwhendistributingtovm-cdh-cluster-1:[Errnosocketerror][Errno-2]Name

分发 Cloudera section vm-cdh-cluster cluster hadoop

hadoop - 如何将事件拆分为多个事件以将它们发送到多路复用扇出流

我们计划使用kafkaflume-ng集成(Flafka)，其中flume是kafka队列的消费者。Flume代理将接收文件列表命令及其输出，如下所示:root@host>[Command1][Output1]root@host>[Command2][Output2]该文件可能包含多个命令，并且一个命令的输出可能很大。我们需要拦截事件(也就是文件数据)，根据命令将事件拆分成多个事件。然后源会将流扇出到多个channel，将每个子事件发送到一个channel(使用多路复用)，每个接收器将命令信息存储到各自的Hive表。是否可以使用扇出流将一个事件拆分为多个事件？或者换句话说，我们可以在拦

复用送到拦截器 section channel hadoop hdfs bigdata flume flume-ng

hadoop - 在 spark yarn 集群中，容器如何工作取决于 RDD 分区的数量？

我有一个关于ApacheSpark(yarn集群)的问题虽然在这段代码中，创建了10个分区但是在yarncluster中，只需要3个contatinervalsc=newSparkContext(newSparkConf().setAppName("SparkCount"))valsparktest=sc.textFile("/spark_test/58GB.dat",10)valtest=sparktest.flatMap(line=>line.split("")).map(word=>(word,1))在sparkyarn集群中，容器如何工作取决于RDD分区的数量？*因为我只有一点

容器取决于 code section 读入 hadoop apache-spark hadoop-yarn rdd

maven - 如何配置 GIRAPH 1.1.0 pom.xml 使其与 HADOOP 2.6.0 一起工作？安装错误

我正在尝试将GIRAPH1.1.0添加到HADOOP2.6.0我必须以某种方式编辑pom.xml才能正确打包GIRAPH。我运行命令mvn-Phadoop_yarn-Dhadoop.version=2.6.0package我在行(1292)中编辑了默认的pom.xml文件:hadoop_2giraph-accumulogiraph-hbasegiraph-hcataloggiraph-hivegiraph-goragiraph-rexstergiraph-dist2.6.0但是当我运行它给出的命令时[INFO]ApacheGiraphParent....................

GIRAPH HADOOP ERROR module maven installation pom.xml

hadoop - HBase 未连接到 ZooKeeper

我正在努力让我的HBaseshell运行。它在主题行中抛出上述异常。我检查过hbase-site.xml与hadoop完美匹配。请帮忙。我挣扎了2天，有一个项目到期。我附上hadoop和hbase的两个xml文件。hbase-site.xmlhbase.rootdirhdfs://localhost:54310/hbasehbase.zookeeper.property.dataDir/home/hduser/zookeeperhbase.zookeeper.property.clientPort2222PropertyfromZooKeeper'sconfigzoo.cfg.Thep

ZooKeeper hadoop gt lt property hbase apache-zookeeper

java - import org.apache.hadoop 无法解析

我已经看到这个问题，但似乎没有任何修复对我有用。或者更有可能是我做错了，因为我对此很陌生。(在eclipse中工作)我收到以下行的错误Theimportorg.apache.hadoopcannotberesolved:importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.filecache.DistributedCache;importorg.apache.hadoop.fs.FileSystem;importorg.apache.hadoop.fs.Path;importorg.apache.hadoo

import apache hadoop jar java eclipse importerror

hadoop - OpenIMAJ 库中的 K-Means 聚类

我在机器学习和聚类分析方面不是很有经验，但我有以下问题:我有大约100kk-1000kk条数据，我无法一次将它们全部加载到内存中，我需要将其分成多个类(例如1-10k甚至100k类)以供进一步分析。为此，我选择了在OpenIMAJ库(FloatKMeans类)中实现的K-Means算法。我了解到K-Means算法可以分为2个阶段:学习阶段-我传递所有我必须创建/填充类(class)的数据分配阶段-在这里我可以询问集群给定数据属于哪个类我计划使用Hadoop减少阶段构建集群模型，我将一个接一个地接收数据片段(这就是为什么我不能一次将所有数据传递给算法的原因)我的问题是:OpenIMAJ实

OpenIMAJ K-Means code section hadoop machine-learning cluster-analysis

hadoop - 如何在 pig latin 中的 foreach 中使用过滤器运算符

我试图在foreach中使用FILTER运算符来过滤我的一些数据，但它抛出了一个错误。我正在使用以下查询:ctm_pm_v1_stg=LOAD'/datalake/uhc/ei/pi_ara/hive/warehouse/ctm_pm.db/ctm_pm_t1'USINGPigStorage('\u0001')AS(lob:chararray,day_phnno:chararray,eve_phnno:chararray,mbr_name:chararray,hic_no:chararray,contract_no:chararray,ctm_risk_category:chararr

运算符何在 chararray ctm code hadoop foreach filter apache-pig

mysql - Hive-1.1.0 在将数据插入创建的表时显示错误(使用 hadoop-2.5.1)

我成功地创建了表:CREATETABLEmovie_example(titleSTRING,idBIGINT,directorSTRING,yearBIGINT,genresARRAY)ROWFORMATDELIMITEDFIELDSTERMINATEDBY','COLLECTIONITEMSTERMINATEDBY'$'MAPKEYSTERMINATEDBY'#'LINESTERMINATEDBY'\n'STOREDASTEXTFILE;当我尝试使用以下方法向该表中插入数据时:LOADDATALOCALINPATH'//hiveExample.txt'OVERWRITEINTOTAB

时显 hadoop apache section mysql hive

106 107 108109110 111 112