草庐IT

Hadoop-Solr

全部标签

hadoop - Sqoop:创建链接失败并出现数字格式异常

我正在尝试在SqoopforHadoop中使用generic-jdbc-connector创建一个链接。但是,当我尝试获取数字格式异常时:sqoop:000>showconnector+----+------------------------+---------+------------------------------------------------------+----------------------+|Id|Name|Version|Class|SupportedDirections|+----+------------------------+---------+-

hadoop - Apache kylin cube 失败 "no counters for job"

使用kylin1.5.4,当我构建立方体时,它在第3步失败,日志显示“没有工作计数器”。它也没有获取配置单元表的基数。当我创建一个模型或多维数据集时,它会抛出无法采取行动的错误,但是当我关闭json页面时,它们就会被创建。它不获取日期分区列,抛出在日志中找不到的列。非常感谢任何帮助或见解。 最佳答案 这有点晚了,但我在当前项目中也遇到了这个问题,我得到了“没有工作计数器”错误。问题是我们在Hive中使用ORC表。我们只是将数据从ORC表移至新的TEXTFILE表,并使用新表在Kylin多维数据集中设置所有内容,一切正常。

java - 无法执行基本的 Hadoop Mapreduce Wordcount 示例

我正在尝试运行WordCountexample.但是我在编译程序时遇到了问题。我得到错误:error:packageorg.apache.hadoop.mapreddoesnotexist执行后:javac-classpath/usr/local/hadoop/share/hadoop/common/hadoop-common-2.7.3.jar-dwordcount_classesWordCount.java我使用这个tutorial设置了hadoop.我也在stackoverflow上查了一下:question并在/usr/local/hadoop中执行bin/hadoopclas

hadoop - 在 Spark 中,如何在没有 RDD 的情况下在 Hadoop 上写入文件?

SparkRDD具有saveAsTxtFile函数。但是,我如何打开一个文件并将一个简单的字符串写入hadoop存储?valsparkConf:SparkConf=newSparkConf().setAppName("example")valsc:SparkContext=newSparkContext(sparkConf)sc.hadoopConfiguration.set("fs.s3n.awsAccessKeyId","...")sc.hadoopConfiguration.set("fs.s3n.awsSecretAccessKey","...")vallines:RDD[St

hadoop - HBase聚合、Get And Put操作、Bulk操作

我想知道如何映射键的值。我知道它可以通过Get然后Put操作来完成。有没有其他方法可以有效地做到这一点?'checkAndPut'不是很有帮助可以用类似的东西来完成吗:(key,value)=>value+g()我读过HBase权威指南这本书,似乎MapReduceJob解释为HBase之上的Put/Get操作。这是否意味着它不是“批量操作”(因为它是每个键的操作)?Spark与此有什么关系? 最佳答案 HBase具有扫描(1)以检索多行;和MapReduce作业可以并且确实使用此命令(2)。对于HBase,“批量”主要是[或仅]是

hadoop - hadoop错误:util.NativeCodeLoader(hdfs dfs -ls不起作用!)

我已经看到很多人在安装hadoop时遇到问题。我经历了所有相关的stackoverflow问题,但无法解决问题。问题是:hdfsdfs-ls16/09/2709:43:42WARNutil.NativeCodeLoader:Unabletoloadnative-hadooplibraryforyourplatform...usingbuiltin-javaclasseswhereapplicablels:`.':Nosuchfileordirectory我正在使用ubuntu16.04,并且从Apache镜像下载了hadoop稳定版2.7.2:http://apache.spinell

file - Hadoop Map Reduce - 读取 HDFS 文件 - FileAlreadyExists 错误

我是Hadoop新手。我正在尝试使用以下代码读取HDFS上的现有文件。配置似乎文件和文件路径也是正确的。-publicstaticclassMapextendsMapper{privatestaticTextf1,f2,hdfsfilepath;privatestaticHashMap>friendsData=newHashMap();publicvoidsetup(Contextcontext)throwsIOException{Configurationconf=context.getConfiguration();Pathpath=newPath("hdfs://cshadoop

hadoop - 在hadoop中保存和访问类似表的数据结构

我想使用MapReduce编程在HDFS中保存和访问类似表的数据结构。此DS的部分内容如下图所示。这个DS有几万列和几百行,所有节点都应该可以访问它。我的问题是:如何将此DS保存在HDFS中并使用MapReduce编程访问它。我应该使用数组吗?(或Hive表?或Hbase?)谢谢。 最佳答案 HDFS是分布式文件系统,它将您的大文件存储在分布式服务器中。您可以使用命令将您的文件从本地系统复制到HDFShadoopfs-copyFromLocal/source/local/pathdestincation/hdfs/path复制完成后

hadoop - Greenplum报错-输入路径不存在

我们有小型gpdb集群。当我尝试使用来自gpdbmaster的'gphdfs'协议(protocol)读取外部表时。环境产品版本关键Greenplum(GPDB)4.3.8.2操作系统Centos6.5获取错误:prod=#select*fromext_table;ERROR:externaltablegphdfsprotocolcommandendedwitherror.16/10/0514:42:51WARNutil.NativeCodeLoader:Unabletoloadnative-hadooplibraryforyourplatform...usingbuiltin-jav

amazon-web-services - 如何使用 Hadoop 2.6 启动 Spark EC2 集群

我正在尝试使用Hadoop2.6在Spark1.6.1上运行SparkEC2集群-这是我尝试过的:./spark-ec2-i~/.ssh/***.pem\--instance-profile-name***\-k***\--region=us-east-1\--instance-type=m3.xlarge\-s2\--copy-aws-credentials\launchtest-cluster不过,这次安装的是Hadoop1.0。所以我在上面的命令中添加了以下选项:--hadoop-major-version=2\但是,我很快意识到,为了正确运行我的应用程序,我需要Hadoop2.