Hdfs

r - centos无法安装rhdfs

$sudoRCMDINSTALLrhdfs*installingtolibrary‘/usr/lib64/R/library’*installing*source*package‘rhdfs’...**R**inst**preparingpackageforlazyloading**help***installinghelpindicesconvertinghelpforpackage‘rhdfs’findingHTMLlinks...donehdfs-file-accesshtmlhdfs-file-maniphtmlhdfs.defaultshtmlhdfs.file-levelh

ubuntu - hdfs namenode -格式错误(没有那个文件或目录)

尝试在我的ubuntu机器上本地运行hadoop2.3.0，尝试格式化hdfs名称节点，我收到以下错误:/usr/local/hadoop/hadoop-hdfs-project/hadoop-hdfs/src/main/bin/hdfs:line34:/usr/local/hadoop/hadoop-hdfs-project/hadoop-hdfs/src/main/bin/../libexec/hdfs-config.sh:Nosuchfileordirectory/usr/local/hadoop/hadoop-hdfs-project/hadoop-hdfs/src/main/

namenode ubuntu hadoop code hdfs

hadoop - -Dpig.additional.jars 包含 HDFS 和本地文件系统上的文件

如何将jar从我的本地文件系统和Hadoop分布式文件系统(HDFS)传递到-Dpig.additional.jars？假设我有两个jar:/home/local/myjar1.jarhdfs:///user/notlocal/myjar2.jar第一个jar在我的本地目录中。第二个jar在HDFS中。我想在Hadoop集群上运行test_script.pig1并将以上两个jar包含在-Dpig.additional.jars中。pig-xmapreduce-ftest_script.pig1-Dpig.additional.jars=/home/local/myjar1.jar:hd

additional hadoop code jar myjar mapreduce apache-pig

hadoop - 使用 http 源在具有相同扩展名的 HDFS 中保存文件(不同扩展名)

我需要创建一条数据管道，其中源是HTTP，接收器是HDFS来发布数据和文件。问题是我想用与最初发送到HTTP源相同的扩展名保存文件。我用下面的脚本创建了一个流流创建httpToHdfs--defination"http|HDFS"--deploy但是当我以.gzip/.xml/.json格式上传文件时，它会将文件存储在.txt中我只想通过HTTP源复制HDFS中的文件，springxd可以吗？最佳答案 hdfs接收器用于将基于文本的流写入hdfs。它采用名为--fileExtension的选项，您可以在其中指定文件扩展名。虽然这个

扩展名 hadoop section code spring-xd

hadoop - 如何从 hdfs 符号链接(symbolic link)读取多个文本文件

我正在尝试从spark中读取hdfs符号链接(symboliclink)的多个部分文件。如果路径是物理路径，我可以使用通配符(*)从路径中读取多个文件例如sparkContext.textFile(/some/path/file_123321_00/part-r-000*)但是我已经在hdfs上创建了指向这个名为“fullset”的文件夹的符号链接(symboliclink)。当我使用/some/path/fullset/part-r-000*它无法检测到任何路径。我在两条路径上都尝试了hadoopfs-ls。第一个可以工作，但是带有符号链接(symboliclink)的一个不能按预期

symbolic 本文 section code hadoop apache-spark hdfs symlink mapr

hadoop - 为什么匿名 FTP 到 HDFS DistCp 不起作用？

我尝试使用以下命令将FTP数据复制到HDFS，hadoopdistcpftp://ftp.ncdc.noaa.gov/pub/data/noaa/1901/data/noaa/1901/这是我收到的错误15/03/0411:29:13INFOtools.DistCp:InputOptions:DistCpOptions{atomicCommit=false,syncFolder=false,deleteMissing=false,ignoreFailures=false,maxMaps=20,sslConfigurationFile='null',copyStrategy='unifo

匿名 hadoop apache DistCp ftp hdfs anonymous-users

r - 将 Hive 表从 HDFS 移动到 Amazon Redshift

我尝试将通过连接4-5个数据集创建的Hive表传输到Redshift。这个过程应该如何实现？我们在边缘节点上有可用的R。Hive表必须先传输到S3，然后从s3传输到Redshift。这是唯一的方法吗？是否可以使用R，即使用RHive包将我的数据集从HDFS移动到R，然后将该数据集从R移动到Redshift？最佳答案您可以使用RJDBC连接到Redshift(Redshift是pgsql)。因此，您可以使用从配置单元读取一行，并使用R中的RJDBC将其加载到Redshift。您创建1000个或更多的批处理并插入Redshift。如

Redshift Amazon section stackoverflow r hadoop hive amazon-redshift

hadoop - 通过 php 运行简单的 Hadoop 命令

当我运行通过php包装的简单hadoopls命令时，它没有执行。有什么建议吗？猫foo.php:#!/usr/bin/envphp当我运行它时没有任何反应:phpfoo.php 最佳答案 echoexec("hadoopfs-ls/");你需要告诉php对结果做些什么! 关于hadoop-通过php运行简单的Hadoop命令，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/questions/2897

hadoop section php code hdfs

hadoop - HBase 映射/减少依赖问题

概览我基于resteasy框架开发了一个Restapi服务。在服务中，我将数据存储到HBase数据库中。然后，执行由某些条件触发的map/reduce过程(例如插入一条记录)。需要在Map类中，我导入了一些第三方库。我不想将这些库打包到war文件中。TableMapReduceUtil.initTableMapperJob(HBaseInitializer.TABLE_DATA,//inputHBasetablenamescan,//ScaninstancetocontrolCFandattributeselectionLuceneMapper.class,//mappernull,/

hadoop HBase section hdfs Path mapreduce resteasy hadoop2

hadoop - 从其他 PC 下载 Hadoop 数据

我在一台PC上安装了Hadoopv2.6，运行的是UbuntuOS14.04。我使用Hadoop-put命令将大量非结构化数据添加到HDFS。谁能告诉我如何使用Hadoop提供的Web用户界面从另一台不在Hadoop集群中的PC下载这些数据？我可以在浏览器地址栏输入其他PC的数据(HDFS服务器的IP地址):端口号像这样:192.168.x.x:50070问题是，我无法下载数据，因为它给出错误“网页不可用”。我也试过其他浏览器，但还是不行。最佳答案端口50070是默认名称节点端口。您应该尝试端口14000，这是默认的HttpFS

hadoop section strong hdfs remote-access

31 32 333435 36 37