POSTGRES_USER

postgresql - 如何从 Postgres 数据库到 Hadoop 序列文件？

我需要将数据从Postgres数据库获取到Accumulo数据库。我们希望使用序列文件来运行map/reduce作业来执行此操作，但不确定如何开始。由于内部技术原因，我们需要避免使用Sqoop。如果没有Sqoop，这是否可能？再一次，我真的不知道从哪里开始。我是否编写一个java类来将所有记录(数百万条)读入JDBC并以某种方式将其输出到HDFS序列文件？感谢任何输入!附言-我应该提到使用分隔文件是我们现在遇到的问题。我们的一些是包含定界符的长字符字段，因此无法正确解析。该字段甚至可能有一个选项卡。我们想从Postgres直接转到HDFS而无需解析。最佳答

postgresql Postgres 34 section avro hadoop accumulo

java - 错误 : org. apache.hadoop.security.AccessControlException : Permission denied: user=root, access=READ_EXECUTE,

我在CentOS6机器上使用的是hadoop-1.2.1版本，并且已经配置好，它运行成功，我还在Eclipsekepler中安装了hadoop的插件，但不幸的是我得到了一个权限被拒绝的错误，我有如图所示，我试图通过阅读许多博客来解决这个问题，但我仍然被困在那里..有人可以解决这个问题吗？最佳答案我从您的问题中了解到，我想您正在使用操作系统的“root”登录以启动Hadoop。我建议重新启动您的系统并从“Hadoop”(在用户列表中给出，例如root、Guest、Hadoop)登录，然后启动Hadoop。然后它就会工作。

AccessControlException READ_EXECUTE section Hadoop java eclipse

hadoop - 普通身份验证失败 : User yarn is not configured for any impersonation. impersonationUser:alluxio mapreduce 中的 root

Causedby:org.apache.thrift.transport.TTransportException:Plainauthenticationfailed:Useryarnisnotconfiguredforanyimpersonation.模拟用户:root当我使用alluxio在本地运行wordcount程序时它工作正常。我也通过了集成测试，但是当我使用alluxio客户端jar运行相同的Hadoop程序时它给我一个错误bin/hadoopjar/usr/lib/hadoop-mapreduce/hadoop-mapreduce-examples.jarwordcount

impersonationUser impersonation alluxio section hadoop mapreduce hadoop-yarn

postgresql - 如何将 Postgres(二进制或文本)转储文件导入 Spark 或 HDFS？

我想在Spark中使用Postgres(二进制或文本)转储文件，想知道如何导入它？我知道我们可以使用Sqoop将Postgres导入HDFS，并且我可以从Spark访问HDFS，但是如果我只有转储文件怎么办？我是否必须先将其恢复到Postgres数据库中？我宁愿不要。最佳答案使用pg_restore--data-only-tmy_tabledb.dump你应该得到制表符分隔的文本，其中包含一些注释和一些额外的命令，过滤掉你不需要的一切会很简单'不想将该文件写入HDFS。然后就是将该文件作为CSV文件从Spark或MapReduc

postgresql Postgres section 该文 hadoop apache-spark hdfs sqoop

hadoop - 全局变量 HADOOP_USER_NAME oozie？

有什么方法可以在oozie工作流中将HADOOP_USER_NAME声明为全局变量？实际上，我正在为我的项目创建多个shell操作，但为每个shell操作声明一个HADOOP_USER_NAME效率不高，这就是为什么我想知道在这种情况下是否可以使用全局变量，如果可以，我该如何继续它。..非常感谢您的帮助。这是我正在使用的代码HADOOP_USER_NAME*****Error[${wf:errorMessage(wf:lastErrorNode())}]${jobTracker}${nameNode}script1.shscript1.sh#script1.sh出于某种原因，我没有从H

HADOOP_USER_NAME hadoop lt gt shell oozie oozie-coordinator sqoop

postgresql - 在 Hortonworks 上部署 HAWQ 2.0 时主 postgres initdb 失败

我尝试部署HAWQ2.0，但无法让HAWQMaster运行。以下是错误日志:[gpadmin@hdps31hwxworker2hawqAdminLogs]$cat~/hawqAdminLogs/hawq_init_20160805.log20160805:23:00:10:050348hawq_init:hdps31hwxworker2:gpadmin-[INFO]:-Preparetodo'hawqinit'20160805:23:00:10:050348hawq_init:hdps31hwxworker2:gpadmin-[INFO]:-Youcanfindlogin:201608

上部 Hortonworks hawq hwxworker2 hawq_init postgresql hadoop hortonworks-data-platform

hadoop - 使用 --proxy-user、--keytab 和 --principal 参数在 hadoop kerberos 中提交 spark-submit

只是想得到澄清，如果spark-submit--keytab--principal&&--proxy-user参数可以共存吗？我们要求以真实的业务用户身份提交作业，但该用户在hadoopkdc中没有主体。每当同时使用proxy-user和kerberosprincipal时，我都会遇到异常。17/02/0913:51:43INFODFSClient:CreatedHDFS_DELEGATION_TOKENtoken379foratlason10.12.118.92:8020Exceptioninthread"main"java.io.IOException:java.lang.refl

hadoop spark-submit apache scala spark apache-spark kerberos

hadoop - org.apache.hadoop.security.AccessControlException : Permission denied: user=test-user, access=EXECUTE, inode ="system":hadoop:test-user:rwx------

以前测试用户曾经驻留在连接丢失的边缘服务器上。因此，我们重建了边缘服务器并一直在尝试启动并运行它，但我一直收到以下错误。Jobinitializationfailed:org.apache.hadoop.security.AccessControlException:org.apache.hadoop.security.AccessControlException:Permissiondenied:user=test-user,access=EXECUTE,inode="system":hadoop:test-user:rwx------atsun.reflect.GeneratedC

hadoop test-user apache java

postgresql - Sqoop 使用 --schema 参数导出到 postgres

在使用Sqoop导出数据到postgresql时，有什么方法可以提及不同的模式吗？基于URLhttp://sqoop.apache.org/docs/1.4.4/SqoopUserGuide.html，我需要使用----schema这很奇怪，但它不起作用。我也尝试使用--schema，但结果仍然相同。----schema适用于list-tables命令，但不适用于export命令。任何帮助将不胜感激。最佳答案终于成功了。为了使用“----schema”，我们需要在最后而不是中间提供该选项。所以这个会起作用:--connectjd

postgresql postgres code section input export sqoop

java - dfs.data.dir : Failed to set permissions of path:\tmp\hadoop-user\dfs\data to 0755 中的无效目录

我是hadoop框架的新手，目前我正在处理大数据项目，在Windows7中使用cygwin、hadoop-0.19.1、eclipse-3.3.1(Europa)。现在我正在尝试从hadoop-0.19进行更改.1到hadoop-1.2.1version.i如下配置hadoop-1.2.1核心站点.xml:fs.default.namehdfs://localhost:9100hdfs.xmldfs.replication1mapred-site.xmlmapred.job.trackerlocalhost:9101但是我在启动数据节点时出错，如下所示$bin/hadoopdatano

data hadoop-user hadoop gt lt java eclipse cygwin

162 163 164165166 167 168