草庐IT

POSTGRES_USER

全部标签

postgresql - 如何从 Postgres 数据库到 Hadoop 序列文件?

我需要将数据从Postgres数据库获取到Accumulo数据库。我们希望使用序列文件来运行map/reduce作业来执行此操作,但不确定如何开始。由于内部技术原因,我们需要避免使用Sqoop。如果没有Sqoop,这是否可能?再一次,我真的不知道从哪里开始。我是否编写一个java类来将所有记录(数百万条)读入JDBC并以某种方式将其输出到HDFS序列文件?感谢任何输入!附言-我应该提到使用分隔文件是我们现在遇到的问题。我们的一些是包含定界符的长字符字段,因此无法正确解析。该字段甚至可能有一个选项卡。我们想从Postgres直接转到HDFS而无需解析。 最佳答

java - 错误 : org. apache.hadoop.security.AccessControlException : Permission denied: user=root, access=READ_EXECUTE,

我在CentOS6机器上使用的是hadoop-1.2.1版本,并且已经配置好,它运行成功,我还在Eclipsekepler中安装了hadoop的插件,但不幸的是我得到了一个权限被拒绝的错误,我有如图所示,我试图通过阅读许多博客来解决这个问题,但我仍然被困在那里..有人可以解决这个问题吗? 最佳答案 我从您的问题中了解到,我想您正在使用操作系统的“root”登录以启动Hadoop。我建议重新启动您的系统并从“Hadoop”(在用户列表中给出,例如root、Guest、Hadoop)登录,然后启动Hadoop。然后它就会工作。

hadoop - 普通身份验证失败 : User yarn is not configured for any impersonation. impersonationUser:alluxio mapreduce 中的 root

Causedby:org.apache.thrift.transport.TTransportException:Plainauthenticationfailed:Useryarnisnotconfiguredforanyimpersonation.模拟用户:root当我使用alluxio在本地运行wordcount程序时它工作正常。我也通过了集成测试,但是当我使用alluxio客户端jar运行相同的Hadoop程序时它给我一个错误bin/hadoopjar/usr/lib/hadoop-mapreduce/hadoop-mapreduce-examples.jarwordcount

postgresql - 如何将 Postgres(二进制或文本)转储文件导入 Spark 或 HDFS?

我想在Spark中使用Postgres(二进制或文本)转储文件,想知道如何导入它?我知道我们可以使用Sqoop将Postgres导入HDFS,并且我可以从Spark访问HDFS,但是如果我只有转储文件怎么办?我是否必须先将其恢复到Postgres数据库中?我宁愿不要。 最佳答案 使用pg_restore--data-only-tmy_tabledb.dump你应该得到制表符分隔的文本,其中包含一些注释和一些额外的命令,过滤掉你不需要的一切会很简单'不想将该文件写入HDFS。然后就是将该文件作为CSV文件从Spark或MapReduc

hadoop - 全局变量 HADOOP_USER_NAME oozie?

有什么方法可以在oozie工作流中将HADOOP_USER_NAME声明为全局变量?实际上,我正在为我的项目创建多个shell操作,但为每个shell操作声明一个HADOOP_USER_NAME效率不高,这就是为什么我想知道在这种情况下是否可以使用全局变量,如果可以,我该如何继续它。..非常感谢您的帮助。这是我正在使用的代码HADOOP_USER_NAME*****Error[${wf:errorMessage(wf:lastErrorNode())}]${jobTracker}${nameNode}script1.shscript1.sh#script1.sh出于某种原因,我没有从H

postgresql - 在 Hortonworks 上部署 HAWQ 2.0 时主 postgres initdb 失败

我尝试部署HAWQ2.0,但无法让HAWQMaster运行。以下是错误日志:[gpadmin@hdps31hwxworker2hawqAdminLogs]$cat~/hawqAdminLogs/hawq_init_20160805.log20160805:23:00:10:050348hawq_init:hdps31hwxworker2:gpadmin-[INFO]:-Preparetodo'hawqinit'20160805:23:00:10:050348hawq_init:hdps31hwxworker2:gpadmin-[INFO]:-Youcanfindlogin:201608

hadoop - 使用 --proxy-user、--keytab 和 --principal 参数在 hadoop kerberos 中提交 spark-submit

只是想得到澄清,如果spark-submit--keytab--principal&&--proxy-user参数可以共存吗?我们要求以真实的业务用户身份提交作业,但该用户在hadoopkdc中没有主体。每当同时使用proxy-user和kerberosprincipal时,我都会遇到异常。17/02/0913:51:43INFODFSClient:CreatedHDFS_DELEGATION_TOKENtoken379foratlason10.12.118.92:8020Exceptioninthread"main"java.io.IOException:java.lang.refl

hadoop - org.apache.hadoop.security.AccessControlException : Permission denied: user=test-user, access=EXECUTE, inode ="system":hadoop:test-user:rwx------

以前测试用户曾经驻留在连接丢失的边缘服务器上。因此,我们重建了边缘服务器并一直在尝试启动并运行它,但我一直收到以下错误。Jobinitializationfailed:org.apache.hadoop.security.AccessControlException:org.apache.hadoop.security.AccessControlException:Permissiondenied:user=test-user,access=EXECUTE,inode="system":hadoop:test-user:rwx------atsun.reflect.GeneratedC

postgresql - Sqoop 使用 --schema 参数导出到 postgres

在使用Sqoop导出数据到postgresql时,有什么方法可以提及不同的模式吗?基于URLhttp://sqoop.apache.org/docs/1.4.4/SqoopUserGuide.html,我需要使用----schema这很奇怪,但它不起作用。我也尝试使用--schema,但结果仍然相同。----schema适用于list-tables命令,但不适用于export命令。任何帮助将不胜感激。 最佳答案 终于成功了。为了使用“----schema”,我们需要在最后而不是中间提供该选项。所以这个会起作用:--connectjd

java - dfs.data.dir : Failed to set permissions of path:\tmp\hadoop-user\dfs\data to 0755 中的无效目录

我是hadoop框架的新手,目前我正在处理大数据项目,在Windows7中使用cygwin、hadoop-0.19.1、eclipse-3.3.1(Europa)。现在我正在尝试从hadoop-0.19进行更改.1到hadoop-1.2.1version.i如下配置hadoop-1.2.1核心站点.xml:fs.default.namehdfs://localhost:9100hdfs.xmldfs.replication1mapred-site.xmlmapred.job.trackerlocalhost:9101但是我在启动数据节点时出错,如下所示$bin/hadoopdatano