postgre

hadoop - 如何将 Postgres "Text"数据类型加载到 HIVE 中

我有一个包含文本列(详细信息)的postgress表。我已在Hive中将detail声明为STRING。当我尝试从SQOOP或SPark导入它时，它已成功导入。但是，我缺少详细信息列中可用的大量数据，并且在配置单元表中创建了许多空行。谁能帮我解决这个问题？例如:详细列有以下数据line1sdhfdsfdsfdsdfdsfdsfsline2jbdfvdfffdkjbfdjbdsjbfdsdsfsdfbdsfdsdfdsdsfdsfdsdsfdsdskjnfdssdjfbdsfdsdsfds只有“line1sdhfdsfdsfdsdfdsfdsfs”被导入到配置单元表中。我可以看到剩余行的

postgresql - Microsoft Azure HDInsight Ambari Sqoop 和 Postgres

尝试将数据从postgres导入MicrosoftAzureHDInsigt上的hdfs。如果列出dbs，现在我从一个非常简单的命令开始sqooplist-databases--connectjdbc.postgresql://xx.xxx.xxx.xxx:yyyy--usernamemyuser--passwordmypassword我得到以下错误ERRORtool.BaseSqoopTool:Goterrorcreatingdatabasemanager:java.io.IOException:Nomanagerforconnectstring:jdbc.postgresql://

postgresql Microsoft apache Sqoop azure hadoop azure-hdinsight

postgresql - 用于 spark/hadoop 的 Postgres 适配器增加了什么值(value)？

我不是HDFSNerd，但来自传统的RDMS背景，我正在接触Hadoop和Spark等新技术。现在，当涉及到对Spark数据进行SQL查询时，我正在研究我的选择。我意识到Spark天生就支持SQL查询。然后我遇到了这个链接https://www.enterprisedb.com/news/enterprisedb-announces-new-apache-spark-connecter-speed-postgres-big-data-processing我正在努力弄清这一点。如果我理解正确的话。数据仍然以HDFS格式存储，但Postgres连接器用作查询引擎？如果是这样，在存在现有查询

适配 postgresql section Postgres enterprisedb apache-spark hadoop hdfs

hadoop - 可以在没有 Postgres 的情况下使用 PostGIS 库吗？

是否可以在没有Postgres的情况下使用PostGIS库？我想将这些地理空间函数与Hadoop(MR、HBase、Hive)结合使用。有什么想法吗？提前致谢。最佳答案 PostGIS提供了一个liblwgeomlibrary，这是一个轻量级的几何库，独立于PostgreSQL。SpatiaLiteusesthislibraryforspatialfunctionswithSQLite.liblwgeom可以使用theseinstructions单独编译. 关于hadoop-可以在没有

Postgres PostGIS section liblwgeom noreferrer hadoop

hadoop - 在 postgres 中插入数据时，Reduce 代码随机卡住

我们有一个用Java编写的mapreduce代码，它读取多个小文件(比如10k+)，在驱动程序中转换为单个avro文件，reducer将一堆减少的记录插入到postgres数据库中。这个过程每小时发生一次。但是有多个mapreduce作业同时运行，处理不同的avro文件并为每个作业打开不同的数据库连接。所以有时(非常随机)所有任务都卡在reducer阶段，但出现以下异常-"C2CompilerThread0"daemonprio=10tid=0x00007f78701ae000nid=0x6db5waitingoncondition[0x0000000000000000]java.la

卡住 postgres java lang postgresql hadoop mapreduce postgresql-9.1

postgresql - 如何从 Postgres 数据库到 Hadoop 序列文件？

我需要将数据从Postgres数据库获取到Accumulo数据库。我们希望使用序列文件来运行map/reduce作业来执行此操作，但不确定如何开始。由于内部技术原因，我们需要避免使用Sqoop。如果没有Sqoop，这是否可能？再一次，我真的不知道从哪里开始。我是否编写一个java类来将所有记录(数百万条)读入JDBC并以某种方式将其输出到HDFS序列文件？感谢任何输入!附言-我应该提到使用分隔文件是我们现在遇到的问题。我们的一些是包含定界符的长字符字段，因此无法正确解析。该字段甚至可能有一个选项卡。我们想从Postgres直接转到HDFS而无需解析。最佳答

postgresql Postgres 34 section avro hadoop accumulo

postgresql - 如何将 Postgres(二进制或文本)转储文件导入 Spark 或 HDFS？

我想在Spark中使用Postgres(二进制或文本)转储文件，想知道如何导入它？我知道我们可以使用Sqoop将Postgres导入HDFS，并且我可以从Spark访问HDFS，但是如果我只有转储文件怎么办？我是否必须先将其恢复到Postgres数据库中？我宁愿不要。最佳答案使用pg_restore--data-only-tmy_tabledb.dump你应该得到制表符分隔的文本，其中包含一些注释和一些额外的命令，过滤掉你不需要的一切会很简单'不想将该文件写入HDFS。然后就是将该文件作为CSV文件从Spark或MapReduc

postgresql Postgres section 该文 hadoop apache-spark hdfs sqoop

postgresql - 在 Hortonworks 上部署 HAWQ 2.0 时主 postgres initdb 失败

我尝试部署HAWQ2.0，但无法让HAWQMaster运行。以下是错误日志:[gpadmin@hdps31hwxworker2hawqAdminLogs]$cat~/hawqAdminLogs/hawq_init_20160805.log20160805:23:00:10:050348hawq_init:hdps31hwxworker2:gpadmin-[INFO]:-Preparetodo'hawqinit'20160805:23:00:10:050348hawq_init:hdps31hwxworker2:gpadmin-[INFO]:-Youcanfindlogin:201608

上部 Hortonworks hawq hwxworker2 hawq_init postgresql hadoop hortonworks-data-platform

postgresql - Sqoop 使用 --schema 参数导出到 postgres

在使用Sqoop导出数据到postgresql时，有什么方法可以提及不同的模式吗？基于URLhttp://sqoop.apache.org/docs/1.4.4/SqoopUserGuide.html，我需要使用----schema这很奇怪，但它不起作用。我也尝试使用--schema，但结果仍然相同。----schema适用于list-tables命令，但不适用于export命令。任何帮助将不胜感激。最佳答案终于成功了。为了使用“----schema”，我们需要在最后而不是中间提供该选项。所以这个会起作用:--connectjd

postgresql postgres code section input export sqoop

postgresql - 如何用Hadoop实时处理Postgres数据库？

我有一个用于生产服务器的Postgres数据库，需要使用Hadoop对其进行定期分析。Hadoop中的每个查询都应基于Postges数据库中的最新版本。不同步是可以接受的，但应该只延迟几分钟。如何在Hadoop中进行这种近乎实时的数据分析？最佳答案是的，可以通过配置StorageHandler来实现Hive的API实现。StorageHandler的概念只是将外部表元数据单独存在于Hivemetastore中，实际的数据存储系统将是外部数据源。其中hive表元数据将包含外部数据库表的详细信息，以及通常的列和格式详细信息。每当您向

何用 postgresql section Hive https hadoop bigdata

43 44 454647 48 49