postgresql主备

postgresql - 在不损失 Hadoop 并行处理能力的情况下，将 SAS 与 Hadoop 集成的最佳方法是什么

我想了解SAS和Hadoop之间的集成。据我了解，像procsql这样的SAS进程只能对SAS数据集起作用，我不能对hadoop节点上的文本文件发出procsql。这是正确的吗？如果是，那么我需要使用一些ETL作业首先将数据从HDFS中取出并将其转换为SAS表。但如果我这样做，我将失去Hadoop的并行处理能力，对吗？那么集成SAS和Hadoop并仍然使用Hadoop的并行处理能力的理想方式是什么？我知道您可以从SAS内部调用mapreduce作业，但是mapreduce作业可以用SAS编写吗？我认为不是。最佳答案 SAS全局论坛

postgresql - 如何将 Postgres(二进制或文本)转储文件导入 Spark 或 HDFS？

我想在Spark中使用Postgres(二进制或文本)转储文件，想知道如何导入它？我知道我们可以使用Sqoop将Postgres导入HDFS，并且我可以从Spark访问HDFS，但是如果我只有转储文件怎么办？我是否必须先将其恢复到Postgres数据库中？我宁愿不要。最佳答案使用pg_restore--data-only-tmy_tabledb.dump你应该得到制表符分隔的文本，其中包含一些注释和一些额外的命令，过滤掉你不需要的一切会很简单'不想将该文件写入HDFS。然后就是将该文件作为CSV文件从Spark或MapReduc

postgresql Postgres section 该文 hadoop apache-spark hdfs sqoop

postgresql - 在 Hortonworks 上部署 HAWQ 2.0 时主 postgres initdb 失败

我尝试部署HAWQ2.0，但无法让HAWQMaster运行。以下是错误日志:[gpadmin@hdps31hwxworker2hawqAdminLogs]$cat~/hawqAdminLogs/hawq_init_20160805.log20160805:23:00:10:050348hawq_init:hdps31hwxworker2:gpadmin-[INFO]:-Preparetodo'hawqinit'20160805:23:00:10:050348hawq_init:hdps31hwxworker2:gpadmin-[INFO]:-Youcanfindlogin:201608

上部 Hortonworks hawq hwxworker2 hawq_init postgresql hadoop hortonworks-data-platform

postgresql - 从 10 亿行 GreenPlum DB 中缓慢选择

我在GreenPlum上创建了下表:CREATETABLEdata."CDR"(mcctext,mnctext,lactext,celltext,from_numbertext,to_numbertext,cdr_timetimestampwithouttimezone)WITH(OIDS=FALSE,appendonly=true,orientation=column,compresstype=quicklz,compresslevel=1)DISTRIBUTEDBY(from_number);我已将10亿行加载到此表，但每个查询都非常慢。我需要对所有字段(不仅是一个)进行查询，我可

postgresql 缓慢 section from_number number hadoop cassandra greenplum bigdata

postgresql - Sqoop 使用 --schema 参数导出到 postgres

在使用Sqoop导出数据到postgresql时，有什么方法可以提及不同的模式吗？基于URLhttp://sqoop.apache.org/docs/1.4.4/SqoopUserGuide.html，我需要使用----schema这很奇怪，但它不起作用。我也尝试使用--schema，但结果仍然相同。----schema适用于list-tables命令，但不适用于export命令。任何帮助将不胜感激。最佳答案终于成功了。为了使用“----schema”，我们需要在最后而不是中间提供该选项。所以这个会起作用:--connectjd

postgresql postgres code section input export sqoop

hadoop - 使用 Sqoop 导出到 Postgresql ltree

要将我的数据从HDFS导出到Postgres，我使用的是Sqoop(1.3.0-cdh3u4)。主要问题是我有一列ltree类型。ERRORorm.ClassWriter:CannotresolveSQLtype1111ERRORorm.ClassWriter:NoJavatypeforSQLtype1111forcolumnpath即使使用--map-column-java强制字符串解析，Sqoop也无法导出。java.io.IOException:org.postgresql.util.PSQLException:ERROR:column"path"isoftypeltreebut

Postgresql hadoop section code type sqoop

postgresql - 如何用Hadoop实时处理Postgres数据库？

我有一个用于生产服务器的Postgres数据库，需要使用Hadoop对其进行定期分析。Hadoop中的每个查询都应基于Postges数据库中的最新版本。不同步是可以接受的，但应该只延迟几分钟。如何在Hadoop中进行这种近乎实时的数据分析？最佳答案是的，可以通过配置StorageHandler来实现Hive的API实现。StorageHandler的概念只是将外部表元数据单独存在于Hivemetastore中，实际的数据存储系统将是外部数据源。其中hive表元数据将包含外部数据库表的详细信息，以及通常的列和格式详细信息。每当您向

何用 postgresql section Hive https hadoop bigdata

postgresql - Hadoop 适用于此吗？

我们有一些Postgres查询需要6到12个小时才能完成，并且想知道Hadoop是否适合更快地完成它。我们有(2)个64核服务器和256GBRAM可供Hadoop使用。我们正在运行PostgreSQL9.2.4。Postgres只在一台服务器上使用一个内核来进行查询，所以我想知道Hadoop是否可以将查询速度提高大约128倍，同时减去开销。我们有两组数据，每组都有数百万行。设置一:idcharactervarying(20),a_latdoubleprecision,a_longdoubleprecision,b_latdoubleprecision,b_longdoublepreci

postgresql Hadoop long precision 0.000278

postgresql - 如何将数据从 PostgreSQL 导入到 Hadoop？

我只是Hadoop的初学者，我的一所大学要求我帮助将一些PostgreSQL表迁移到Hadoop。由于我没有太多使用PostgreSQL的经验(虽然我知道数据库)，我不确定什么是进行此迁移的最佳方式。我的想法之一是将表导出为gson数据，然后从Hadoop中处理它们，如本例所示:http://www.codeproject.com/Articles/757934/Apache-Hadoop-for-Windows-Platform.有没有更好的方法将数据(表和数据库)从PostgreSQL导入到Hadoop？最佳答案 Sqoop(

postgresql section Hadoop gson

postgresql - 在 Docker 中使用 Sqoop 导入 PostgreSQL

我的本地机器(Windows)上有一个PostgreSQL数据库，我想使用ApacheSqoop将它导入到我的Hortonworks沙箱中。虽然像this听起来不错，复杂的因素是我的Sandbox位于Docker容器中，所以像sqooplist-tables--connectjdbc:postgresql://127.0.0.1/ambari--usernameambari-P这样的语句似乎遇到身份验证错误。我认为问题出在尝试从docker容器内部连接到本地主机。我看了thispost关于从容器内连接到MySQL数据库和thisone尝试改用PostgreSQL，但到目前为止还没有

postgresql code section postgres hadoop docker sqoop hortonworks-sandbox