草庐IT

postgresql-9.6

全部标签

postgresql - 从 PostgreSQL 到 Cassandra - 不支持聚合函数

我需要你的建议。我有一个在PostgreSQL上运行的应用程序,但它需要很长时间才能恢复数据。我想使用Cassandra,但注意到CQL不支持聚合。这对Hadoop来说是可能的还是我完全走错了路?此外,所有日期都存储在Epoch中,CQL无法转换它们。将在PostGreSQL上运行的应用程序转换为Cassandra的最佳方法是什么?感谢您的任何建议。 最佳答案 Cassandra在2.2中引入了聚合函数CASSANDRA-4914.使用标准(内置)函数的文档是here用于创建自定义聚合函数的是here.

postgresql - 关于 hawq pxf 访问 hdfs 上的文件数据

在我部署了hdfs、mapreduce、hawq、pxf和ambari之后,我使用impala-tpcds-kits在hdfs上生成了大约10G数据。但是当我用用户postgres登录Postgres时,我不能使用命令行CREATEEXTERNALTABLE来索引hdfs上的数据。当我使用psqlhelp命令时,没有关键字CREATEEXTERNALTABLE。不知道为什么?Lastlogin:ThuAug2515:08:152016from192.168.1.50[root@hadoop-m-21~]#supostgresbash-4.1$psqlpsql(8.4.20)Type"h

postgresql - 大量导出时出现 Sqoop PSQLException "Sorry, too many clients already"

当从HDFS导出大型(超过200万行)表到Postgres时,我看到Sqoop抛出PSQLException“抱歉,客户端已经太多了”。我有几张较小的table(约300万张),它们似乎运行良好。即使大表出现故障,我的postgres表中似乎仍然有大约200万行,但我猜这只是来自那些没有死的worker,因为他们首先获得了其中一个连接。我的Postgres表配置为允许300个max_connections,并且有大约70个连接始终来自其他应用程序,因此SQOOP应该有大约230个可供使用。我尝试在我的SQOOP导出命令中将--num-mappers切换为2-8,但这似乎并没有太大的区别

postgresql - 将 postgresql 数组导入配置单元

我一直在使用Sqoop在Postgresql表和Hive之间移动数据。但是显然Sqoop不支持Postgresql数组类型。 最佳答案 Postgresql有一个名为array_to_string的函数。您可以利用它来将数组转换为字符串。为了说明,这是postgresql中的表:=#select*fromalbums;id|album_id|names-----------+-------+-----123|{1,2,3,4}|test(1row)=#如您所见,album_id具有数组类型,更具体地说是一个整数数组。现在,要从名为m

postgresql - 如何从 Postgres 数据库到 Hadoop 序列文件?

我需要将数据从Postgres数据库获取到Accumulo数据库。我们希望使用序列文件来运行map/reduce作业来执行此操作,但不确定如何开始。由于内部技术原因,我们需要避免使用Sqoop。如果没有Sqoop,这是否可能?再一次,我真的不知道从哪里开始。我是否编写一个java类来将所有记录(数百万条)读入JDBC并以某种方式将其输出到HDFS序列文件?感谢任何输入!附言-我应该提到使用分隔文件是我们现在遇到的问题。我们的一些是包含定界符的长字符字段,因此无法正确解析。该字段甚至可能有一个选项卡。我们想从Postgres直接转到HDFS而无需解析。 最佳答

postgresql - Sqoop安装从postgresql导出和导入

我刚刚安装了sqoop并正在测试它。我尝试使用sqoop将一些数据从hdfs导出到postgresql。当我运行它时,它抛出以下异常:java.io.IOException:Can'texportdata,pleasechecktasktrackerlogs。我想也可能是安装有问题。文件内容是:ustNU45MB1bA0gNbCO76iZP1039B2aoo45SI7eG935sC4k602IhFV2u2A4816yvy6R51LNhsV26mZ2yn6580Gp343Wk5Ag85VUfyp93P077j94f1Oj511LxJkg720H7NP99Dk40625g4KRp76Fw3

postgresql - 有人在 cloudera 5.2.0 上使用 hadoop_fdw 吗?

将hadoop_fdw安装到我们正在运行的pgsql9.3.4后,我尝试将它连接到clouderacluster5.2.0,但没有成功。有没有调试fdw的方法?创建外部表并从中选择后,我收到一个错误-错误:无法连接到Hive:没有更多数据可读取。顺便说一句:一些旧版本的hadoop_fdw能够使用url(jdbc://server:port/args),但最新版本不行,只有地址和端口。 最佳答案 Hadoop_fdw没有成功。hive.c中可能有错误/旧的/过时的东西。但是通过更多的努力,我们设法使jdbc_fdw与cloudera

postgresql - Hive Metastore 配置 PostgreSQL

当我启动HiveMetastore服务时,我的命令行显示:“正在启动HiveMetastore服务器”,仅此而已。它实际上并没有启动服务器,也没有抛出任何错误消息hive:1.2.1哈多普:2.7.1Postgres:9.3.8hive站点.xmljavax.jdo.option.ConnectionURLjdbc:postgresql://localhost:5432/metastorejavax.jdo.option.ConnectionDriverNameorg.postgresql.Driverjavax.jdo.option.ConnectionUserNamehiveuse

postgresql - 如何使用 Mrjob 和 Hadoop 填充 postgresql 数据库

我想通过使用带有MrJob和Hadoop2.7.1的映射器来填充Postgresql数据库。我目前使用以下代码:#-*-coding:utf-8-*-#ScriptforstoringthesparsedataintoadatabasebyusingHadoopimportpsycopg2importrefrommrjob.jobimportMRJobargs_d=Falseargs_c=Trueargs_s=Trueargs_n='es_word_space'defunicodize(segment):ifre.match(r'\\u[0-9a-f]{4}',segment):ret

postgresql - 使用 SymmetricDs 在 Hadoop 和 PostgreSql 之间同步数据

我正在使用Hadoop来存储我们应用程序的数据。如何在PostgreSql和Hadoop之间同步数据?我使用SymmetricDS作为复制工具。 最佳答案 如果hadoop仅从PostgreSQL复制数据并且没有在hadoop站点上进行更新,请尝试使用sqoop-简单的数据库到hadoop导入工具。 关于postgresql-使用SymmetricDs在Hadoop和PostgreSql之间同步数据,我们在StackOverflow上找到一个类似的问题: ht