PostgreSQL-psql

postgresql - Sqoop安装从postgresql导出和导入

我刚刚安装了sqoop并正在测试它。我尝试使用sqoop将一些数据从hdfs导出到postgresql。当我运行它时，它抛出以下异常:java.io.IOException:Can'texportdata,pleasechecktasktrackerlogs。我想也可能是安装有问题。文件内容是:ustNU45MB1bA0gNbCO76iZP1039B2aoo45SI7eG935sC4k602IhFV2u2A4816yvy6R51LNhsV26mZ2yn6580Gp343Wk5Ag85VUfyp93P077j94f1Oj511LxJkg720H7NP99Dk40625g4KRp76Fw3

postgresql - 有人在 cloudera 5.2.0 上使用 hadoop_fdw 吗？

将hadoop_fdw安装到我们正在运行的pgsql9.3.4后，我尝试将它连接到clouderacluster5.2.0，但没有成功。有没有调试fdw的方法？创建外部表并从中选择后，我收到一个错误-错误:无法连接到Hive:没有更多数据可读取。顺便说一句:一些旧版本的hadoop_fdw能够使用url(jdbc://server:port/args)，但最新版本不行，只有地址和端口。最佳答案 Hadoop_fdw没有成功。hive.c中可能有错误/旧的/过时的东西。但是通过更多的努力，我们设法使jdbc_fdw与cloudera

postgresql hadoop_fdw section cloudera jdbc hadoop hive cloudera-cdh foreign-data-wrapper

postgresql - Hive Metastore 配置 PostgreSQL

当我启动HiveMetastore服务时，我的命令行显示:“正在启动HiveMetastore服务器”，仅此而已。它实际上并没有启动服务器，也没有抛出任何错误消息hive:1.2.1哈多普:2.7.1Postgres:9.3.8hive站点.xmljavax.jdo.option.ConnectionURLjdbc:postgresql://localhost:5432/metastorejavax.jdo.option.ConnectionDriverNameorg.postgresql.Driverjavax.jdo.option.ConnectionUserNamehiveuse

postgresql gt lt property hadoop hive

postgresql - 如何使用 Mrjob 和 Hadoop 填充 postgresql 数据库

我想通过使用带有MrJob和Hadoop2.7.1的映射器来填充Postgresql数据库。我目前使用以下代码:#-*-coding:utf-8-*-#ScriptforstoringthesparsedataintoadatabasebyusingHadoopimportpsycopg2importrefrommrjob.jobimportMRJobargs_d=Falseargs_c=Trueargs_s=Trueargs_n='es_word_space'defunicodize(segment):ifre.match(r'\\u[0-9a-f]{4}',segment):ret

postgresql Hadoop 34 word 39 python-2.7 mrjob

postgresql - 使用 SymmetricDs 在 Hadoop 和 PostgreSql 之间同步数据

我正在使用Hadoop来存储我们应用程序的数据。如何在PostgreSql和Hadoop之间同步数据？我使用SymmetricDS作为复制工具。最佳答案如果hadoop仅从PostgreSQL复制数据并且没有在hadoop站点上进行更新，请尝试使用sqoop-简单的数据库到hadoop导入工具。关于postgresql-使用SymmetricDs在Hadoop和PostgreSql之间同步数据，我们在StackOverflow上找到一个类似的问题： ht

SymmetricDs postgresql section Hadoop

postgresql - Hadoop 或 Postgresql 进行有效处理

我是一名学生，正在尝试对大型数据集使用一些机器学习算法。我们的训练集中有大约1.4亿条记录(目前在postgresql表中)，并且有五个表有大约600万条记录，展示了主键-外键关系。我们只有2台配置如下的机器1)6GB内存，第二代i5处理器2)8GB内存，第二代i7处理器我们现在正计划在运行我们的统计分析之前将它们分成逻辑组，因为周转时间非常长。1)我应该在postgresql中将它们拆分成单独的表并且它们使用MATLAB或R进行编程要么2)我应该通过移植数据库来使用hadoop和hbase吗3)我是否应该结合使用它们(即根据逻辑组分解它们并转储到postgresql数据库中，还设置h

postgresql section 二代 hadoop machine-learning

postgresql - 在不损失 Hadoop 并行处理能力的情况下，将 SAS 与 Hadoop 集成的最佳方法是什么

我想了解SAS和Hadoop之间的集成。据我了解，像procsql这样的SAS进程只能对SAS数据集起作用，我不能对hadoop节点上的文本文件发出procsql。这是正确的吗？如果是，那么我需要使用一些ETL作业首先将数据从HDFS中取出并将其转换为SAS表。但如果我这样做，我将失去Hadoop的并行处理能力，对吗？那么集成SAS和Hadoop并仍然使用Hadoop的并行处理能力的理想方式是什么？我知道您可以从SAS内部调用mapreduce作业，但是mapreduce作业可以用SAS编写吗？我认为不是。最佳答案 SAS全局论坛

Hadoop postgresql SAS data apache-hive hawq

postgresql - 如何将 Postgres(二进制或文本)转储文件导入 Spark 或 HDFS？

我想在Spark中使用Postgres(二进制或文本)转储文件，想知道如何导入它？我知道我们可以使用Sqoop将Postgres导入HDFS，并且我可以从Spark访问HDFS，但是如果我只有转储文件怎么办？我是否必须先将其恢复到Postgres数据库中？我宁愿不要。最佳答案使用pg_restore--data-only-tmy_tabledb.dump你应该得到制表符分隔的文本，其中包含一些注释和一些额外的命令，过滤掉你不需要的一切会很简单'不想将该文件写入HDFS。然后就是将该文件作为CSV文件从Spark或MapReduc

postgresql Postgres section 该文 hadoop apache-spark hdfs sqoop

postgresql - 在 Hortonworks 上部署 HAWQ 2.0 时主 postgres initdb 失败

我尝试部署HAWQ2.0，但无法让HAWQMaster运行。以下是错误日志:[gpadmin@hdps31hwxworker2hawqAdminLogs]$cat~/hawqAdminLogs/hawq_init_20160805.log20160805:23:00:10:050348hawq_init:hdps31hwxworker2:gpadmin-[INFO]:-Preparetodo'hawqinit'20160805:23:00:10:050348hawq_init:hdps31hwxworker2:gpadmin-[INFO]:-Youcanfindlogin:201608

上部 Hortonworks hawq hwxworker2 hawq_init postgresql hadoop hortonworks-data-platform

postgresql - 从 10 亿行 GreenPlum DB 中缓慢选择

我在GreenPlum上创建了下表:CREATETABLEdata."CDR"(mcctext,mnctext,lactext,celltext,from_numbertext,to_numbertext,cdr_timetimestampwithouttimezone)WITH(OIDS=FALSE,appendonly=true,orientation=column,compresstype=quicklz,compresslevel=1)DISTRIBUTEDBY(from_number);我已将10亿行加载到此表，但每个查询都非常慢。我需要对所有字段(不仅是一个)进行查询，我可

postgresql 缓慢 section from_number number hadoop cassandra greenplum bigdata

148 149 150151152 153 154