Sqoop1

hadoop - 对使用 sqoop 和 hadoop 连接器导入的 couchbase 数据运行查询

我正在使用带有hadoopcouchbase连接器的sqoop将一些数据从couchbase导入到hdfs。如中所述http://docs.couchbase.com/hadoop-plugin-1.1/#limitationscouchbase不支持查询。我想要一个使用hadoop连接器运行查询的解决方案。例如:我在数据库中有2个文档，如下所示:{'文档类型':'a'}和{'文档类型':'b'}我只需要获取属于docType=a的文档。有办法吗？最佳答案如果你想从Couchbase中选择数据，你不需要hadoop连接器....

oracle - 使用 sqoop 将数据从 oracle 导入到 hive - 不能使用 --hive-partition-key

我有一个简单的表格:createtableosoba(idnumber,imievarchar2(100),nazwiskovarchar2(100),wiekinteger);insertintoosobavalues(1,'pawel','kowalski',36);insertintoosobavalues(2,'john','smith',55);insertintoosobavalues(3,'paul','psmithski',44);insertintoosobavalues(4,'jakub','kowalski',70);insertintoosobavalues(5

oracle hive-partition-key 39 hive section hadoop sqoop

java - 在 Sqoop 的情况下，映射器输出如何写入 HDFS？

据我了解HadoopMap-Reduce作业，映射器输出写入本地存储而不是HDFS，因为它最终是一次性数据，因此没有必要存储在HDFS中。但正如我所见，Sqoop映射器输出文件part-m-00000被写入HDFS。所以我怀疑Hadoop中是否有一些设置来控制映射器输出写入的位置？并且默认设置为本地存储？最佳答案如果没有缩减器，则映射器输出将写入HDFS。即使在这种情况下，映射器输出也不会直接写入HDFS，而是写入单个节点磁盘，然后复制到HDFS。Sqoop是一种场景，在这种情况下，它通常是仅映射作业，您希望从表中并行获取数据，

射器 Sqoop section HDFS java hadoop mapreduce

hadoop - sqoop 导入无法定位 sqoop-1.4.6.jar

我正在使用sqoop从mysql表导入数据以与hadoop一起使用。导入时显示错误。Hadoop版本:2.5.0Sqoop版本:1.4.6用于导入的命令sqoopimport--connectjdbc:mysql://localhost/--usernameroot--passwordpass@123--table-m1显示错误15/05/2723:13:59ERRORtool.ImportTool:EncounteredIOExceptionrunningimportjob:java.io.FileNotFoundException:Filedoesnotexist:hdfs://l

sqoop hadoop strong code

hadoop - 使用 -query 和 --as-parquetfile 运行 Sqoop : java. lang.NullPointerException 时出现异常

我正在尝试将表数据从Redshift导入到HDFS(使用Parquet格式)并遇到如下所示的错误:15/06/2511:05:42ERRORsqoop.Sqoop:GotexceptionrunningSqoop:java.lang.NullPointerExceptionjava.lang.NullPointerExceptionatorg.apache.sqoop.tool.CodeGenTool.generateORM(CodeGenTool.java:97)atorg.apache.sqoop.tool.ImportTool.importTable(ImportTool.jav

时出 NullPointerException Sqoop apache hadoop parquet

mysql - sqoop 导入查询只导入第一列

我使用sqoop以csv格式将数据从mysql导入到hadoop，当使用表参数时效果很好。但是，当我使用查询参数时，它只能导入第一列，而遗漏了其他列。这是我的命令。sqoopimport\--connectjdbc:mysql://127.0.0.1:3306/sqoop\--usernameroot\--passwordroot\--query'selectage,jobfrompersonwhere$CONDITIONS'\--bindir/tmp/sqoop-hduser/compile\--fields-terminated-by','\--target-dir/Users/h

mysql sqoop section CONDITIONS hadoop

hadoop sqoop加载csv文件到mysql

我正在学习hadoopsqoop。我正在研究hortonworks沙箱(单节点的hadoop虚拟机:http://hortonworks.com/products/hortonworks-sandbox/#install)。我正在尝试通过sqoop将csv文件加载到mysql表中。我在其中创建了一个数据库flightinfo和一个表weather。我在配置单元中创建了一个名为sqoop_tmp的表，其中包含该csv文件的文件位置。我使用以下命令将csv加载到mysql中:sqoopexport--connectjdbc:mysql://localhost/flightinfo–-tab

hadoop sqoop code mysql

hadoop - 不应该在包安装期间配置 Oozie/Sqoop jar 位置吗？

我在CentOS6.7中使用HDP2.4。我已经用Ambari创建了集群，所以Oozie是由Ambari安装和配置的。我在运行与jar文件位置相关的Oozie/Sqoop时遇到两个错误。第一个涉及postgresql-jdbc.jar，因为Sqoop作业是从Postgres增量导入的。我将postgresql-jdbc.jar文件添加到HDFS并在workflow.xml中指向它:/user/hdfs/sqoop/postgresql-jdbc.jar问题解决了。但第二个错误似乎与kite-data-mapreduce.jar有关。然而，对这个文件做同样的事情:/user/hdfs/s

hadoop Oozie code section jar sqoop hortonworks-data-platform ambari

hadoop - 使用 hcatalog 的 Sqoop 增量导出？

有没有办法使用sqoop进行增量导出？我正在为sqoop使用Hcatalog集成。我尝试使用用于增量导入的--last-value、--check-column选项，但sqoop给我错误提示这些选项无效。最佳答案我还没有看到增量sqoop导出参数。您可以尝试的另一种方法是在配置单元中创建一个contol_table，您可以在其中记录每次上次导出时的表名和时间戳。createtableifnotexistscontrol_table(table_namestring,export_datetimestamp);insertinto

hcatalog hadoop table export control_table hive sqoop hadoop2

hadoop - 阻止 sqoop 将 datetime 转换为 bigint

最近我注意到，每当我使用Sqoop从SQL数据库中提取数据时，所有日期时间字段都会转换为bigint(epoch*1000)而不是字符串。重要提示:我存储为Parquet。我一直在尝试一堆sqoop标志，例如"--map-column-java"但我不想为数千个表中的数百列手动定义它。我缺少什么标志来防止这种sqoop行为？sqoop在明文存储的时候好像没有这样做最佳答案我决定不让sqoop在我的table上施展神秘魔法，而是决定执行以下操作:提取到临时表，以文本形式存储。像临时表一样创建一个表(如果不存在)，存储为parque

datetime hadoop section sqoop stackoverflow

35 36 373839 40 41