$Oracle

oracle - 是否可以使用 sqoop 导入表并添加额外的时间戳列？

是否可以使用sqoop命令“导入表”将表从oracle数据库导入到Hadoop集群并添加一个带有当前时间戳的额外列(用于故障排除目的)？到目前为止，我有以下命令:sqoopimport-Dorg.apache.sqoop.splitter.allow_text_splitter=true--connectjdbc:oracle:thin:@//MY_ORACLE_SERVER--usernameUSERNAME--passwordPASSWORD--target-dir/MyDIR--fields-terminated-by'\b'--tableSOURCE_TABLE--hive-t

oracle - SQOOP输出文件大小不均匀

我有一个庞大的新闻数据库，但每当我尝试对其进行sqoop时，它都会写入2-3个文件，而不是整个200个文件。sqoopimport-Dmapred.map.max.attempts=4\-Ddfs.blocksize=1073741824\-Doraoop.block.allocation=RANDOM\-Dmapred.job.queue.name=default\-m200\--split-byAUTHOR_ID\--connectjdbc:oracle:thin:@$127.0.0.1:1521:SRDB\--usernameabc\--password1234\--tableL

不均 oracle AUTHOR_ID AUTHOR code hadoop export sqoop

hadoop - 使用 Sqoop 从 Oracle 直接导入到 Hadoop

我想在从Oracle导入数据时使用--direct参数。是否可以使用--direct选项来使用数据转储/泵实用程序？我是否需要在我的shell上安装任何Oracle实用程序？如果是，请建议我需要安装什么？达美什最佳答案遗憾的是，没有使用DataPump实用程序的Sqoop连接器。Oracle确实有自己的(闭源)大数据连接器。我相信Hadoop的SQLLoader使用数据泵格式。关于hadoop-使用Sqoop从Oracle直接导入到Hadoop，我们在StackOverflow上找

hadoop Oracle section 实用 sqoop

oracle - 是否可以将配置单元表与 oracle 表连接起来？

我在使用HiveQL编写查询时遇到问题.是否可以将hive表与oracle表连接起来？如果是怎么办？如果没有，为什么？最佳答案要访问存储在Hive表中的数据，包括加入它们，您需要OracleBigDataconnector.来自文档:UsingOracleSQLConnectorforHDFS,youcanuseOracleDatabasetoaccessandanalyzedataresidinginHDFSfilesoraHivetable.YoucanalsoqueryandjoindatainHDFSoraHivetab

配置单 oracle section noreferrer join hadoop hive

hadoop - 如何使用 Sqoop 将列类型 SDO_GEOMETRY 从 Oracle 导入到 HDFS？

问题我正在使用Sqoop从Oracle获取数据并将其放入HDFS。与其他基本数据类型不同，我知道SDO_GEOMETRY用于空间数据。我的Sqoop作业在获取数据类型SDO_GEOMETRY时失败。需要帮助将数据类型为SDO_GEOMETRY的列Shape从Oracle导入到Hdfs。我有超过1000个具有SDO_GEOMETRY数据类型的表，当sqoop导入发生时，我如何处理一般数据类型？我已经尝试了--map-column-java和--map-column-hive，但我仍然遇到错误。error:ERRORtool.ImportTool:EncounteredIOExceptio

SDO_GEOMETRY GEOMETRY column section strong hadoop hive hdfs sqoop bigdata

oracle - Sqoop ExportTool 到 Oracle NullPointer 异常

使用如下命令:sqoopexport\--connectjdbc:oracle:thin:'@somehostname.com:1521/prod1_adhoc'\--usernamefbaggins\--P\--tableMIDDLEEARTH\--hcatalog-databaseMORDOR\--hcatalog-tableMORDOR\--columnsIS_DWARF,IS_ELF\--verbose导致此错误:16/08/2510:08:31INFOhive.metastore:TryingtoconnecttometastorewithURIthrift://someho

NullPointer ExportTool code section strong oracle hadoop hive sqoop

oracle - 与 Oracle 相比，在 Hadoop 中的表上使用索引有什么优势吗？

我需要比较Oracle和Hadoop(Hive)中的索引。到目前为止，我可以在Hive中找到两种主要的索引技术，即COMPACTINDEXING和BITMAPINDEXING。我可以检查Hive中COMPACTINDEXING与Oracle相比的性能差异。我需要了解更多在Hive中使用位图索引的用例/场景。另外，需要知道Hive是否像Oracle一样支持反向键索引、升序和降序索引。最佳答案是的，他们在HIVE中使用索引比oracle，请记住HIVE适用于大型数据集和然而他们在使HIVE成为实时数据方面取得了进展仓储工具。可以使用

oracle section Hive li apache hadoop indexing

oracle - 如何将日期/时间戳字符串写入 Oracle DB 中的日期时间戳列？

我已经使用AVRO文件格式和Hive外部表将一些Oracle表存储在Hadoop中以访问数据。我在导入时使用Oracle的TO_CHAR函数将日期和时间戳值存储为格式化字符串。现在我想使用Spark将这些确切数据导出回具有日期列的Oracle表。我使用命令://CreateadataframefromtheHivetablevaldata=sqlContext.sql("select*fromavro_table")//exportdftoexistingoracletabledata.write.mode("overwrite").jdbc(jdbcString,"tableName

oracle format Column apache hadoop apache-spark hive avro

hadoop - 使用 Sqoop 连接 Hive 和 Oracle 数据库

是否可以使用Sqoop将数据从hive导出到OracleDB以用于报告目的，因为我不想在客户端应用程序中进行任何更改。问候，巴格旺博比最佳答案使用insertoverwritedirectoryHive的选项用于将查询的输出写入文件，然后使用Sqoopexport将文件中的数据插入RDBM的选项。使用Oozie的工作流程或Azkaban(Azkaban是否支持Oozie和Hive任务？)也可用于自动化。关于hadoop-使用Sqoop连接Hive和Oracle数据库，我们在St

hadoop Oracle section noreferrer noopener cloudera sqoop

python - 以文本文件和 oracle 表为源，Hive 或 Pig 或 Python Mapreduce 哪个能提供最佳性能？

我有以下要求，对选择哪一个以获得高性能感到困惑。我不是Java开发人员。我对Hive、Pig和Python很满意。我正在使用带有tez引擎的HDP2.1。数据源是文本文件(80GB)和Oracle表(15GB)。两者都是结构化数据。我听说Hive将适用于结构数据，Pythonmapreducestreaming概念也将比hive&Pig具有更高的性能。请说清楚。我正在使用Hive，原因是:需要基于一列加入这两个来源。数据量大，使用ORC格式表存储join结果文本文件名将用于生成一个输出列，并且已使用虚拟列概念input__file__name字段执行。加入后需要对每一行做一些算术运算，

以文 Mapreduce Python section Pig hadoop hive apache-pig

162 163 164165166 167 168