$Oracle

hadoop - 从 oracle 到有条件的 hdfs 的增量 sqoop

我正在对hdfsoracle进行增量查询，给出类似的条件(LST_UPD_TMST>TO_TIMESTAMP('2016-05-31T18:55Z','YYYY-MM-DD"T"HH24:MI"Z"')ANDLST_UPD_TMST但它没有使用索引。我如何强制索引，以便通过仅考虑过滤记录来使sqoop更快。执行增量sqoop的最佳选择是什么。oracle中的表大小以TB为单位。表有数十亿行，在where条件下它有几百万最佳答案 Youcanuse--whereor--querywithwhereconditioninselectt

java - 将应用程序从 Oracle 更改为 Hadoop

我目前有一个运行Oracle中所有数据的Web应用程序。在高层，应用程序由一个javaapplet、一些javaservlet、一些Ajax和oracle数据库组成。我想知道将整个套件转换为Hadoop的工作成本是多少？下面是一些可以帮助我掌握它的问题。是否有任何软件可以将SQL数据库模式创建脚本和查询转换为Hadoop中的适当调用？用于与Hadoop通信的JavaAPI与与OracleSQL通信的JavaAPI有何不同？那里也有一点Ajax，从SQL到Hadoop有什么不同？在解释与Hadoop有关的任何内容时，请将我视为初学者。我不需要深入探讨细节(除非你愿意)，只是高层次的谈话。

Oracle Hadoop section java sql ajax

oracle - Sqoop 作业因 Oracle 导入的 KiteSDK 验证错误而失败

我正在尝试运行Sqoop作业以从Oracle数据库加载并以Parquet格式加载到Hadoop集群。这项工作是增量的。Sqoop版本为1.4.6。甲骨文版本是12c。Hadoop版本为2.6.0(发行版为Cloudera5.5.1)。Sqoop命令是(创建作业并执行它):$sqoopjob-fshdfs://:8020\--createmyJob\--import\--connectjdbc:oracle:thin:@:/\--username\-P\--as-parquetfile\--table.\--target-dir\--incrementalappend\--check-c

KiteSDK oracle java sqoop apache hadoop cloudera

hadoop - 将包含 ® 和 © 等字符的数据从 Oracle 加载到 HDFS 时出现问题 - Hadoop 分布式文件系统

我正在使用ClouderaSqoop将数据从Oracle数据库提取到HDFS。除了®和©之类的一些字符在HDFS中被转换为®©之外，一切都很好。(但是在Oracle中，数据存储没有任何问题)。有什么办法可以将这些字符按原样存储在HDFS中吗？Sqoop版本:1.3谢谢，卡尔西凯亚最佳答案您在Oracle数据库中使用哪种格式的字符？由于Hadoop使用的是UTF-8格式，不同的数据需要从Oracle数据库转换过来。关于hadoop-将包含®和©等字符的数据从Oracle加载到HDFS

时出 hadoop section Oracle hdfs sqoop

oracle - sqoop 不导入数据类型 varchar2

sqoop不导入数据类型varchar2到hadoop我在oracle数据库中有一个表，我想将数据导入到hdfs。我正在尝试使用sqoop进行操作，但未导入varchar2列。我的意思是这些数据没有到达hdfs文件。我的sqoop命令sqoopimport-Dmapred.job.name='defaultoraoop'--driveroracle.jdbc.driver.OracleDriver--connect"jdbc:oracle:thin:MyIp:MyServiceName"--username"XXXX"--password"XX"--target-dir"My_dir"

varchar2 varchar section strong 34 oracle hadoop hdfs sqoop

python - spark 从 oracle 导入数据 - java.lang.ClassNotFoundException : oracle. jdbc.driver.OracleDriver

在AWSEMR上尝试使用spark从oracle数据库读取数据时，我收到此错误消息:java.lang.ClassNotFoundException:oracle.jdbc.driver.OracleDriver.谁能告诉我是否有人遇到过这个问题以及他们是如何解决的？pyspark--driver-class-path/home/hadoop/ojdbc7.jar--jars/home/hadoop/ojdbc7.jarfrompysparkimportSparkContext,HiveContext,SparkConffrompyspark.sqlimportSQLContextsq

oracle ClassNotFoundException section spark driver python hadoop apache-spark pyspark

oracle - 在 Sqoop 中使用 HCatalog 时，hive-drop-import-delims 不删除换行符

Sqoop在与HCatalog导入一起使用时无法从列数据中删除新行(\n)，即使在使用Oracle运行ApacheSqoop时在命令中使用--hive-drop-import-delims选项也是如此。Sqoop查询:sqoopimport--connectjdbc:oracle:thin:@ORA_IP:ORA_PORT:ORA_SID\--usernameuser123--passwordpasswd123-tableSCHEMA.TBL_2\--hcatalog-tabletbl2--hcatalog-databasetestdb--num-mappers1\--split-by

换行符 hive-drop-import-delims code section oracle hadoop hive sqoop hcatalog

oracle - 运行 Sqoop 导入和导出时如何找到最佳映射器数量？

我正在使用Sqoop1.4.2版和Oracle数据库。运行Sqoop命令时。例如像这样:./sqoopimport\--fs\--jt\--connect\--username--password\--table--split-by\--target-dir\--verbose--m2我们可以指定--m-我们希望Sqoop运行多少个并行任务(它们也可能同时访问数据库)。相同的选项可用于./sqoopexport是否有一些启发式(可能基于数据大小)有助于猜测使用的最佳任务数？谢谢! 最佳答案这摘自O'ReillyMedia的Apac

射器 oracle section strong Sqoop hadoop mapreduce hdfs

oracle - 将数据从 oracle 移动到 HDFS，处理并从 HDFS 移动到 Teradata

我的要求是MovedatafromOracletoHDFSProcessthedataonHDFSMoveprocesseddatatoTeradata.还需要每15分钟执行一次整个处理。源数据量可能接近50GB，处理后的数据也可能相同。在网上查了很多，发现ORAOOPtomovedatafromOracletoHDFS(Havethecodewithingtheshellscriptandscheduleittorunattherequiredinterval).DolargescaleprocessingeitherbyCustomMapReduceorHiveorPIG.SQOO

oracle HDFS section blockquote hadoop teradata apache-storm

php - 从oracle SQL开发人员中查询列名查找表

我想在不知道表名的情况下查询数据库的列名以查找表(有大量表)我目前正在处理一个庞大的数据库，并试图根据CFML代码和有问题页面的URL找到网站从何处检索信息。我是ColdFusion的新手，但我可以看到该URL包含一些带有列名的ID引用。有些我很容易找到，有些我不知道，因为列名很模糊，例如'NTASKID'。我的计划是尝试使用列名查询数据库，但Google向我提供了需要知道我没有的表名的查询。我想这些示例可能对非规范化表更有用(？)。如果有人知道这样的查询那就太好了。此外，有人可以评论我是否在这里进行了正确的调查？最佳答案有效的

列名 oracle section 不知 php sql coldfusion oracle-sqldeveloper

164 165 166167168 169 170