create-directory

sql - SQOOP - 导入失败 : Can not create a Path from a null string

我正在使用SQOOP增量更新将表从SQL服务器加载到HBase表。但是SQL表中的空值不会导入到HBase中。我知道Hbase不支持空值，并且包含空值的字段不会出现在Hbase中。但我担心的是，当某个特定列对大多数记录具有空值时，即使该字段中存在某些记录的值，也会被跳过。以下是SQL表结构CREATETABLE[dbo].[user_test]([user_id][nvarchar](20)NOTNULL,[user_name][nvarchar](100)NULL,[password][varchar](128)NULL,[created_date][datetime2](7)NUL

bash - 在 HDFS : How to check if 2 directories have same parent directory

是否有HDFS命令来检查HDFS中的2个目录是否具有共同的父目录。例如:$hadoopfs-ls-R/user/username/data//user/username/data/LIST_1539724717/SUBLIST_1533057294,/user/username/data/LIST_1539724717/SUBLIST_1533873826/UI,/user/username/data/LIST_1539724717/SUBLIST_1533873826/NEWDATA/A,/user/username/data/LIST_1539724717/SUBLIST_1533

directories directory 1539724717 username SUBLIST bash shell hadoop hdfs

java - Apache 凤凰java.lang.OutOfMemoryError : unable to create new native thread

我有一个微型Hadoop集群，它有5个数据节点和1个名称节点，所有4核/4线程机器每个都有4GB内存，除了一个数据节点有8GB内存。他们都在运行RHEL6x86_64。HBase版本为1.2，Phoenix版本为4.14我正在通过Phoenix查询服务器和“瘦”JDBC客户端连接到ApachePhoenix。Phoenix查询服务器在名称节点上运行。我正在尝试更新插入约2000个元组，每10分钟约25列，该表已经插入了超过200万个元组，但有时我会收到以下形式的异常:Causedby:java.lang.OutOfMemoryError:unabletocreatenewnativet

java OutOfMemoryError section native hadoop hbase apache-phoenix

hadoop - 如何解决错误 "file:/user/hive/warehouse/records is not a directory or unable to create one"？

hive>CREATETABLErecords(yearSTRING,temperatureINT,qualityINT)>ROWFORMATDELIMITED>FIELDSTERMINATEDBY'\t';FAILED:ExecutionError,returncode1fromorg.apache.hadoop.hive.ql.exec.DDLTask.MetaException(message:file:/user/hive/warehouse/recordsisnotadirectoryorunabletocreateone)如何解决错误？/user/hive/warehous

amp directory code hive warehouse hadoop hdfs

unit-testing - 测试 Spark : how to create a clean environment for each test

在测试我的ApacheSpark应用程序时，我想进行一些集成测试。出于这个原因，我创建了一个本地spark应用程序(启用了配置单元支持)，在其中执行测试。如何在每次测试后清除derbyMetastore，以便下一次测试再次拥有干净的环境。我不想做的是在每次测试后重新启动spark应用程序。是否有任何最佳实践可以实现我想要的？最佳答案我认为为集成测试引入一些应用程序级逻辑打破了集成测试的概念。从我的角度来看，正确的方法是为每个测试重新启动应用程序。无论如何，我相信另一种选择是为每个测试启动/停止SparkContext。它应该清除

unit-testing environment section 测试 strong apache-spark hadoop testing hive

Hadoop copyFromLocal : '.' : No such file or directory

我将Windows8与cloudera-quickstart-vm-5.4.2-0虚拟机一起使用。我下载了一个文本文件words.txt到下载文件夹中。我将目录更改为下载并使用hadoopfs-copyFromLocalwords.txt我收到没有这样的文件或目录错误。谁能向我解释为什么会这样/如何解决这个问题？这是终端的屏幕截图:有人告诉我当Hadoop处于安全模式时会出现此错误，但我已确保安全模式已关闭。最佳答案这是因为hdfs:///user/cloudera不存在。运行hdfsdfs-ls可能会出现类似的错误。如果没有指

copyFromLocal amp code section hadoop hdfs cloudera cloudera-cdh

hadoop fs -ls “no such file or directory”

如果我写命令:[hdfs@nnode~]$hadoopfs-ls我收到消息:ls:`.':Nosuchfileordirectory我知道hadoopfs-ls默认情况下会查找文件夹/home/hdfs，所以我使用它创建了它hadoopfs-mkdir/home然后hadoopfs-mkdir/home/hdfs但是我仍然收到消息:ls:`.':Nosuchfileordirectory 最佳答案其实是/user/hdfs，不是/home尝试hadoopfs-mkdir-p/user/hdfs

directory hadoop blockquote section code hdfs uri

hadoop - SQOOP 从 Teradata 导入 : Create table Ok but without data

我使用sqoop通过我的TD数据库拨号。当我尝试这个时，一切正常(我的表是在默认配置单元数据库中创建的)sqoopimport\-libjars$LIB_JARS\-Dteradata.db.input.job.type=hive\-Dteradata.db.input.target.table=hive_table\-Dteradata.db.input.target.table.schema="c1bigint"\-m1\--connectjdbc:teradata://PRD/Database=database\--connection-managerorg.apache.sqo

Teradata without section database Dteradata hadoop import hive sqoop

java - Hadoop-级联: Partial directory source tap

我的数据结构如下:+data|-2014080700_00.txt|-2014080700_01.txt|-2014080701_00.txt|-...|-2014080723_00.txt|-2014080800_00.txt|-...|-2014090800_00.txt我知道我可以通过Tap使用数据目录中的所有文件，如下所示:TapinTap=newHfs(newTextLine(),"/path/to/data");但我想要目录的特定部分，例如日期为20140807的文件。因此它将包括所有前缀为20140807的文件。有没有办法用级联来做到这一点？或者有什么方法可以烫一下吗？

directory Partial code section cascading java hadoop scalding

hadoop - Hive INSERT OVERWRITE 到 Google Storage 作为 LOCAL DIRECTORY 不起作用

我使用以下Hive查询:hive>INSERTOVERWRITELOCALDIRECTORY"gs://Google/Storage/Directory/Path/Name"rowformatdelimitedfieldsterminatedby','select*from.;我收到以下错误:"Error:FailedwithexceptionWrongFS:"gs://Google/Storage/Directory/PathName",expected:file:///我做错了什么？最佳答案从语法中删除Local。参见下面的

DIRECTORY OVERWRITE section code strong hadoop hive google-cloud-storage google-hadoop

214 215 216217218 219 220