草庐IT

Application-Name

全部标签

hadoop - --mapreduce-name 不适用于 sqoop

当我尝试对数据进行sqoop并在查询中使用时--mapreduce-name无论是在自由格式查询还是在正常导入中,sqoop都给出了jar的通用名称,即QueryResult.jar对于Sqoop导入的自由格式查询,它给出了表名作为默认的jar。为什么--mapreduce-name没有反射(reflect)出来。谁能帮我解决这个问题。 最佳答案 使用-Dmapred.job.name=customJobName设置Sqoop启动的MR作业的名称。ifnotspecified,thenamedefaultstothejarnamef

sql - 'pool_name' 在 CREATE TABLE 语句中意味着什么?

在CREATETABLE-statement末尾的Impala中您可以按照我的理解设置复制因子:CREATE[EXTERNAL]TABLE[IFNOTEXISTS][db_name.]table_name...[CACHEDIN'pool_name'[WITHREPLICATION=integer]|UNCACHED]无论如何,我有点不明白pool_name指的是什么。这是HDFS中存放数据的路径吗? 最佳答案 不完全是,它实际上是指使用hdfscacheadmin-addPool...命令定义的HDFS池,参见hdfscomman

java - Oozie 构建失败无法锁定存储构建/测试/数据/dfs/name1。该目录已被锁定

我正在尝试按照instruction构建Oozie4.0.1在mvntestinbuild时遇到这个问题-------------------------------------------------------------------------------Testset:org.apache.oozie.store.TestCoordinatorStore-------------------------------------------------------------------------------Testsrun:1,Failures:0,Errors:1,Skip

java - 如何在 application.properties 文件中的 Spring Boot 应用程序中配置 HikariCP?

我正在尝试在我的SpringBoot(1.2.0.M1)应用程序中设置HikariCP,以便我可以使用它来代替TomcatDBCP进行测试。我想在我的application.properties文件中配置连接池,就像我对Tomcat所做的那样,但我不知道我应该怎么做。我发现的所有示例都显示了JavaConfig样式或使用单独的HikariCP属性文件。有人可以帮我找出在application.properties中配置它的属性名称吗?我还想从使用driverClassName方法切换到DataSourceClassName方法,因为它看起来更干净并且被推荐。这在我的applicatio

java - 如何在 application.properties 文件中的 Spring Boot 应用程序中配置 HikariCP?

我正在尝试在我的SpringBoot(1.2.0.M1)应用程序中设置HikariCP,以便我可以使用它来代替TomcatDBCP进行测试。我想在我的application.properties文件中配置连接池,就像我对Tomcat所做的那样,但我不知道我应该怎么做。我发现的所有示例都显示了JavaConfig样式或使用单独的HikariCP属性文件。有人可以帮我找出在application.properties中配置它的属性名称吗?我还想从使用driverClassName方法切换到DataSourceClassName方法,因为它看起来更干净并且被推荐。这在我的applicatio

hadoop - 全局变量 HADOOP_USER_NAME oozie?

有什么方法可以在oozie工作流中将HADOOP_USER_NAME声明为全局变量?实际上,我正在为我的项目创建多个shell操作,但为每个shell操作声明一个HADOOP_USER_NAME效率不高,这就是为什么我想知道在这种情况下是否可以使用全局变量,如果可以,我该如何继续它。..非常感谢您的帮助。这是我正在使用的代码HADOOP_USER_NAME*****Error[${wf:errorMessage(wf:lastErrorNode())}]${jobTracker}${nameNode}script1.shscript1.sh#script1.sh出于某种原因,我没有从H

hadoop - Hive 'alter table <table name> concatenate' 是如何工作的?

我有n(large)个小型orc文件,我想将它们合并到k(small)个大型orc文件中。这是在Hive中使用altertabletable_nameconcatenate命令完成的。我想了解Hive是如何实现的。如果需要,我希望使用Spark进行任何更改来实现这一点。任何指针都会很棒。 最佳答案 根据AlterTable/PartitionConcatenate:如果表或分区包含很多小的RCFiles或ORC文件,那么上面的命令会将它们合并成更大的文件。在RCFile的情况下,合并发生在block级别,而对于ORC文件,合并发生在

hadoop - 为什么在执行 "/shared"时未列出 `hadoop fs -ls` 目录,尽管在执行 `hadoop fs -ls/shared/table_name` 时它是可见的

当我执行-ls命令时,未列出/shared目录[cts573151@aster2~]$hadoopfs-lsdrwx-------cts573151supergroup02016-12-2105:30.Trashdrwxr-xr-x-cts573151supergroup02017-02-0112:28.sparkStagingdrwx-------cts573151supergroup02017-02-0211:37.stagingdrwxr-xr-x-cts573151supergroup02016-12-1911:40_sqoopdrwxr-xr-x-cts573151super

hadoop - yarn application id 是如何生成的

我启动了一个yarn应用程序,它给出的id为application_1560618551799_4465795但是,我惊讶地发现1560618551799表示SunJun1601:09:11CST2019,大约是3个月前。我一直以为id中的时间戳会落到今天,请问我能不能从id中算出应用程序什么时候开始?谢谢 最佳答案 遗憾的是,无法从应用程序ID本身推断出应用程序启动时间。SourcecodefortheApplicationId提供以下叙述:ApplicationIdrepresentsthegloballyuniqueident

hadoop - fs.checkpoint.dir 和 dfs.name.dir 有什么区别?

主要是dfs.name.dir属性是用来存储namenode的fsimage到特定位置备份的,fs.checkpoint.dir属性是fsimage合并的位置。这让我有点困惑。任何人都可以详细解释我。 最佳答案 dfs.name.dir是namenode在磁盘中存放fsimage和editlogs的地方。这是一个强制性的位置。没有这个位置,hadoop集群将无法启动。这将位于名称节点主机中。fs.checkpoint.dir是本地文件系统上的目录,DFS辅助名称节点应在其中存储要合并的临时图像。如果这是一个以逗号分隔的目录列表,则图