草庐IT

table_name

全部标签

linux - 安装和获取当前的 dfs.name.dir 和 dfs.data.dir 值

我没有在hdfs-site.xml文件中设置dfs.name.dir和dfs.data.dir值没有设置。他们会怎样?有趣的是,他们默认接受什么值?(如何接收他们的当前值?) 最佳答案 dfs.name.dir的默认值为${hadoop.tmp.dir}/dfs/data和dfs.data.dir是${hadoop.tmp.dir}/dfs/data。如果hadoop.tmp.dir的值未使用-D选项或配置文件设置,则默认值为/tmp/hadoop-${user.name}user.name是您用来登录系统的用户名。对于所有默认值,

java - 无法在 Oozie java 操作中设置 mapred.job.queue.name

我有一个运行紧迫作业的应用程序。我正在尝试将Oozie配置为使用Java操作运行此作业。我的操作如下,${jobTracker}${nameNode}mapred.job.queue.namelaunchercom.test.Main-Dmapred.output.compress=false-Dmapred.textoutputformat.separator=,-Dcrunch.disable.output.counters=trueActionfailed,errormessage[${wf:errorMessage(wf:lastErrorNode())}]但每次我运行Oozi

python - 导入错误 : No module named impyla

我已经安装了impyla及其依赖项this指导。安装似乎是成功的,因为现在我可以在Anaconda文件夹(64位Anaconda4.1.1版本)中看到文件夹"impyla-0.13.8-py2.7.egg"。但是当我在python中导入impyla时,出现以下错误:>>>importimpylaTraceback(mostrecentcalllast):File"",line1,inImportError:Nomodulenamedimpyla我已经安装了64位Python2.7.12任何人都可以解释我为什么会遇到这个错误吗?我是Python的新手并且一直在不同的博客上花费大量时间,但

java - HBase、Hadoop : How can I estimate the size of a HBase table or Hadoop File System Paths?

我有多个HBase表,如何估计在java中使用的表的大概大小? 最佳答案 一种方法是您必须通常在/hbase文件夹下使用java客户端访问hdfs所有表格信息。将出席。Hadoop外壳:您可以检查使用hadoopfs-du-h**pathtohbase**/hbase在/hbase下每张表多占一个文件夹...hadoopfs-ls-R**hbase路径**/hbasehadoopfs-du-h**hbase路径**/hbase/表名JavaHDFS客户端:同样的,你可以通过在hbaseroot目录下传递每个表路径来使用javahdf

sql - Hive SQL 编码风格 : intermediate tables?

我应该在配置单元中创建和删除中间表吗?我可以写类似的东西(大大简化):droptableifexiststmp1;createtabletmp1asselecta,b,cfrominput1wherea>1andb或者我可以将所有内容汇总到一个语句中:droptableifexistsoutput;createtableoutputasselectx,a,count(*)ascountfrom(selecta,b,cfrominput1wherea>1andb显然,如果我多次重复使用中间表,那么创建它们就很有意义了。但是,当它们只使用一次时,我有一个选择。两个我都试过了,第二个是6%快

hadoop - 当 Name Node 在 YARN 中失败时,工作状态是什么?

当一个job在集群中运行时,如果NameNode突然挂了,那么这个job的状态是什么(failed或者killed)?如果失败意味着谁在更新作业状态?这在内部是如何工作的? 最佳答案 备用Namenode将通过故障转移过程变为事件Namenode。看看HowdoesHadoopNamenodefailoverprocessworks?YARN架构围绕着ResourceManager、NodeManager和ApplicationsMaster。作业将继续进行,而不会因名称节点故障而受到任何影响。如果以上三个进程中的任何一个失败,将根

java - 连接到 Kerberrized HDFS,java.lang.IllegalArgumentException : Failed to specify server's Kerberos principal name;

我正在尝试使用以下代码连接到Kerberizedhdfs集群,使用以下相同的代码我能够使用HBaseConfiguration访问hbaseofcourse,Configurationconfig=newConfiguration();config.set("hadoop.security.authentication","Kerberos");UserGroupInformation.setConfiguration(config);UserGroupInformationugi=null;ugi=UserGroupInformation.loginUserFromKeytabAnd

hadoop - 是否有相当于 "SHOW TABLES"的 apache pig?

我有一个要在Pig中访问的Hadoop数据存储,但没有很多关于它的文档,而且我是Pig的新手,所以我正在寻找与“SHOWTABLES”等效的Pig。当我连接到MySQL数据库时,我可以执行此操作并大致了解其中的数据;我找到了几个教程,但没有任何内容。如果不是,是否有其他方法可以让我自己定位到我一无所知的Hadoop数据存储?预计到达时间:这将是在交互模式下运行Pig时,而不是加载脚本。可能很明显,但我想我应该提一下。 最佳答案 我能看到的最接近“显示表”的是“历史”命令,它有效地列出了所有创建的别名。grunt>history1a=

【flink番外篇】9、Flink Table API 支持的操作示例(2)- 通过Table API 和 SQL 创建视图

Flink系列文章一、Flink专栏Flink专栏系统介绍某一知识点,并辅以具体的示例进行说明。1、Flink部署系列本部分介绍Flink的部署、配置相关基础内容。2、Flink基础系列本部分介绍Flink的基础部分,比如术语、架构、编程模型、编程指南、基本的datastreamapi用法、四大基石等内容。3、FlikTableAPI和SQL基础系列本部分介绍FlinkTableApi和SQL的基本用法,比如TableAPI和SQL创建库、表用法、查询、窗口函数、catalog等等内容。4、FlikTableAPI和SQL提高与应用系列本部分是tableapi和sql的应用部分,和实际的生产应

Hadoop hive : How to allow regular user continuously write data and create tables in warehouse directory?

我在单个节点上运行Hadoop2.2.0.2.0.6.0-101。我正在尝试运行JavaMRD程序,该程序在普通用户下从Eclipse将数据写入现有的Hive表。我得到异常:org.apache.hadoop.security.AccessControlException:Permissiondenied:user=dev,access=WRITE,inode="/apps/hive/warehouse/testids":hdfs:hdfs:drwxr-xr-x发生这种情况是因为普通用户对仓库目录没有写权限,只有hdfs用户有:drwxr-xr-x-hdfshdfs02014-03-0