草庐IT

master_table

全部标签

hadoop - 从 spark master UI 清除 Spark Job 历史记录

我正在处理spark,我想通过清除所有以前失败/完成的作业来清除我的sparkmasterUI。我不知道该怎么做?我试过从hdfs中删除日志,但作业条目仍然显示在UI上。 最佳答案 您需要重新启动masterspark进程。来自spark的sbin目录,运行./stop-master.sh和./start-master.sh它应该修复。 关于hadoop-从sparkmasterUI清除SparkJob历史记录,我们在StackOverflow上找到一个类似的问题:

Hadoop hive : Generate Table Name and Attribute Name using Bash script

在我们的环境中,我们无法访问Hive元存储来直接查询。我需要为一组表动态生成表名、列名对。我试图通过对所有表的文件运行“describeextended$tablename”并从文件中选取表名和列名对来实现这一点。除了这种方式,还有其他更简单的方法吗?想要的输出是这样的table1|col1table1|col2table1|col3table2|col1table2|col2table3|col1 最佳答案 此脚本将为单个表以所需格式打印列。AWK从describe命令解析字符串,只接受column_name,用“|”连接和tab

hadoop - HIVE 中 ALTER TABLE 命令中的 CONCATENATE 如何工作

我想了解HIVE中的ALTERTABLECONCATENATE究竟是如何工作的。我看到了这个链接HowdoesHive'altertableconcatenate'work?但我从这个链接得到的只是对于ORC文件,合并发生在strip级别。我正在寻找有关CONCATENATE工作原理的详细说明。例如,我最初在HDFS中有500个小的ORC文件。我运行了HiveALTERTABLECONCATENATE并将文件合并为27个更大的文件。随后运行的CONCATENATE将文件数量减少到16个,最后我得到了两个大文件。(使用版本Hive0.12)所以我想了解CONCATENATE的具体工作原理

sql - Hive-我如何使用原始表中的分区 "create table as select.."?

我需要从我们的配置单元dlk创建一个“工作表”。虽然我可以使用:createtablemy_tableasselect*fromdlk.big_table很好,我在从原始“big_table”继承分区(属性day、month和year)或只是创建来自这些属性的新属性。搜索网络并没有真正帮助我回答这个问题-所有“教程”或解决方案都涉及createasselect或创建分区,而不是两者。这里有人可以帮忙吗? 最佳答案 不支持创建分区表作为选择。您可以分两步完成:像dlk.big_table一样创建表my_table;这将创建具有相同架构

java - SIMPLE 身份验证未启用。可用 :[TOKEN, KERBEROS] -Hbase Master 无法激活

我正在尝试设置一个具有3个节点的HBase集群。我已经尝试配置SecureHbase一周了,但我仍然遇到错误:ERROR[Thread-15]master.HMaster:Failedtobecomeactivemasterorg.apache.hadoop.ipc.RemoteException(org.apache.hadoop.security.AccessControlException):SIMPLEauthenticationisnotenabled.Available:[TOKEN,KERBEROS]我正在运行Hbase2.0.5和Hadoop3.1.2。Secureha

hadoop - Hbase 0.20.6 无法启动master异常

我在上使用Hbase0.20.6和Hadoop0.21.0>Ubuntu10.04LTS并且出现无法启动主错误。(错误附加在hbase-root-master-ubuntu.log文件的帖子末尾)Hbase0.20.6可以与Hadoop0.21.0一起正常工作吗??如果不是,是否有变通办法??问题根源是什么??感谢您的时间和考虑。日志:java.io.IOException:Calltolocalhost/127.0.0.1:54310failedonlocalexception:java.io.EOFExceptionatorg.apache.hadoop.ipc.Client.wr

apache - HBase master 无法启动,无法连接到 hbase.rootdir

我正在尝试根据apache网站上的设置以伪分布式模式运行HBase,但我无法正确配置hbase.root目录。这是我的配置文件的样子:在Hadoop目录中:conf/core-site.xml:fs.default.namehdfs://localhost:9000dfs.replication1mapred.job.trackerlocalhost:9001conf/hdfs-site.xml:dfs.replication1dfs.support.appendtruedfs.datanode.max.xcievers4096conf/mapred-site.xml:mapred.j

java - Master 和 Slave 节点都必须进行哪些 Hadoop 配置?

我们是否必须同时修改hadoop集群的主从节点的mapred-site.xml参数,例如并行执行的map和reduce任务的最大数量,或者只有主节点的配置更改才会足够了。在mapred-site.xml中对主节点上的mapred.map.child.java.opts和mapred.reduce.child.java.opts等参数所做的更改是否也会在客户端节点上进行更改?或者我们两者都做了。我们是否必须在主节点和客户端节点都指定dfs.block.size以使block大小不同于默认值?如果没有,是否有必须在主节点和客户端节点指定的参数来优化hadoop集群?

Hadoop 配置单元 SQL : Create External Table from an oddly formatted file

目前我有一个初始系统在工作,它读取一个文件,每行格式如下所示:REVISION1230364918Anarchism2005-12-06T17:44:47ZRJII141644使用此代码:CREATEEXTERNALTABLEmytable(typeSTRING,aidBIGINT,ridBIGINT,titleSTRING,tsSTRING,unameSTRING,uidSTRING)ROWFORMATDELIMITEDFIELDSTERMINATEDBY''STOREDASTEXTFILELOCATION'/my/local/path/to/file';但是现在我有一个文件,每一行

hadoop - 区域服务器无法联系 HBase Master

我有一个由3个slave和1个master组成的Hadoop集群,上面有一个分别有3个RS和1个master的HBase集群。此外,在3台机器上还有一个Zookeeper集成。Hadoop集群以及Zookeeper整体正常运行。但是,HBase集群未能正确初始化。我通过运行./bin/start-hbase.sh启动HBase。这正确启动了HBaseMaster和区域服务器。hdfs中的hbase文件夹已正确设置。jpsonmasterhduser@master:~/hbase$jps5694HMaster3934JobHistoryServer3786NameNode3873Reso