草庐IT

create-cluster

全部标签

mysql - 使用 create-hive-table 在 Hive 中创建表时如何使用自定义分隔符

我正在尝试将数据从RDBMS表导入HDFS。然后我使用create-hive-table将架构复制到配置单元,然后将数据加载到该配置单元表。用于导入HDFS的命令sqoopimport--connectjdbc:mysql://localhost/sqoop--usernamesqoop--passwordsqoop--tablecustomers--warehouse-dirtestingsqoop-m1--fields-terminated-by','--enclosed-by"\'"--lines-terminated-by"\n"用于创建配置单元表的命令:sqoopcreate

hadoop - 是否可以从 hive create external table 命令导出/创建外部表文件到远程服务器

是否可以从hivecreateexternaltable命令导出/创建外部表文件到远程服务器。createexternaltableSOME_TABLE(MY_Coulmns)rowformatdelimitedfieldsterminatedby','linesterminatedby'\n'storedastextfilelocation'';要求:我必须将这个文件/数据从hive导出到Cassandra(在不同的服务器上)。 最佳答案 通过Hive使用带有用户名和密码的IP进行外部存储不是一个好的做法,因为它可能会成为一个安全

windows - 在 yarn cluster (linux) : Error no sheme for Filesystem "C" 上从客户端 (windows) 执行 spark

我想将一个spark应用程序(只是一个简单的HelloWorld应用程序)部署到我的hadoop集群。在我的Windows机器上使用spark提交,我使用--masteryarn在客户端模式下执行应用程序。连接到hadoop集群是成功的,在集群上的日志文件中可以看到。(hadoopconf文件已经从集群下载下来,保存在客户端windows机器上,环境变量已经设置好)。使用hadoop2.7和spark1.6这是使用的spark-submit命令:>spark-submit--masteryarn--class"SimpleApp"..\..\SimpleApp\target\scala

hadoop - Spark-SQL 在 yarn-cluster 上的错误 hdfs 权限

我有一个简单的工作,就是通过sparksql在hdfs中读取hive。我首先在yarn-client模式下运行它,我没有遇到任何问题。几次之后,我开始通过yarn-cluster模式启动它,但我遇到了这个问题:我有这个hdfs权限错误:Causedby:MetaException(message:org.apache.hadoop.security.AccessControlException:Permissiondenied:user=yarn,access=EXECUTE,inode="/Projects/SNB/directory/Private/table/table_ORC"

java - sqoop导入java io异常: Mkdir failed to create a file

通过sqoopjava将MySQL数据导入HDFS时出现错误。但是我授予了hdfs的所有权限,然后我也遇到了同样的问题。任何人都可以解决这个问题。Hadoop版本:2.6.0Sqoop:1.4.6请准确地建议我应该给本地文件系统什么权限。提前致谢。16/12/2813:14:54WARNsqoop.ConnFactory:$SQOOP_CONF_DIRhasnotbeensetintheenvironment.Cannotcheckforadditionalconfiguration.16/12/2813:14:54INFOmanager.SqlManager:Usingdefault

hadoop - Spark 上的 hive : Failed to create spark client

我正在尝试使Spark2.1.0上的Hive2.1.1在单个实例上运行。我不确定这是正确的方法。目前我只有一个实例,所以我无法构建集群。当我在配置单元中运行任何插入查询时,出现错误:hive>insertintomcus(id,name)values(1,'ARM');QueryID=server_20170223121333_416506b4-13ba-45a4-a0a2-8417b187e8ccTotaljobs=1LaunchingJob1outof1Inordertochangetheaverageloadforareducer(inbytes):sethive.exec.re

rest - 它是 Hbase REST API `get version/cluster` 中的错误吗?

HbaseRESTAPI,此接口(interface)get'version/cluster',当我使用headerAccept:application/json时,响应不是JSON而是纯文本。curl-XGET\-H"Accept:application/json"\"http://localhost:8888/version/cluster"#"1.2.2"但是当我使用Accept:text/xml时,响应是正确的XML。curl-XGET\-H"Accept:text/xml"\"http://localhost:8888/version/cluster"#1.2.2

hadoop - Spark 作业出错,出现 : Too many elements to create a power set 34

我正在尝试在查询弹性数据的mesos集群中运行一个spark作业,使用esJsonRDD查询如下:FetchingesJsonRDDfromelasticsearchwithcomplexfilteringinSpark,对于少于32个节点的多节点弹性集群运行良好。随着弹性中节点的增加,作业失败并出现以下异常:org.elasticsearch.hadoop.EsHadoopIllegalArgumentException:Toomanyelementstocreateapowerset37如https://github.com/elastic/elasticsearch-hadoop

mysql - 配置单元 : why is metastore_db created in my project folder?

我把hive-site.xml在我的spark/confdir并将其配置为连接到thrift://:9083而且我没有使用derby我有mysql-connector-jar在hive/lib文件夹中,每次我创建hive表和存储数据时,所有数据都存储在metastore_db中在我的项目目录中,而不是在我的hdfs://:9000/user/hive/warehouse中,所以如果我删除metastore_db数据就会丢失。conf/hive-site.xmljavax.jdo.option.ConnectionURLjdbc:mysql://saurab:3306/metastore

hadoop - 提交拓扑后命令状态停止 "Creating job WordCountTopology"

我尝试使用ApacheMesos、ApacheAurora、ZooKeeper和HDFS构建Heron集群。但是,当我在完成后提交WordCountTopology时,命令输出如下:停止“创建作业WordCountTopology”。yitian@ubuntu:~/.heron/conf/aurora$heronsubmitaurora/yitian/devel--config-path~/.heron/conf~/.heron/examples/heron-api-examples.jarcom.twitter.heron.examples.api.WordCountTopology