草庐IT

wp_insert_user

全部标签

Java Spark 将 HIVE View 重制为 INSERT

我有以下从HDFS读取JSON文件并使用Spark将其输出为HIVEView的Java代码。packageorg.apache.spark.examples.sql.hive;importjava.io.File;importjava.io.Serializable;importjava.util.ArrayList;importjava.util.List;importorg.apache.spark.api.java.function.MapFunction;importorg.apache.spark.sql.Dataset;importorg.apache.spark.sql.

mysql - 使用 drill 修改 RDBMS 时的 UPDATE/INSERT

如果我使用apachedrill并连接到像MySQL这样的RDBMS,我是否能够使用完整的SQL语法(如UPDATE/INSERT)?我看过this关于HDFS上的UPDATE/INSERT的回答,想知道在使用drill和RDBMS时这些是否有任何区别。 最佳答案 不,不支持。您可以将Drill视为SQL引擎,而不是数据库。SQL引擎旨在尽快对大量数据执行选择语句,以便用户可以回答有关其数据的问题。数据库是具有额外数​​据管理功能(如插入和更新)的SQL引擎。通常人们在不再变化的数据上使用Drill。例如,如果您正在运行一个网站并且

user-interface - 在 Cloudera 中创建表单

我在Cloudera生态系统中工作,作为初学者,我从实现flumetwitter示例开始并成功完成。现在,每当我想从Twitter流式传输不同关键字的数据时,我必须进入Twitter的配置文件并对其进行编辑,然后使用终端执行flume代理。我正在考虑一种方法,让用户打开一个表单并在其中输入关键字,然后执行flume代理从Twitter获取数据,而不是每次都去Twitter配置文件。为此,我想知道Cloudera生态系统中是否有任何工具可以实现我上面讨论的想法? 最佳答案 据我所知,ClouderaManager是唯一允许Flume代

hadoop - 权限被拒绝 : user=basi, access=WRITE, inode ="/":

我是hadoop和pig的新手。我在ubuntu和hadoop的本地用户中安装了pig作为hduser。Pig在小型数据集的本地模式下工作正常。在mapreduce模式下启动pig并尝试实现wordcount但权限被拒绝错误如下。引起:org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.security.AccessControlException):权限被拒绝:user=basi,access=WRITE,inode="/":hduser:supergroup:drwxr-xr-x以psudomode启动hadoop在本地用

hadoop - 如何解决错误 "file:/user/hive/warehouse/records is not a directory or unable to create one"?

hive>CREATETABLErecords(yearSTRING,temperatureINT,qualityINT)>ROWFORMATDELIMITED>FIELDSTERMINATEDBY'\t';FAILED:ExecutionError,returncode1fromorg.apache.hadoop.hive.ql.exec.DDLTask.MetaException(message:file:/user/hive/warehouse/recordsisnotadirectoryorunabletocreateone)如何解决错误?/user/hive/warehous

postgresql - Put 请求失败 : INSERT INTO "PARTITION_PARAMS" when executing an insert. .select 包含数百个字段的查询

在带有hive3的HortonworksHDP3集群上通过Tez执行插入..选择查询,我收到以下错误:java.sql.SQLException:Errorwhileprocessingstatement:FAILED:ExecutionError,returncode1fromorg.apache.hadoop.hive.ql.exec.MoveTask.MetaException(message:Putrequestfailed:INSERTINTO"PARTITION_PARAMS"("PARAM_VALUE","PART_ID","PARAM_KEY")VALUES(?,?,?

shell - 如何打开hdfs ://localhost:54310/user/hduser/

我尝试使用命令在hadoop中创建一个目录hadoopfs-mkdir计数那么如何在单节点集群上打开或查看hdfs://localhost:54310/user/hduser/count? 最佳答案 要查看文件夹及其内容,您可以执行如下操作:hadoopfs-lscount如果你想获取内容到你的本地文件系统,那么你可以使用gethadoopfs-getcount有关所有命令行选项的更多详细说明,请阅读here. 关于shell-如何打开hdfs://localhost:54310/use

hadoop - 在 Hive 中添加 JAR 给出错误 "Query returned non-zero code: 1, cause:/user/hive/warehouse/abc.jar does not exist."

我创建了一个UDF并将jar导出为abc.jar。将jar复制到/user/hive/warehouse中的hdfs。现在,我遇到以下错误:hive>ADDJAR/user/hive/warehouse/abc.jar;/user/hive/warehouse/abc.jardoesnotexistQueryreturnednon-zerocode:1,cause:/user/hive/warehouse/abc.jardoesnotexist.hive>当我这样做时,hadoopfs-ls/user/hive,我可以在/user/hive/warehouse看到abc.jar路径。我

hadoop - Sqoop 导入 hive 数据库不会发生在/user/hive/warehouse

我已经安装了hadoop2.7.2,同时尝试使用下面的sqoop命令将数据导入到配置单元表中,为什么它试图插入到/user/root/而不是插入到/user/hive/warehousesqoopimport-all-tables\--num-mappers1\--connect"jdbc:mysql://localhost:3306/retail_db"\--username=root\--password=root\--hive-import\--hive-overwrite\--hive-databasesqoop_import\--create-hive-table

hadoop - 我必须创建/tmp 和/user/hive/warehouse 吗?

来自https://cwiki.apache.org/confluence/display/Hive/GettingStartedRunningHiveHiveusesHadoop,so:youmusthaveHadoopinyourpathORexportHADOOP_HOME=Inaddition,youmustusebelowHDFScommandstocreate/tmpand/user/hive/warehouse(akahive.metastore.warehouse.dir)andsetthemchmodg+wbeforeyoucancreateatableinHive.