草庐IT

位置图

全部标签

hadoop - 运行存储在 HDFS 位置的配置单元脚本

我正在尝试运行存储在HDFS位置(hdfs://nameservice1/user/neeraj)中的配置单元脚本(.hql文件),但我找不到正确的命令来执行它。有没有办法直接从HDFS位置运行它而不是将它移动到我的/home/位置? 最佳答案 hive-f演示cat>my_script.sqlselect1+1asresult;hdfsdfs-putmy_script.sql/tmphive-fselect1+1asresult;OK2 关于hadoop-运行存储在HDFS位置的配置单

hadoop - Hive:修改外部表的位置需要太长时间

Hive有ManagedTables和ExternalTables两种表,区别可以查看Managed.VSExternalTables.目前,要将外部数据库从HDFS移动到Alluxio,我需要将外部表的位置修改为alluxio://。语句类似于:altertablecatalog_pagesetlocation"alluxio://node1:19998/user/root/tpcds/1000/catalog_returns"按照我的理解,应该是简单的metastore修改,但是对于一些表的修改,需要几十分钟。顺便说一句,数据库本身包含大约1TB的数据。我有什么办法可以加快表更改过

java - hive-jdbc-__-standalone.jar 的正确位置是什么?

关于设置hive0.14的指南:http://www.ishaanguliani.com/content/hive-0140-setup-ubuntu提示如果出错:Logginginitializedusingconfigurationinjar:file:/usr/local/hive/lib/hive-common-0.14.0.jar!/hive-log4j.propertiesSLF4J:ClasspathcontainsmultipleSLF4Jbindings.遇到文件hive-jdbc-0.14.0-standalone.jar必须从$HIVE_HOME/lib/移出但是

hadoop - 如何设置 Spark 作业暂存位置

我的spark作业失败了,因为用户无权访问spark尝试写入暂存或临时数据集的目录。2017-03-1010:25:47,0928ERRORJniCommonfs/client/fileclient/cc/jni_MapRClient.cc:2072Thread:26413mkdirsfailedfor/user/cxpdiprod/.sparkStaging/application_1488190062017_14041,error13Exceptioninthread"main"org.apache.hadoop.security.AccessControlException:Us

hadoop - 如何更改 HADOOP 日志文件位置

我正在运行一个hadoop进程,这需要几个小时和大量空间,并且进程停止是因为没有太多空间。Hadooptmp文件夹剩余空间很大,所以我认为这是Hadoop_log_files目录的问题,正如我检查过的那样,那里没有太多空间。因此,任何人都可以建议如何将hadoop日志文件位置更改为另一个位置而不是/home/hduser/hadoop/logs而不必更改hadoop设置的整个位置。如果有任何帮助,我将不胜感激。 最佳答案 我在hadoop-env.sh中找到了一个属性:#Wherelogfilesarestored.$HADOOP_

手机取证——文件位置略解

手机取证——文件位置略解持续更新补充捏😘彩信/短信取证通常情况下安卓设备的短信/彩信数据都储存在以下文件夹中:/data/data/com.android.providers.telephony/databases/mmssms.db苹果备份短信位置通常都在HomeDomain/Library/SMS/sms.dbOPPO备份/Basic/sms/sms.dbSAMSUNG设备/data/data/com.sec.android.provider.logsprovider/databases/logs.dbAndroid消息-Bugle_dbBugle_db是Android消息应用内部使用的数

eclipse - 在 VM 中访问 Hadoop 后 Eclipse Europa 中的 DFS 位置

我是hadoop的新手。我需要安装它并试用示例。所以我提到了这个tutorial.我已经安装了该教程中给出的Sandbox。我需要在Windows中配置ECLIPSE,并在教程中给出下图中指定的VM位置。我已经安装了eclipseeuropa和hadoop插件。然后在Map/ReduceLocations中,我为主机名提供了VMIp,在UserName中提供了Linux用户名,在Map/Reduce端口中提供了9001,在DFS端口中提供了9000。在“高级”选项卡中,我将mapred.system.dir的值设置为/hadoop/mapred/system并且没有hadoop.job

hadoop - MapReduce 中间数据输出位置

您刚刚执行了一个MapReduce作业。从Mapper的map方法发出后,中间数据写入到哪里?A.中间数据通过网络从Mapper流式传输到Reduce,并且永远不会写入磁盘。B.进入运行Mapper的TaskTracker节点上的内存缓冲区,溢出并写入HDFS。C.进入内存缓冲区,溢出到运行Mapper的TaskTracker节点的本地文件系统。D.进入内存缓冲区,溢出到运行Reducer的TaskTracker节点的本地文件系统(HDFS之外)E.进入运行Reducer的TaskTracker节点上的内存缓冲区,溢出并写入HDFS。 最佳答案

hadoop - Hive - 在多行上拆分分隔列,根据位置选择

我正在寻找一种基于逗号分隔数据拆分列的方法。下面是我的数据集idcol1col215,67,8我要得到结果idcol1col2157168索引的位置应该匹配,因为我需要相应地获取结果。我尝试了以下查询,但它返回了笛卡尔积。查询:SELECTcol3,col4FROMtestextlateralVIEWexplode(split(col1,'\002'))col1AScol3lateralVIEWexplode(split(col2,'\002'))col2AScol4结果:idcol1col2157158167168 最佳答案 您可

hadoop - 如何使用oozie检查文件是否存在于HDFS位置?

如何使用Oozie检查HDFS位置的文件是否存在?在我的HDFS位置,我会在每天晚上11点得到一个像这样的文件test_08_01_2016.csv。我想在晚上11点15分之后检查这个文件是否存在。我可以使用Oozie协调器作业安排批处理。但是我如何验证该文件是否存在于HDFS中? 最佳答案 您可以在oozie中使用EL表达式,例如:${fs:exists('/path/test_08_01_2016.csv')}您还可以使用简单的shell脚本使用捕获输出来构建文件的名称。 关于had