草庐IT

create_default_context

全部标签

hadoop - Hive:每当它触发 map reduce 时,它​​都会给我这个错误 "Can not create a Path from an empty string",我该如何调试?

我正在使用hive0.10以及何时使用hive-e"showtables",hive-e"desctable_name"itworks!但是当我执行类似hive-e"selectcount(*)table_name使用旧版本的配置单元和新集群抛出此错误。调试此类问题的正确方法应该是什么,没有从谷歌找到任何解决问题的方法。java.lang.IllegalArgumentException:CannotcreateaPathfromanemptystringatorg.apache.hadoop.fs.Path.checkPathArg(Path.java:91)atorg.apache

java - HBase:原子 'check row does not exist and create' 操作

我认为这应该是一种常见情况,但可能是我在谷歌搜索时使用了错误的关键字。我只需要用完全随机的键创建新的表记录。假设我获得了具有良好随机性(几乎随机)的key。但是我不能100%确定还没有行存在。所以我需要自动执行的操作:使用行键检查尚无行存在。如果行存在则拒绝操作。如果不退出则创建行。我找到的关于此主题的最有用的信息是关于HBaserowlocks.的文章我认为HBase行锁是合适的解决方案,但我想在没有显式行锁定的情况下做得更好。ICV看起来不合适,因为我确实希望key是随机的。如果CAS可以处理“行不存在”的情况,那会很棒,但看起来他们做不到。显式行锁有一些缺点,例如区域拆分问题。有

Hadoop hive : How to allow regular user continuously write data and create tables in warehouse directory?

我在单个节点上运行Hadoop2.2.0.2.0.6.0-101。我正在尝试运行JavaMRD程序,该程序在普通用户下从Eclipse将数据写入现有的Hive表。我得到异常:org.apache.hadoop.security.AccessControlException:Permissiondenied:user=dev,access=WRITE,inode="/apps/hive/warehouse/testids":hdfs:hdfs:drwxr-xr-x发生这种情况是因为普通用户对仓库目录没有写权限,只有hdfs用户有:drwxr-xr-x-hdfshdfs02014-03-0

python - spark 1.3.0、python、avro 文件、在 spark-defaults.conf 中设置的驱动程序类路径,但从属设备看不到

我正在使用带有python的spark1.3.0。我有一个使用以下命令读取avro文件的应用程序:conf=NonerddAvro=sc.newAPIHadoopFile(fileAvro,"org.apache.avro.mapreduce.AvroKeyInputFormat","org.apache.avro.mapred.AvroKey","org.apache.hadoop.io.NullWritable",KeyConverter="org.apache.spark.examples.pythonconverters.AvroWrapperToJavaConverter",

java - Hadoop 中 Mapper.Context 的 API 文档在哪里?

我很高兴能加快Hadoop的速度,其中包括检查thttps://hadoop.apache.org/docs/current/api/类Mapper的文档广泛引用了类Mapper.Context(org.apache.hadoop.mapreduce.Mapper.Context)。但是,除了旧版本的API之外,我看不到该Mapper.Context类/接口(interface)/无论它是什么的API文档。在当前的API中,我可以在哪里找到特别针对Mapper.Context的文档?我看到它在不同的地方使用(context.write方法,最常见),但我找不到这些方法的当前文档,尽管我

hadoop - Cloudera hadoop : not able to run Hadoop fs command and at same time HBase is not able to create directory on HDFS?

我已经启动并运行了6个节点的cloudera5.0beta集群但是我无法使用命令查看hadoopHDFS的文件和文件夹sudo-uhdfshadoopfs-ls/在输出中它显示了linux目录的文件和文件夹。尽管namenodeUI正在显示文件和文件夹。在HDFS上创建文件夹时出现错误sudo-uhdfshadoopfs-mkdir/testmkdir:`/test':Input/outputerror由于此错误,hbase未启动并关闭并出现以下错误:Unhandledexception.Startingshutdown.java.io.IOException:Exceptioninm

hadoop - java.lang.OutOfMemoryError : unable to create new native thread for big data set 错误

我运行的hive查询对于小型数据集运行良好。但我正在运行2.5亿条记录,我在日志中遇到的错误低于此FATALorg.apache.hadoop.mapred.Child:Errorrunningchild:java.lang.OutOfMemoryError:unabletocreatenewnativethreadatjava.lang.Thread.start0(NativeMethod)atjava.lang.Thread.start(Thread.java:640)atorg.apache.hadoop.mapred.Task$TaskReporter.startCommuni

引入echars5.0报错“export ‘default‘ (imported as ‘echarts‘) was not found in ‘echarts‘解决方案

引入echars5.0报错“export‘default‘(importedas‘echarts‘)wasnotfoundin‘echarts‘解决方案前言:老版本的echars样式与新版本的组件美观度相差巨大,以美观为主所以把组件升级成了echars5.0,结果报错了【"export‘default’(importedas‘echarts’)wasnotfoundin‘echarts’】!一、npmrundev报错直接报错:"export‘default’(importedas‘echarts’)wasnotfoundin'echarts’二、报错原因与解决方案新版本的echarts引入方式

hadoop - Spark - java IOException :Failed to create local dir in/tmp/blockmgr*

我试图运行一个长时间运行的Spark作业。执行几个小时后,出现以下异常:Causedby:java.io.IOException:Failedtocreatelocaldirin/tmp/blockmgr-bb765fd4-361f-4ee4-a6ef-adc547d8d838/28试图通过检查来绕过它:/tmp目录中的权限问题。spark服务器未以root身份运行。但是/tmp目录应该对所有用户都是可写的。/tmp目录有足够的空间。 最佳答案 假设您正在使用多个节点,您需要检查参与spark操作的每个节点(master/drive

sql - 错误消息 : TOK_ALLCOLREF is not supported in current context - while Using DISTINCT in HIVE

我在HIVE0.11中使用简单的命令:SELECTDISTINCT*FROMfirst_working_table;,我收到以下错误消息:FAILED:SemanticExceptionTOK_ALLCOLREFisnotsupportedincurrentcontext.有人知道为什么会这样吗?我们该如何解决?谢谢,加仑。 最佳答案 Hive不支持DISTINCT*语法。您可以手动指定表的每个字段以获得相同的结果:SELECTDISTINCTfield1,field2,....,fieldNFROMfirst_working_ta