草庐IT

too_many_buckets_exception

全部标签

hadoop - 解释 "There can be many keys (and their associated values) in each partition, but the records for any given key are all in a single partition"

“每个分区中可以有许多键(及其相关值),但任何给定键的记录都在一个分区中。”这是一本著名的hadoop教科书的一行。我没有理解它的第二部分的全部含义,即“但是任何给定键的记录都在一个分区中。”这是否意味着单个键的所有记录都应该在单个分区或其他地方。 最佳答案 buttherecordsforanygivenkeyareallinasinglepartition如果您有一个键,则该键及其相关联的值必须位于单个分区上。有时该值可能相当大。但这是对值大小的限制。它必须足够小以适合单个分区。请注意,键和值上可能还有其他常量,具体取决于您用于

exception - AWS EC2 上的 Spark 在开始我的工作时抛出 EOFException

我正在尝试在我使用他们提供的Spark-ec2脚本创建的Spark集群上运行我的Spark作业。我能够运行SparkPi示例,但每当我运行我的工作时,我都会收到此异常:Exceptioninthread"main"java.io.IOException:Calltoec2-XXXXXXXXXX.compute-1.amazonaws.com/10.XXX.YYY.ZZZZ:9000failedonlocalexception:java.io.EOFExceptionatorg.apache.hadoop.ipc.Client.wrapException(Client.java:1107

exception - NoSuchMethodError HTableDescriptor.addFamily

我已经安装了hadoop2.5.2和hbase1.0.1.1(它们相互兼容)。但是在hadoop代码中,我试图在hbase表中添加columnfamily。我的代码是ConfigurationhbaseConfiguration=HBaseConfiguration.create();JobhbaseImportJob=newJob(hbaseConfiguration,"FileToHBase");HBaseAdminhbaseAdmin=newHBaseAdmin(hbaseConfiguration);if(!hbaseAdmin.tableExists(Config_value

java - 创建 spark 客户端失败 : Hive on spark exception

我已将Hive执行引擎更改为SPARK。在执行任何DML/DDL时,我都会遇到异常。hive>selectcount(*)fromtablename;QueryID=jibi_john_20160602153012_6ec1da36-dcb3-4f2f-a855-3b68be118b36Totaljobs=1LaunchingJob1outof1Inordertochangetheaverageloadforareducer(inbytes):sethive.exec.reducers.bytes.per.reducer=Inordertolimitthemaximumnumberof

java - Debian 上的单节点 Hadoop : failed on connection exception

我在debian上安装了hadoop,运行良好。(不在VM中)然后我重新启动计算机,它开始显示问题。我得到错误-hadoopfs-ls/user/hduser返回这样的错误-16/06/1510:48:34WARNutil.NativeCodeLoader:Unabletoloadnative-hadooplibraryforyourplatform...usingbuiltin-javaclasseswhereapplicablels:CallFromlocalhost/127.0.0.1tomylocalcomp:9000failedonconnectionexception:ja

hadoop - 运行时异常 : Error in configuring object with null pointer exception while running my UDAF?

我一直在尝试编写一个UDAF来计算加权平均值。我用类似于现有UDAF的方式编写它来计算平均值,但它似乎只适用于我的本地机器。我不确定出了什么问题....有人遇到过类似的问题吗以下是生成的错误:java.lang.RuntimeException:Errorinconfiguringobjectatorg.apache.hadoop.util.ReflectionUtils.setJobConf(ReflectionUtils.java:93)atorg.apache.hadoop.util.ReflectionUtils.setConf(ReflectionUtils.java:64)

hadoop - 获取错误 {"RemoteException": {"exception" :"IllegalArgumentException" ,"javaClassName":

我在我的EC2实例上设置了CHD4。一切正常。当我尝试访问时:http://ec2-00-000-000-000.us-west-1.compute.amazonaws.com:50075/webhdfs/v1/?op=GETHOMEDIRECTORY我遇到以下错误:{"RemoteException":{"exception":"IllegalArgumentException","javaClassName":"java.lang.IllegalArgumentException","message":"namenoderpcaddressisnotspecified."}}我什至

MySQL报错:too many connections原因及解决方法

MySQL报错“toomanyconnections”通常是由于数据库的最大连接数超过了MySQL配置的最大限制。这可能是由于数据库的并发连接过多,或者存在一些连接没有被正确关闭。这里给出一些可能的解决方案:1、linux登录mysql:mysql-uroot-p;2、查看mysql允许的最大连接数showvariableslike'%max_connections%';3、查看这次mysql服务启动到现在,同一时刻最多mysql有多少连接showstatuslike'Max_used_connections';4、修改mysql最大连接数setglobalmax_connections=10

hadoop - 在两节点 hadoop 集群中运行映射缩减作业时出错 : Too many fetch-failures, 读取任务输出时出错 http://localhost:50060/tasklog

我已经建立了一个双节点hadoop集群。我启动了hadoop文件系统和mapreduceddaemons没有错误,并验证它们正在主从上运行。我可以使用命令bin/hadoopdfs-getmergehdfs://my.domain.com:54310/user/wordcount/sunzi.txt/tmp/wordcount从主节点和从节点读取输入文件。当我运行mapreduce作业时,我在输出中看到错误。作业最终完成,但reduce部分花费了很长时间,并且每次打印错误时它都会继续返回map任务。我的站点配置文件引用了master的dns名称,所以我不知道为什么作业要尝试从“loca

java - mapreduce 程序中的错误 : Exception in thread "main" java. lang.VerifyError

我是mapreduce程序的初学者,在运行该程序时出现以下错误:Exceptioninthread"main"java.lang.VerifyError:(class:com/google/common/collect/Interners,method:newWeakInternersignature:()Lcom/google/common/collect/Interner;)Incompatibleargumenttofunction错误是什么以及要包含哪个jar文件? 最佳答案 另一个原因是同时使用google-collect