草庐IT

GC_INIT_WITH_MASK

全部标签

hadoop - 超出 Spark Job 错误 GC 开销限制

这个问题在这里已经有了答案:Errorjava.lang.OutOfMemoryError:GCoverheadlimitexceeded(22个答案)关闭6年前。我正在运行一个spark作业,我在spark-defaults.sh中设置了以下配置。我在名称节点中进行了以下更改。我有1个数据节点。我正在处理2GB的数据。spark.masterspark://master:7077spark.executor.memory5gspark.eventLog.enabledtruespark.eventLog.dirhdfs://namenode:8021/directoryspark.s

hadoop - 克伯罗斯 |云时代 | Krb异常 : Encryption type AES256 CTS mode with HMAC SHA1-96

我一直在尝试为CDH4.5设置Kerberos,这是使用ClouderaManager安装程序设置的。说明来自以下链接:http://www.cloudera.com/content/cloudera-content/cloudera-docs/CM4Ent/4.5.2/Configuring-Hadoop-Security-with-Cloudera-Manager/cmeechs_topic_4.html设置和KDC后,我将Java6文件的JCE策略复制到以下位置:/usr/java/jdk1.6.0_31/lib/security/以下是我的“/var/kerberos/krb5

java.io.IOException : Cannot initialize Cluster in Hadoop2 with YARN 异常

这是我第一次在stackoverflow上发帖,所以如果我做错了什么,我深表歉意。我最近建立了一个新的hadoop集群,这是我第一次尝试使用Hadoop2和YARN。我目前在提交作业时遇到以下错误。java.io.IOException:CannotinitializeCluster.Pleasecheckyourconfigurationformapreduce.framework.nameandthecorrespondserveraddresses.atorg.apache.hadoop.mapreduce.Cluster.initialize(Cluster.java:120)

exception - 索引 7 : hdfs://localhost:9000 with hadoop 处的权限中的非法字符

我正在尝试连接到hdfs。Configurationconfiguration=newConfiguration();configuration.set("fs.default.name",this.hdfsHost);fs=FileSystem.get(configuration);hdfsHost是127.0.0.1:9000。但是在FileSystem.get()中得到这个异常;我有另一个项目运行相同的代码,但运行良好。谁能提出任何建议?非常感谢异常跟踪:Exceptioninthread"main"java.lang.IllegalArgumentExceptionatjava

python selenuim TypeError: WebDriver.__init__() got an unexpected keyword argument ‘chrome_options‘

PythonselenuimTypeError:WebDriver.__init__()gotanunexpectedkeywordargument'chrome_options'运行客户端:Pycharm 运行程序如下:fromseleniumimportwebdriverfromselenium.webdriver.chrome.optionsimportOptionsoptions=Options()wd=webdriver.Chrome(chrome_options=options,executable_path=r'c:\chromedriver\chromedriver.exe')

r - 在 rhdfs 中的 hdfs.init() 中出现错误

我想运行hdfs.init(),我的代码是:Sys.setenv(HADOOP_CMD="C:\\hdp\\hadoop\\hadoop-1.2.0.1.3.0.0-0380\\bin\\hadoop")Sys.setenv(HADOOP_CONF_DIR="C:\\hdp\\hadoop\\hadoop-1.2.0.1.3.0.0-0380\\conf")library(rhdfs)hdfs.init()执行hdfs.init()后,我得到如下错误:>hdfs.init()Errorin.jnew("org/apache/hadoop/conf/Configuration"):jav

oracle - 异常 : Job Failed with status:3 when copying data from Oracle to HDFS through sqoop2

我正在尝试使用Sqoop2将数据从Oracle11g2服务器复制到HDFS。Oracle的链接似乎有效,因为如果我使用无效的凭据,它会提示。定义如下:linkwithid14andnameOLink(Enabled:true,Createdbyxxxat2/9/162:48PM,Updatedbyxxxat2/11/1610:08AM)UsingConnectorgeneric-jdbc-connectorwithid4LinkconfigurationJDBCDriverClass:oracle.jdbc.driver.OracleDriverJDBCConnectionString

java - NLineInputFormat 用法超出了 GC 开销限制

我正在尝试读取映射器中的多行。为此,我开始使用NLineInputFormat类。使用它时,我收到GC限制错误。作为引用,错误代码是:16/02/2101:37:13INFOmapreduce.Job:map0%reduce0%16/02/2101:37:38WARNmapred.LocalJobRunner:job_local726191039_0001java.lang.OutOfMemoryError:GCoverheadlimitexceededatjava.util.concurrent.ConcurrentHashMap.putVal(ConcurrentHashMap.j

hadoop - "Delegation Token can be issued only with kerberos or web authentication"空闲后重启 spark context

我尝试将spark应用程序部署到由YARN控制的kerberizedhadoop集群。Spark版本为1.5.0-cdh5.5.2。在超过10秒的空闲时间后停止SparkContext并初始化一个新的时,我遇到了一个奇怪的异常。我尝试做一些类似于this的事情开发人员,并明确指定了hdfs名称节点地址,但没有帮助。更令人困惑的是,如果我根本不重置SparkContext或在此spark上下文中执行最后一个命令后不到10秒内重置它,一切都会正常工作。我该如何解决?这是遇到问题的最小化情况:packagedemo;importorg.apache.spark.SparkConf;impor

hadoop - TaskID.<init>(Lorg/apache/hadoop/mapreduce/JobID;Lorg/apache/hadoop/mapreduce/TaskType;I)V

valjobConf=newJobConf(hbaseConf)jobConf.setOutputFormat(classOf[TableOutputFormat])jobConf.set(TableOutputFormat.OUTPUT_TABLE,tablename)valindataRDD=sc.makeRDD(Array("1,jack,15","2,Lily,16","3,mike,16"))indataRDD.map(_.split(','))valrdd=indataRDD.map(_.split(',')).map{arr=>{valput=newPut(Bytes.t