copy-initialization

hadoop - 错误 : Could not initialize class org. xerial.snappy.Snappy

我使用sqoop1.4.6将数据从RDBMS导入到hdfs，使用snappyCodec作为压缩和avro作为文件格式。我安装了以下组件Hadoop2.8.0Spark2.1.0hive1.2.2斯卡拉2.11.8Cassandra3.10当我尝试使用以下命令将mysql表导入hdfs时:sqoopimport--connectjdbc:mysql://******:****/retail_db--username****--password****--tableorder_items--compress--compression-codecorg.apache.hadoop.io.co

initialize hadoop section br compression sqoop snappy

hadoop - Spark 提交 :ERROR SparkContext: Error initializing SparkContext

我正在尝试在HadoopYARN客户端模式下运行我的spark作业，我正在使用以下命令$/usr/hdp/current/spark-client/bin/spark-submit--masteryarn-client--driver-memory1g--executor-memory1g--executor-cores1--filesparma1--jarsparam1param2--classcom.dc.analysis.jobs.AggregationJobsparkanalytics.jarparam1param2param3请在下面找到spark-default配置:Spa

SparkContext initializing spark apache java hadoop apache-spark hadoop-yarn data-processing hortonworks-sam

linux - 运行 hadoop 集群时在 Google Cloud Platform 上获取 'sudo: unknown user: hadoop' 和 'sudo: unable to initialize policy plugin error'

我正在尝试部署Google在https://github.com/GoogleCloudPlatform/solutions-google-compute-engine-cluster-for-hadoop提供的示例Hadoop应用程序在谷歌云平台上。我逐步按照那里给出的所有设置说明进行操作。我能够设置环境并成功启动集群。但是我无法运行MapReduce部分。我正在我的终端上执行这个命令:./compute_cluster_for_hadoop.pymapreduce[--prefix]--inputgs://\--outputgs://\--mappersample/shortest

amp hadoop compute cluster linux google-compute-engine google-cloud-platform google-hadoop

linux - 预认证失败 : Password read interrupted while getting initial credentials

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。这个问题似乎与helpcenter中定义的范围内的编程无关。.关闭4年前。Improvethisquestion这是我遇到过的事情，我找到了解决方案。从那里没有任何问题，我会把它作为一个问题发布，我会写下我的解决方案作为答案。环境:操作系统:CentosLinux、MacOS(BigSur)集群:ClouderaHadoopDistribution，工具:Kerberos问题:我通过“ktutil”创建了“user.keytab”文件来更新没有密码的krb票据，正如这里推荐的那样https://kb.

interrupted credentials section user class linux hadoop kerberos keytab

apache-spark - 错误 : User did not initialize spark context

记录错误:TestSuccessfull2018-08-2004:52:15INFOApplicationMaster:54-Finalappstatus:FAILED,exitCode:132018-08-2004:52:15ERRORApplicationMaster:91-Uncaughtexception:java.lang.IllegalStateException:Userdidnotinitializesparkcontext!atorg.apache.spark.deploy.yarn.ApplicationMaster.runDriver(ApplicationMas

spark apache-spark ApplicationMaster apache hadoop

r - Sparklyr copy_to 失败

我正在使用Sparklyr库从R读取数据并将数据写入HDFS。读取数据按预期工作，但写入会出现问题。为了能够使用spark_write_csv函数，我需要将我的Rdata.frames转换为Spark对象。我为此使用了sparklyrsdf_copy_to函数(也尝试使用copy_to)。但是，我总是出错代码:table1错误:Error:org.apache.hadoop.mapred.InvalidInputException:Inputpathdoesnotexist:hdfs://iacchadoopdev01.dap:8020/tmp/Rtmp2gpelH/spark_ser

Sparklyr copy_to section sdf_copy_to copy r hadoop apache-spark

hadoop - 如何解决 Oozie 错误 : JA009: Cannot initialize Cluster. 检查 mapreduce.framework.name 的配置

我一直在使用oozie来安排spark作业。尝试使用Oozie中可用的spark操作在2.x集群中部署spark作业。在我的job.properties中，我有以下内容`nameNode=hdfs://hostname:8020jobTracker=hostname:8050master=yarn-clusterqueueName=defaultoozie.use.system.libpath=true`当我提交oozie作业时，我一直收到此错误错误:错误代码[JA009]，消息[JA009:无法初始化集群。请检查您的mapreduce.framework.name配置和相应的服务器地

initialize framework oozie section apache hadoop oozie-coordinator

hadoop - hive ，直线 : Peer indicated failure: GSS initiate failed

我正在使用在Kerberos中添加的帐户启动beeline来测试Sentry:beeline-u"jdbc:hive2://IP:10000/;principal=test_table/domain_name@HADOOP.COM"但是JavaHotSpot(TM)64-BitServerVMwarning:ignoringoptionMaxPermSize=512M;supportwasremovedin8.0JavaHotSpot(TM)64-BitServerVMwarning:ignoringoptionMaxPermSize=512M;supportwasremovedin8

indicated initiate section code hive hadoop

hadoop - kinit : Client's credentials have been revoked while getting initial credentials

我的hdp集群配置了带有AD的kerberos。所有HDP服务帐户都生成了主体和key表，包括spark。我知道服务帐户没有密码并设置为未过期。现在在执行kinit-ktspark.keytab-pspark-PRINCIPAL时出现以下错误(请参阅标题)。我在麻省理工学院的网站上读到，这是由于多次登录尝试失败或KDC中默认策略中设置的帐户过期而发生的。可以使用kadmin命令解锁帐户，例如kadmin:modprincispark/principal但我已与AD管理员进行交叉检查。他说我们在使用AD时不使用kdc服务器执行kadmin命令，但说使用ADUI检查时spark帐户处于解锁

credentials getting section spark strong hadoop apache-spark active-directory kerberos hortonworks-data-platform

我正在使用ClouderaSqoop将数据从Oracle数据库提取到HDFS。除了®和©之类的一些字符在HDFS中被转换为®©之外，一切都很好。(但是在Oracle中，数据存储没有任何问题)。有什么办法可以将这些字符按原样存储在HDFS中吗？Sqoop版本:1.3谢谢，卡尔西凯亚最佳答案您在Oracle数据库中使用哪种格式的字符？由于Hadoop使用的是UTF-8格式，不同的数据需要从Oracle数据库转换过来。关于hadoop-将包含®和©等字符的数据从Oracle加载到HDFS

时出 hadoop section Oracle hdfs sqoop

114 115 116117118 119 120