草庐IT

HASKELL_PLATFORM_DIR

全部标签

hadoop - oozie - sqoop $SQOOP_CONF_DIR 尚未在环境中设置

我正在尝试使用oozie(霍顿作品)运行sqoop。这是我第一次尝试运行oozie工作流,但出现以下错误InvokingSqoopcommandlinenow1811[main]WARNorg.apache.sqoop.tool.SqoopTool-$SQOOP_CONF_DIRhasnotbeensetintheenvironment.Cannotcheckforadditionalconfiguration.2015-12-2116:58:45,913WARN[main]tool.SqoopTool(SqoopTool.java:loadPluginsFromConfDir(177

oracle - 使用外部 Oracle 数据库设置 IBM Open Platform

当我尝试使用Oracle数据库作为RDBMS安装单节点IBMOpenPlatform集群时,我有点困惑。首先,我了解到IBMBigInsights的Hadoop部分不是相应Apache版本的修改版本(如HortonWorks所做的那样),因此,当Ambari(来自IBM存储库)让我使用外部Oracle数据库时,我想它应该工作。我可能是错的,我在蹩脚的IBM安装指南中找不到任何oracle引用来正确设置它(只是它应该适用于Oracle11gR2)因此,就像我使用等效的HortonWorks发行版(但使用来自IBM的二进制文件)一样,我使用所有oracle参数设置我的ambari-serv

hadoop - Hadoop 2.x 系列是否弃用了 `dfs.data.dir` 属性?

dfs.data.dir属性在2.x系列中是否仍然有效?从这个hdfs-site.xmldocumentation大概版本1.2.1和这个hdfs-site.xmldocumentation是什么对于大概2.4.1来说,很明显dfs.data.dir已被弃用。我的推断是真的吗?如果是这样,现在它的等价物是什么?在生产中更改hadoop.tmp.dir并保留它? 最佳答案 请查看此链接Deprecatedproperty,由于该属性被标记为已弃用,您仍然可以利用该属性的功能行为。最好使用Deprecated属性。

scala - 监听器异常 : Mkdirs failed to create/tmp/temporary ( full permission given to the dir. )

当我编写流数据时显示此错误时,我正在学习结构化流CountQuery:org.apache.spark.sql.streaming.StreamingQuery=org.apache.spark.sql.execution.streaming.StreamingQueryWrapper@604770e3org.apache.spark.sql.streaming.StreamingQueryException:QueryCount[id=4ce8572a-24c9-4cde-97e4-051426cbb15e,runId=59c60d53-73ee-43a4-8792-d5907a88

hadoop - SparkR 错误 : The root scratch dir:/tmp/hive on HDFS should be writable

我正在尝试初始化SparkR,但出现权限错误。我的Spark版本是spark-2.2.1-bin-hadoop2.6。我搜索了这个错误以及如何解决它,我发现了几个相关的主题。但是,我无法使用与这些主题相同的方法来解决它,他们提供的解决方案(以及我尝试过的解决方案)是使用以下命令授予/tmp/hive目录权限:sudo-uhdfshadoopfs-chmod-R777/tmp/hive有足够知识的人可以给我另一种可能的解决方案吗?错误堆栈跟踪如下:$sudo./bin/sparkRRversion3.4.2(2017-09-28)--"ShortSummer"Copyright(C)20

java - Hadoop 2.7.3 WARN util.NativeCodeLoader : Unable to load native-hadoop library for your platform. .. 在适用的情况下使用内置 java 类

我在debianjessie上安装hadoop时遇到问题,运行脚本start-dfs.sh时收到警告hadoop@debian1:~$/usr/local/hadoop/sbin/start-dfs.sh24年3月17日10:40:00警告util.NativeCodeLoader:无法为您的平台加载nativehadoop库...在适用的情况下使用内置java类在[localhost]上启动名称节点localhost:启动namenode,记录到/usr/local/hadoop/logs/hadoop-hadoop-namenode-debian1.outlocalhost:启动d

azure - 使用 NiFi 从 Azure 到 Google Cloud Platform 的数据流

我的目标是使用NiFi将json/xml文件从Azure移动到GoogleCloudPlatform(GCP)>。在我所有的研发之后,我发现了一些可能有用的处理器。列表如下:获取文件放置文件putGCSObject-将数据放入GCPFoundthislinkasanalternativetogetfilesfromAzuresincethereisnoin-builtprocessoravailable上面的链接很复杂。所以根据我的目标,我走对了吗?我需要额外的处理器吗??以及在定义此流程时我需要进行的任何重要配置?请帮助我,因为我是新手并且刚刚开始使用NiFi

hadoop - Google Cloud Platform for NiFi 数据路径

我想在NiFi的GetFile处理器中给出inputfolder的位置。根据NiFi,我提供的路径不正确。它仍然显示警告标志。我跟着这个link但它不能提供太多帮助。下面是我在GetFile处理器的inputpath属性中使用的路径:/browser//我什至试过下面的链接gs://或gs://browser/他们都没有帮助。按照Shu的建议,我创建了一个ListGCSBucket处理器并为其创建了一个新的GCPCredentialsService但是当我运行这个处理器时它给出了一个错误:com.google.cloud.storage.StorageException:NotFoun

hadoop - namenode.NameNode : Could not initialize shared edits dir

您好,我在HA集群配置时间遇到了所有这些错误。请帮助我哪里错了。14/09/0811:13:38INFOnamenode.AclConfigFlag:ACLsenabled?false14/09/0811:13:38INFOcommon.Storage:Lockon/usr/local/hadoop/dfs/tmp/dfs/name/in_use.lockacquiredbynodename1170@n314/09/0811:13:38WARNnamenode.FSNamesystem:Encounteredexceptionloadingfsimagejava.io.IOExcept

hadoop - Sqoop增量导入 "Cannot append files to target dir"

我在使用Sqoop将数据从MySQL导入Hive时遇到问题...这个查询:sqoopimport--connectjdbc:mysql://xx.xx.xx.xx/database\--usernamesqoop--passwordsqoop--tabledatatable\--target-dir/home/cloudera/user/hive/warehouse/database.db/datatable\--as-parquetfile-m1--append返回这个错误:15/01/1416:27:28WARNutil.AppendUtils:Cannotappendfilest