草庐IT

hortonworks-dataflow

全部标签

java - 如何在 Hortonworks VM 上的 Spark 上运行 .jar?

我是HortonworksVM的新手,我很困惑。我正在尝试在Spark上运行.jar文件。通常我通过运行在Windows上进行本地测试spark-submit--driver-memory4g--classen.name.ClassName%CODE%/target/program.jar但由于我需要Hive,所以我想我应该转移到HortonworksVM以在本地进行测试。现在,我已经通过Hortonworks的Ambari的HDFS文件GUI将我的.jar和输入文件上传到HDFS(到/tmp/my_code目录)。接下来是什么?我也找到了命令行,但是如何从VM的命令行访问HDFS上的

hadoop - hortonworks 沙箱配置单元 Metastore 不工作

版本:HortonworksSandbox2.6.5_1onVirtualbox安装后找不到mysqlroot密码,因此重置mysqlroot密码。在密码重置配置单元工作之前,现在配置单元元存储没有启动。拒绝用户'root'@'sandbox-hdp.hortonworks.com'的访问(使用密码:YES)...写入文件['/usr/hdp/current/hive-metastore/conf/conf.server/hive-site.jceks']因为内容不匹配。我将mysqlroot密码更改为“hive”、“bigdata”、“hadoop”,但我仍然无法启动hivemeta

hadoop - hortonworks 沙箱中的 Vi 问题

作为Hadoop的新用户,我发现当我连接到virtualBox时我只能使用vi。如果我输入“vim”,它会显示-bash:vim:commandnotfound。那么有没有人可以告诉我如何在沙箱中使用vim?谢谢你们。PS:我用的是Mac,vm信息:名称:HortonworksSandbox2.1,操作系统:RedHat(64位)。 最佳答案 您应该先安装它。在CentOS/RedHat上:sudoyuminstallvim-X11vim-commonvim-enhancedvim-minimal

hadoop - HortonWorks hadoop 数据安全和加密工具

谁能告诉我Hadoop的HortonWorks发行版支持的可用于数据安全和加密的工具?还有,如何在hdfs和hive中完全或部分加密数据文件。 最佳答案 Hortonworks数据平台(HDP)支持ApacheKnox这是一个REST网关,以身份验证和访问控制的形式提供边界安全。这是一个很棒的幻灯片共享演示文稿,描述了howHortonworksworkswithKnox.此外,Hortonworks数据平台2.2版还支持ApacheRanger,这是一个基于策略的安全框架,用于定义策略以控制对文件、文件夹、数据库、表或列的访问。这

hadoop - Hadoop Standalone 和 Pseudodistributed 模式下的 DataFlow 区别?

谁能告诉我HadoopStandalone和Pseudodistributed模式的数据流有什么区别。事实上,我正在尝试运行JohnNorstad提出的矩阵乘法示例。它在hadoop独立模式下运行良好,但在伪分布式模式下无法正常工作。我无法解决问题,所以请告诉我hadoop独立模式和伪分布式模式之间的主要区别,这有助于解决所述问题。谢谢请注意,工作人员 最佳答案 在独立模式下,一切(namenode、datanode、tasktracker、jobtracker)都在一台机器上的一个JVM中运行。在伪分布式模式下,一切都在自己的JV

linux - 在 Hortonworks Distribution 中归档 HDFS 文件时出现 AWK 使用问题

我正在尝试将HDFS目录中超过3天的文件移动到HDFS中的存档文件夹。AWK脚本:hdfsdfs-lshdfs://companycluster/data/src/purecloud/current|tail-n+2|xargs-n8|awk'{DAY_CONV=(60*60*24);X="date+%s";X|getlineED;printf("")>"X";close("X");Y="date-d\"$6\"+%s";Y|getlineSD;printf("")>"Y";close("Y");DIFF=(ED-SD)/DAY_CONV;print"SD=",SD"ED=",ED,"

hadoop - Hortonworks 沙盒连接到 Tableau 时出错

我正在使用HortonWorks沙盒并尝试连接到tableau,但出现以下错误。我可以在tableau中选择我的表和列,但无法访问这些值。这是在向hive中的用户授予管理员权限之后。错误:[Hortonworks][HiveODBC](35)ErrorfromHive:errorcode:'40000'errormessage:'Errorwhilecompilingstatement:FAILED:HiveAccessControlExceptionPermissiondenied.Principal[name=hue,type=USER]doesnothavefollowingpr

hadoop - HortonWorks Hadoop 沙箱和 Tableau

我正在尝试将Tableau连接到HortonWorksHadoop沙箱,如下所述:http://hortonworks.com/kb/how-to-connect-tableau-to-hortonworks-sandbox/Tableau能够将虚拟服务器视为数据源,并准确列出可用的模式和表。但是,当尝试选择任何表或预览其数据时,它会显示一个错误弹出窗口,提示'加载数据时发生错误。没有这样的表[default].[tablename]',其中default是模式,tablename是我试图查看的表的名称。这是我从vm沙盒中的终端窗口运行ifconfig时返回的结果。Tableau正在通

hadoop - Hortonworks HA Namenodes 给出错误 "Operation category READ is not supported in state standby"

我的hadoop集群HA事件名称节点(host1)突然切换到备用名称节点(host2)。我无法在hadoop日志(在任何服务器中)中找到任何错误来确定根本原因。切换名称节点后,hdfs日志中经常出现以下错误,并且应用程序无法读取HDFS文件。2014-07-1701:58:53,381WARNnamenode.FSNamesystem(FSNamesystem.java:getCorruptFiles(6769))-Getcorruptfileblocksreturnederror:OperationcategoryREADisnotsupportedinstatestandby一旦我

sql - 如何将SQL数据加载到Hortonworks中?

我已经在我的电脑上安装了HortonworksSandBox。还尝试使用CSV文件并将其以表结构方式获取(Hive+Hadoop),nw我想将我当前的SQL数据库迁移到沙箱(MSSQL2008r2)中。我将如何做到这一点?还想连接到我的项目(VS2010C#)。是否可以通过ODBC连接?我听说sqoop用于将数据从SQL传输到Hadoop,那么我如何使用sqoop进行此迁移? 最佳答案 您可以编写自己的作业来迁移数据。但Sqoop会更方便。为此,您必须downloadSqoop和相应的连接器,在您的案例中是适用于ApacheHado