草庐IT

SH_MariaDB_VM

全部标签

java - 如何在 Hortonworks VM 上的 Spark 上运行 .jar?

我是HortonworksVM的新手,我很困惑。我正在尝试在Spark上运行.jar文件。通常我通过运行在Windows上进行本地测试spark-submit--driver-memory4g--classen.name.ClassName%CODE%/target/program.jar但由于我需要Hive,所以我想我应该转移到HortonworksVM以在本地进行测试。现在,我已经通过Hortonworks的Ambari的HDFS文件GUI将我的.jar和输入文件上传到HDFS(到/tmp/my_code目录)。接下来是什么?我也找到了命令行,但是如何从VM的命令行访问HDFS上的

xml - 可以将 HCatalog 与 XML 一起使用吗? -- 在 Cloudera VM 上执行 ETL

我正在处理一个大数据类的项目,我已经在本地安装了ClouderaQuickstartVM以在我的数据集上运行一些基本任务并熟悉一些工具。我正在学习一个教程,其中涉及将数据集移动到HDFS,基于数据集文件创建一个HCatalog表,然后在该表上运行Hive和/或Pig命令。问题是我的数据是一个大的XML文件,HCatalog中的标准分隔符选项不适用。有没有办法将XML导入HCatalog?如果不是,在我的XML数据集上使用Hive或Pig的最佳方法是什么?编辑:我的文件来自公共(public)StackOverflow数据集。我正在使用posts.xml文件。它非常大(25GB),我无法

kafka-consumer-groups.sh消费者组管理

1.查看消费者列表--listbin/kafka-consumer-groups.sh--bootstrap-serverhadoop102:9092,hadoop103:9092,hadoop104:9092--list  先调用MetadataRequest拿到所有在线Broker列表再给每个Broker发送ListGroupsRequest请求获取消费者组数据。2.查看消费者组详情–describe查看指定消费组详情--groupbin/kafka-consumer-groups.sh--bootstrap-serverhadoop102:9092,hadoop103:9092,hado

hadoop - start-mapred.sh 的替代品是什么?

我正在阅读有关Hadoop的书,其中提到了脚本start-mapred.sh。我下载了最新版的Hadoop,里面没有start-mapred.sh脚本。我看到有start-yarn.sh但它会启动JobTracker和TaskTracker组件吗? 最佳答案 Yarn是MapReduce的下一个版本,它不使用作业和任务跟踪器,而是使用资源管理器来完成它的工作。对于MRv1,使用2.3.0版本的hadoop。同样的程序也可以使用Yarn运行。启动hadoop只需使用start-all.sh或start-dfs.sh和start-yar

Oracle VM VirtualBox安装的Centos7无法上网

OracleVMVirtualBox安装的Centos7无法上网解决方法:1、设置第一块网卡使用仅主机网络。2、设置第二块网卡使用网络地址转换(NAT)。 

Oracle VM VirtualBox安装的Centos7无法上网

OracleVMVirtualBox安装的Centos7无法上网解决方法:1、设置第一块网卡使用仅主机网络。2、设置第二块网卡使用网络地址转换(NAT)。 

java - 除了修改 hadoop-env.sh 之外,如何在 hadoop 中指定系统属性?

我想在运行hadoop作业时设置系统属性(不是hadoop属性)。我发现设置系统属性并不容易。即使我在shell中设置属性exportHADOOP_OPTS="$HADOOP_OPTS:-Dproperty=value"还是不行。hadoop命令行的“-D”选项仅用于配置,不用于系统属性。所以“-D”选项也不起作用有人有想法吗?谢谢 最佳答案 为什么不在通过命令行启Action业时直接使用内嵌的-Dfoo.bar=example,如下所示:hadoopjarexample.jarcom.example.ExampleTool-Dfo

hadoop - 使用 start-all.sh 启动 hadoop 进程遇到问题

关闭。这个问题是off-topic.它目前不接受答案。想改进这个问题吗?Updatethequestion所以它是on-topic用于堆栈溢出。关闭10年前。Improvethisquestion我正在使用redhatlinux4.1.2当我尝试使用以下命令启动hadoop时,它要求输入root@localhost密码。我不明白这里要输入什么密码。sreenath@sreenath-pc#sudo-i[root@sreenath-pchadoop-1.1.1]#bin/start-all.shWarning:$HADOOP_HOMEisdeprecated.startingnameno

ssh - hadoop 与 cygwin : hadoop-daemon. sh:未找到

我正在cygwin上安装hadoop。我有一台windows764位机器,我一直在关注这里的instrux:http://alans.se/blog/2010/hadoop-hbase-cygwin-windows-7-x64/#software.我在cygwin中设置了无密码SSH,并安装了hadoop0.20.2。当我发出bin/start-dfs.sh时,我得到以下信息:startingnamenode,loggingto/usr/local/hadoop-0.20.2/bin/../logs/hadoop-T3S-namenode-t3s780mon.outlocalhost:

hadoop - 运行 Hadoop/bin/start-all.sh 时名称解析暂时失败

我在SUSELinux上运行Hadoop/bin/start-all.sh时遇到“Temporaryfailureinnameresolution”。我搜索了很多网站寻找问题,但找不到有效的答案。期待您的帮助,谢谢!!它部署在一个相同的机器上,所以在主/从文件中只有一行:localhostsolom@linux87:~/hadoop>bin/hadoopnamenode-format11/07/1217:43:10INFOnamenode.NameNode:STARTUP_MSG:/****************************************************