MAPR-DB_草庐IT

mysql - 配置单元 : why is metastore_db created in my project folder?

我把hive-site.xml在我的spark/confdir并将其配置为连接到thrift://:9083而且我没有使用derby我有mysql-connector-jar在hive/lib文件夹中，每次我创建hive表和存储数据时，所有数据都存储在metastore_db中在我的项目目录中，而不是在我的hdfs://:9000/user/hive/warehouse中，所以如果我删除metastore_db数据就会丢失。conf/hive-site.xmljavax.jdo.option.ConnectionURLjdbc:mysql://saurab:3306/metastore

配置单 metastore_db gt lt code mysql hadoop hive apache-spark-sql

hadoop - 未找到 MapR maprcli 命令

我已经安装了mapr-client，mapr-httpfs并且我已经运行了下面的命令:./configure.sh-Nmy.cluster.com-c-secure-C192.168.145.121:7222-HS192.168.145.122结果是:create/opt/mapr/conf/conf.oldConfiguringHadoop-2.7.0at/opt/mapr/hadoop/hadoop-2.7.0DoneconfiguringHadoopCLDBnodelist:192.168.145.121:7222Zookeepernodelist: ExternalZookee

maprcli hadoop section mapr

hadoop - Apache Drill - 不在 Hive DB 中列出表

我已经创建了必要的存储插件，并且在发出showdatabase命令时会显示hive中的相关数据库。当使用use命令使用其中一个配置单元数据库时，我发现我无法选择该数据库中的任何表。进一步看，当发出showtable命令时，该数据库中的任何表都不会通过ApacheDrill显示出来，而它们在Hive中看起来很好。在通过Hive向任何用户授予权限方面，我是否遗漏了什么？ApacheDrill究竟是如何连接到Hive以运行相关作业的？感谢您的回复。最佳答案 Showtables;目前不会列出Hive表。最好在配置单元表之上创建View。

hadoop Apache section 配置单 strong hive apache-drill

rest - 通过 REST API [MapR 6.1/Hadoop-2.7] 从 Yarn 查询节点标签拓扑

有一个Java和CLI接口(interface)可以查询YarnRM的节点到节点标签(和反向)映射。有没有办法通过REST-API来做到这一点？最初的RM-API搜索显示只有基于节点标签的作业提交是一个选项。遗憾的是，这实际上在MapR-Hadoop(截至6/6/19的6.1)中被破坏了，所以我的代码必须通过实现正确的调度本身来解决这个问题。这可以使用YarnClientJavaAPI(几乎没有-这里还有更多损坏的API)。但由于我想同时针对不同的资源管理器安排作业，在防火墙后面，REST-API是实现此目的最引人注目的选择，而YarnClientAPI的RPC后端不容易传输。我目前最

Hadoop rest code section apache hadoop-yarn mapr

hadoop - 选择用于快速网络分析的 DB、OLAP 解决方案(大数据阵列)

我遇到以下问题:我的系统每天从不同站点收集约3亿次点击。每个都有时间、用户ID、类型(广告或常规)、http地址、站点ID。还有一组用户~200M，其中有性别、年龄段和国家。需要设计一个基于点击数据的系统，可以实时报告不同用户组的点击情况。像OLAP解决方案:-)例如，绘制2011年10月至9月英国15-25岁女孩的点击率图表。您建议选择哪个数据库，以及构建OLAP多维数据集的解决方案？我正在寻找开源解决方案，例如HBase(+zohmg或级联)Hypertable或其他(免费DWH:-))。最佳答案这是海量数据，每天300Mi

大数 hadoop section OLAP 的 analytics

ruby - 如何使用 Ruby 在 MapR HDFS 中保存文件

有没有办法使用来自Ruby的Hadoop的MapR分发将文件保存在HDFS中？显然，有一个名为thriftfs的ThriftAPI可以从客户端与HDFS通信，但看起来它没有与MapR捆绑在一起。最佳答案我也在http://answers.mapr.com/questions/1525/how-to-run-thriftfs-from-mapr?page=1#1528回答了这个问题基本思想是像Ruby这样的语言不需要语言特定的绑定(bind)来访问MapR集群的文件系统。相反，您需要做的就是将集群挂载为NFS文件系统，您可以进行任

ruby section questions how-to-run-thriftfs-from-mapr hadoop hdfs mapr

oracle - 如何将日期/时间戳字符串写入 Oracle DB 中的日期时间戳列？

我已经使用AVRO文件格式和Hive外部表将一些Oracle表存储在Hadoop中以访问数据。我在导入时使用Oracle的TO_CHAR函数将日期和时间戳值存储为格式化字符串。现在我想使用Spark将这些确切数据导出回具有日期列的Oracle表。我使用命令://CreateadataframefromtheHivetablevaldata=sqlContext.sql("select*fromavro_table")//exportdftoexistingoracletabledata.write.mode("overwrite").jdbc(jdbcString,"tableName

oracle format Column apache hadoop apache-spark hive avro

hadoop - 如何使用 Hbase rest API 将数据从 IBM db2 导入到 Hbase

实际上我们的需求是使用HbaserestAPI将数据从IBMdb2导入到hbase。任何人都可以向我提供详细信息或步骤。提前致谢。最佳答案你可以试试sqoop-hbaseimport 关于hadoop-如何使用HbaserestAPI将数据从IBMdb2导入到Hbase，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/questions/57292350/

Hbase hadoop section stackoverflow 求是 hadoop2

hadoop - 什么是 Mapr Warden？

我正在玩MaprSandbox，我不明白MaprWarden应用程序的作用是什么。Mapr网站包含对配置文件的引用，但没有程序本身的描述。最佳答案 Warden是一个轻型Java应用程序，它在集群中的所有节点上运行并协调集群服务。Warden在每个节点上的工作是启动、停止或重新启动适当的服务，并为它们分配正确数量的内存。Warden广泛使用本指南ZooKeeper部分中讨论的znode抽象来监视集群服务的状态。Warden配置包含在warden.conf文件中，它以::的形式列出服务三元组。此三元组的节点数元素控制可以在集群上运行

hadoop Warden section Management mapr

Hadoop Spark (Mapr) - AddFile 它是如何工作的

我想了解hadoop是如何工作的。假设我在hdfs上有10个目录，它包含100个我想用spark处理的文件。在书中-使用Spark进行快速数据处理这要求文件在集群中的所有节点上都可用，这并不是什么大问题本地模式的问题。在分布式模式下，你会想要使用Spark的addFile功能，用于将文件复制到集群中的所有机器。我无法理解这一点，将在每个节点上创建文件副本。我想要的是它应该读取该目录中存在的文件(如果该目录存在于该节点上)抱歉，我有点困惑，如何在spark中处理上述情况。问候最佳答案 Thesectionyou'rereferrin

AddFile Hadoop 20 code section apache-spark