草庐IT

extensible-storage-engine

全部标签

java - 在 Google Compute Engine 上成功安装 Oryx?

我正在尝试在GoogleComputeEngine上启动并运行Oryx。我创建了一个新实例并通过以下方式安装了Oryx:gitclonehttps://github.com/cloudera/oryx.gitcdoryxmvn-DskipTestsinstall并将此安装保存为GoogleComputeEngine上的图像(“oryx-image”)。查找Oryx和Google文件系统的问题(Hadoop2.4.1andGoogleCloudStorageconnectorforHadoop)我一直在使用hdfs://作为默认文件系统。发现在GoogleComputeEngine上启动

apache-spark - ai/h2o/extensions/stacktrace/StackTraceExtension :Unsupported major. 次要版本 52.0

发生这种情况时,我正在使用苏打水。这是我的版本,完全符合文档的要求。jdk1.7.0_67scala-2.11.5hadoop-2.6.5spark-2.1.2-bin-hadoop2.6sparkling-water-2.1.27我使用了命令,成功启动了:bin/sparkling-shell--conf"spark.executor.memory=1g"它显示了这个:但是当我使用下一个命令时,却出错了。Exceptioninthread"H2OLauncherthread"java.lang.UnsupportedClassVersionError:ai/h2o/extension

mysql - 如何在 MySQL my.cnf 中永久设置 sql-mode ="NO_ENGINE_SUBSTITUTION"

更新于2015年1月18日修复在我们最近更新到MySQL5.6.27(来自Ubuntu存储库)之后,此选项现在可以使用。所以这似乎是以前版本的MySQL的问题。原始问题随着对MySQL(5.6.20)的新升级,更新和插入失败,除非我将sql-mode设置为NO_ENGINE_SUBSTITUTION。感谢documentation,我可以从mysql终端运行以下命令并解决问题(暂时):SETGLOBALsql_mode='NO_ENGINE_SUBSTITUTION';SETSESSIONsql_mode='NO_ENGINE_SUBSTITUTION';`但是下次MySQL重新启动时

mysql - 如何在 MySQL my.cnf 中永久设置 sql-mode ="NO_ENGINE_SUBSTITUTION"

更新于2015年1月18日修复在我们最近更新到MySQL5.6.27(来自Ubuntu存储库)之后,此选项现在可以使用。所以这似乎是以前版本的MySQL的问题。原始问题随着对MySQL(5.6.20)的新升级,更新和插入失败,除非我将sql-mode设置为NO_ENGINE_SUBSTITUTION。感谢documentation,我可以从mysql终端运行以下命令并解决问题(暂时):SETGLOBALsql_mode='NO_ENGINE_SUBSTITUTION';SETSESSIONsql_mode='NO_ENGINE_SUBSTITUTION';`但是下次MySQL重新启动时

java - 当 hive.execution.engine 值其 tez 时出现 NoSuchMethodError

我正在使用hive1.0.0和apachetez0.4.1当我将配置单元配置为使用tez时,出现异常。在hive-site.xml中,当hive.execution.engine值为mr时,它工作正常。但是如果我将它设置为tez我会得到这个错误:Exceptioninthread"main"java.lang.NoSuchMethodError:org.apache.tez.mapreduce.hadoop.MRHelpers.updateEnvBasedOnMRAMEnv(Lorg/apache/hadoop/conf/Configuration;Ljava/util/Map;)Va

hadoop - 错误 : Failed to create Data Storage while running embedded pig in java

我写了一个简单的程序来测试java中的嵌入式pig在mapreduce模式下运行。我运行的服务器hadoop版本是0.20.2-cdh3u4a,pig版本是0.10.0-cdh3u4a。当我尝试在本地模式下运行时,它运行成功。但是当我尝试以mapreduce模式运行时,它给了我错误。我使用以下命令运行我的程序,如http://pig.apache.org/docs/r0.9.1/cont.html#embed-java中所示javac-cppig.jarEmbedPigTest.javajavac-cppig.jar:.:/etc/hadoop/confEmbedPigTest.jav

java - Hadoop datanode 启动失败 org.apache.hadoop.hdfs.server.common.Storage : Cannot lock storage

我在尝试在Hadoop中启动数据节点时遇到一些问题,从日志中我可以看到数据节点启动了两次(部分日志如下):2012-05-2216:25:00,369INFOorg.apache.hadoop.hdfs.server.datanode.DataNode:STARTUP_MSG:/************************************************************STARTUP_MSG:StartingDataNodeSTARTUP_MSG:host=master/192.168.0.1STARTUP_MSG:args=[]STARTUP_MSG:ve

storage - 实现大规模日志文件分析

谁能给我指点引用或提供有关Facebook、雅虎、谷歌等公司如何执行大规模(例如多TB范围)日志分析的引用资料或高级概述,这些分析是他们为运营所做的,尤其是网络分析?特别关注网络分析,我对两个密切相关的方面很感兴趣:查询性能和数据存储。我知道一般方法是使用mapreduce将每个查询分布到集群上(例如使用Hadoop)。但是,最有效的存储格式是什么?这是日志数据,所以我们可以假设每个事件都有一个时间戳,并且通常数据是结构化的而不是稀疏的。大多数网络分析查询涉及分析两个任意时间戳之间的数据片段,并检索该数据中的聚合统计信息或异常情况。像BigTable(或HBase)这样的面向列的数据库

google-app-engine - 如何在 Scala 中使用泛型引用静态 Java 类的子类

我有这段Java代码:publicclassTestMapperextendsAppEngineMapper{publicTestMapper(){}//[...otheroverridenmethods...]@Overridepublicvoidsetup(Contextcontext){log.warning("Doingper-workersetup");}}...我已将其转换为:classTestMapperextendsAppEngineMapper[Key,Entity,NullWritable,NullWritable]{//[...otheroverridenmeth

storage - 可扩展的图像存储

我目前正在为基于Web的应用程序设计架构,该应用程序还应提供某种图像存储。用户将能够上传照片作为该服务的主要功能之一。查看这些图像也将是主要用途之一(通过网络)。但是,我不确定如何在我的应用程序中实现这样一个可扩展的图像存储组件。我已经考虑过不同的解决方案,但由于缺少经验,我期待听到您的建议。除了图像,还必须保存元数据。以下是我的初步想法:使用HDFS等(分布式)文件系统,并准备专用网络服务器作为“文件系统客户端”,以保存上传的图像和服务请求。图像元数据保存在附加数据库中,包括每个图像的文件路径信息。在HDFS之上使用HBase等面向BigTable的系统,并将图像和元数据保存在一起。