草庐IT

files-from

全部标签

file - Hadoop 定期生成的文件

我想使用Hadoop来处理每n分钟生成的输入文件。我应该如何处理这个问题?例如,我每10分钟收到一次美国城市的温度测量值,我想计算每周和每月每天的平均温度。PS:到目前为止,我考虑过使用ApacheFlume来获取读数。它将从多个服务器获取数据并定期将数据写入HDFS。从哪里我可以阅读和处理它们。但是我怎样才能避免一次又一次地处理相同的文件呢? 最佳答案 您应该考虑像Storm这样的大数据流处理平台(我非常熟悉,不过还有其他平台),它可能更适合您提到的聚合和指标类型。但是,无论哪种方式,您都将实现某种形式,其中包含整套已处理的数据,

java.io.IOException : File/tmp/hadoop-eo/mapred/system/jobtracker. 信息只能复制到 0 个节点,而不是 2 个

当我在我们的主机上部署hadoopnamenode时,我们一次又一次地遇到异常,任何人都可以帮助提供任何建议吗?提前致谢。2014-08-0509:08:00,538INFOorg.apache.hadoop.hdfs.server.namenode.FSNamesystem:Numberoftransactions:31Totaltimefortransactions(ms):1NumberoftransactionsbatchedinSyncs:0Numberofsyncs:21SyncTimes(ms):172014-08-0509:08:00,542INFOorg.apache

java - 当运行 hadoop fs -ls 结果是 "ls: Call From java.net.UnknownHostException: ubuntu: ubuntu: unknown error to localhost:9000...."

ls:CallFromjava.net.UnknownHostException:ubuntu:ubuntu:unknownerrortolocalhost:9000failedonconnectionexception:java.net.ConnectException:Connectionrefused;Formoredetailssee:http://wiki.apache.org/hadoop/ConnectionRefused我的hadoop配置是这样的。/etc/主机127.0.0.1localhost#ThefollowinglinesaredesirableforIPv

Hadoop IO 错误 : Type mismatch in key from map : expected org. apache.hadoop.io.Text,收到 RegexMatcher.CustomKey

我收到以下错误:java.lang.Exception:java.io.IOException:Typemismatchinkeyfrommap:expectedorg.apache.hadoop.io.Text,receivedRegexMatcher.CustomKeyatorg.apache.hadoop.mapred.LocalJobRunner$Job.runTasks(LocalJobRunner.java:462)atorg.apache.hadoop.mapred.LocalJobRunner$Job.run(LocalJobRunner.java:522)Caused

解决bash syntax error near unexpected token from

目录解决bashsyntaxerrornearunexpectedtokenfrom原因分析解决方法什么是Bash脚本Bash脚本的特点编写和运行Bash脚本Bash脚本示例解决bashsyntaxerrornearunexpectedtokenfrom在编写Bash脚本时,如果遇到类似​​syntaxerrornearunexpectedtoken'from'​​的错误,这意味着脚本中的某个语法有问题。本篇博客文章将介绍如何解决这个错误。原因分析该错误通常是因为在Bash脚本中存在语法错误或错误的引号使用方式导致的。以下是一些常见的可能原因:在脚本中使用了未正确闭合的引号。比如,双引号或单引

hadoop - ifile EBADF : Bad file descriptor while performing matrix addition 上的预读失败

我正在尝试在ApachePig中编写用于矩阵加法的代码。matrixM=LOAD'Mmatrix.txt'USINGPigStorage(',')AS(i,j,v);matrixN=LOAD'Nmatrix.txt'USINGPigStorage(',')AS(i,j,v);unionres=UNIONmatrixM,matrixN;DUMPunionres;res=GROUPunionresBY(i,j);DUMPres;ILLUSTRATEres;final_res=FOREACHresGENERATEgroup.$0ASi,group.$1ASj,SUM(unionres.v)A

hadoop - pig : get data from hive table and add partition as column

我有一个分区的Hive表,我想将其加载到Pig脚本中,并且还想将分区添加为列。我该怎么做?Hive中的表定义:CREATEEXTERNALTABLEIFNOTEXISTStransactions(column1string,column2string)PARTITIONEDBY(datestampstring)ROWFORMATDELIMITEDFIELDSTERMINATEDBY'\t'LOCATION'/path';pig脚本:%defaultINPUT_PATH'/path'A=LOAD'$INPUT_PATH'USINGPigStorage('|')AS(column1:cha

Could not resolve all files for configuration ‘:app:androidJdkImage‘.

在使用./gradlewbuild编译项目时候遇到了该问题,整体错误如下:*Whatwentwrong:Configurationcachestatecouldnotbecached:field`generatedModuleFile`of`com.android.build.gradle.tasks.JdkImageInput`beanfoundinfield`compilerArgumentProviders`of`org.gradle.api.tasks.compile.CompileOptions`beanfoundinfield`capturedArgs`of`java.lang.i

java - Cloudera Quickstart VM illegalArguementException : Wrong FS: hdfs: expected: file:

我有一个简单的java代码可以将一个文本文件从本地复制到hdfs。我正在使用cloudera的quickstart虚拟机。Configurationconf=newConfiguration();conf.addResource(newPath("/etc/hadoop/conf/core-site.xml"));conf.addResource(newPath("/etc/hadoop/conf/hdfs-site.xml"));FileSystemfs=FileSystem.get(conf);fs.copyFromLocalFile(newPath("/home/cloudera

hadoop - Hive from_unixtime() 生成不合适的日期

我正在使用查询从名为dual的虚拟表生成时间戳。但是,从该表返回的日期似乎无效。selectString(max(max_lid_date))asprev_reqline_max_lid_date,from_unixtime(unix_timestamp(),'YYYY-MM-DDhh:mm:ss')asjob_start_date,from_unixtime(unix_timestamp(),'YYYY-MM-DD00:00:01')aspull_to_datefromxxcss_ktn_req_line_detail_log;查询结果:prev_reqline_max_lid_da