草庐IT

secure_file_priv

全部标签

file - hadoop -appendToFile 与 hadoop -put 在用于将流数据连续更新到 hdfs 时有什么区别

根据hadoop源代码,从类中提取了以下描述-appendToFile"Appendsthecontentsofallthegivenlocalfilestothegivendstfile.Thedstfilewillbecreatedifitdoesnotexist."放"Copyfilesfromthelocalfilesystemintofs.Copyingfailsifthefilealreadyexists,unlessthe-fflagisgiven.Flags:-p:Preservesaccessandmodificationtimes,ownershipandthemo

hadoop - 什么是 AWS EMR 的 -file 参数

我正在通过控制台启动EMR集群。控制台自动在Arguments字段中添加了-filess3://jmilloy/milp_mapper.py,这是我为映射器提供的位置。我在任何地方都找不到记录的-file选项。它有什么作用?为什么会自动添加?如果我删除它会怎样?我可以将我的脚本需要的S3中的其他文件放在那里吗? 最佳答案 简答:-files不是EMR标志,而是一种将文件添加到DistributedCache的方法.长版:Hadoop使用称为GenricOptionsParser的东西用于解析命令行选项。当您使用python编写映射器

file - Avro hadoop随机访问文件

我想知道Avro是否支持随机访问或查询。例如,如果我创建一个名为B.avro的Avro文件,其中包含2个二进制文件X.png和Y.png,是否可以直接访问Y.png?无需遍历整个文件,如果有一种方法可以直接使用文件key访问文件内容,那就太好了。如果没有,是否有任何其他数据结构允许我在hadoop环境sequenceFiles,HAR中执行此操作?我基本上使用Avro作为处理hadoop中大量小文件的一种方式,但我也想查询这些文件,这使得将它们存储在更大的集合中变得困难。谢谢。 最佳答案 我不知道是否有任何OOTB特性可以让我们通过

java - HBase on Tomcat7 安装错误: Could not initialize class org. apache.hadoop.security.ShellBasedUnixGroupsMapping

我正在尝试通过tomcatservlet访问AWSEMR主节点上的HBase。我在tomcatservletget请求上有这段代码:Configurationconf=HBaseConfiguration.create();conf.setInt("timeout",120000);conf.set("hbase.master","*"+hbaseHost+":9000*");conf.set(HBASE_CONFIGURATION_ZOOKEEPER_QUORUM,hbaseZookeeperQuorum);conf.set(HBASE_CONFIGURATION_ZOOKEEPER

file - Hadoop 定期生成的文件

我想使用Hadoop来处理每n分钟生成的输入文件。我应该如何处理这个问题?例如,我每10分钟收到一次美国城市的温度测量值,我想计算每周和每月每天的平均温度。PS:到目前为止,我考虑过使用ApacheFlume来获取读数。它将从多个服务器获取数据并定期将数据写入HDFS。从哪里我可以阅读和处理它们。但是我怎样才能避免一次又一次地处理相同的文件呢? 最佳答案 您应该考虑像Storm这样的大数据流处理平台(我非常熟悉,不过还有其他平台),它可能更适合您提到的聚合和指标类型。但是,无论哪种方式,您都将实现某种形式,其中包含整套已处理的数据,

java.io.IOException : File/tmp/hadoop-eo/mapred/system/jobtracker. 信息只能复制到 0 个节点,而不是 2 个

当我在我们的主机上部署hadoopnamenode时,我们一次又一次地遇到异常,任何人都可以帮助提供任何建议吗?提前致谢。2014-08-0509:08:00,538INFOorg.apache.hadoop.hdfs.server.namenode.FSNamesystem:Numberoftransactions:31Totaltimefortransactions(ms):1NumberoftransactionsbatchedinSyncs:0Numberofsyncs:21SyncTimes(ms):172014-08-0509:08:00,542INFOorg.apache

security - 在 HDFS 中创建一次写入文件

我有一个正在努力解决的要求。我的目标是创建一个在后台自动捕获的用户进程和命令的历史文件,创建一个实时存档到Hadoop的历史文件。日志系统连接终止后,用户不应编辑或删除该文件。我当前的结构将我的日志系统通过管道传输到hadoopfs-put-命令。问题是创建的文件归用户所有,使他们能够删除该文件。有没有办法让目录级别的执行权限覆盖HDFS中的用户所有权权限?还有另一种方法可以解决这个问题吗? 最佳答案 我不确定,您是在寻找hdfs-chmod还是-chown命令? 关于security-

security - 在 CentOS 6 上配置 Kerberos 时出错

在CentOS6上运行的私有(private)服务器上配置Kerberos后,当我运行kinit时出现此错误,我得到以下响应:kinit:RealmnotlocaltoKDCwhilegettinginitialcredentials这是我的配置文件的副本:[logging]default=FILE:/var/log/krb5libs.logkdc=FILE:/var/log/krb5kdc.logadmin_server=FILE:/var/log/kadmind.log[libdefaults]dns_lookup_realm=truedns_lookup_kdc=truetick

security - 是否有与 Accumulo 的授权类等效的 HBase 1.2?

在Accumulo1.6中,有一个org.apache.accumulo.core.security.Authorizations类(class)。它基本上包装了一组授权字符串。Authorizations对象可以传递给如下方法:org.apache.accumulo.core.client.Connector.createScanner(字符串,授权)org.apache.accumulo.core.client.Connector.createBatchDeleter(String,Authorizations,int,BatchWriterConfig)HBase1.2有类似的概

hadoop - ifile EBADF : Bad file descriptor while performing matrix addition 上的预读失败

我正在尝试在ApachePig中编写用于矩阵加法的代码。matrixM=LOAD'Mmatrix.txt'USINGPigStorage(',')AS(i,j,v);matrixN=LOAD'Nmatrix.txt'USINGPigStorage(',')AS(i,j,v);unionres=UNIONmatrixM,matrixN;DUMPunionres;res=GROUPunionresBY(i,j);DUMPres;ILLUSTRATEres;final_res=FOREACHresGENERATEgroup.$0ASi,group.$1ASj,SUM(unionres.v)A