草庐IT

user_zip

全部标签

scala - Spark-Scala HBase 表创建失败(MetaException(消息 :file:/user/hive/warehouse/src is not a directory or unable to create one)

我的VM中运行着hortonworks沙盒。我已经完成了所有的hive-site.xml配置并放置在Spark/conf文件中。我可以使用PySpark访问HBase并创建/更新表,但是当我在Scala中执行相同的实现时,会出现以下错误:FAILED:ExecutionError,returncode1fromorg.apache.hadoop.hive.ql.exec.DDLTask.MetaException(message:file:/user/hive/warehouse/srcisnotadirectoryorunabletocreateone)我也更改了对“hive/war

multithreading - 为什么hadoop任务的real时间明显大于user+sys时间?

在hadoop任务上运行time命令时,出现如下结果:real0m25.839suser0m1.362ssys0m0.184我在VM上运行单个节点,并尝试在基准测试中记录hadoop任务的时间。 最佳答案 假设为I/O休眠所花费的时间不是原因,也许是VM本身作为主机上的进程运行这一事实导致了巨大的差异。实时表示挂钟时间。此处报告的user+sys时间是任务在VM处理器上花费的时间。因此,报告的实时时间将包括VM上运行的其他进程以及主机上运行的VM以外的进程使用的时间。 关于multith

hadoop - spark-submit --proxy-user 在 yarn 集群模式下不工作

目前我使用的是clouderahadoop单节点集群(启用了kerberos。)在客户端模式下我使用以下命令kinitspark-submit--masteryarn-client--proxy-userclouderaexamples/src/main/python/pi.py这很好用。在集群模式下,我使用以下命令(没有完成kinit并且缓存中没有TGT)spark-submit--principal--keytab--masteryarn-clusterexamples/src/main/python/pi.py也很好用。但是当我在集群模式下使用以下命令时(没有完成kinit并且缓

MySQL新建表:1044 - Access denied for user ‘root‘@%‘ to database ‘XXX‘终极解决方案

1.问题描述情况一:Navicat连接远程mysql数据库,创建数据库时出现错误:情况二:在linux中命令创建数据库出现如下报错:2.原因分析root权限不够,先使用“SELECThost,user,Grant_priv,Super_privFROMmysql.user;”查询,发现已经是Y了。通过SELECT*FROMmysql.user;命令查询权限信息,可以看到root对应的很多权限都是N,如下图所示:至于为什么会出现root权限不够,可能是安装mysql的时候MySQL权限配置不正确,或者修改了相关的配置文件等。3.解决方案将root权限全部修改为Y,执行如下代码(记得退出mysql

Hadoop hive : How to allow regular user continuously write data and create tables in warehouse directory?

我在单个节点上运行Hadoop2.2.0.2.0.6.0-101。我正在尝试运行JavaMRD程序,该程序在普通用户下从Eclipse将数据写入现有的Hive表。我得到异常:org.apache.hadoop.security.AccessControlException:Permissiondenied:user=dev,access=WRITE,inode="/apps/hive/warehouse/testids":hdfs:hdfs:drwxr-xr-x发生这种情况是因为普通用户对仓库目录没有写权限,只有hdfs用户有:drwxr-xr-x-hdfshdfs02014-03-0

python - 如何将带有依赖项的 python 脚本打包成 zip/tar?

我有一个hadoop集群,我正在使用Numpy、SciPy和Pandas进行数据分析。我希望能够使用命令的“--file”参数将我的hadoop作业作为zip/tar文件提交。该zip文件应该包含我的python程序需要执行的所有内容,这样无论我的脚本在集群中的哪个节点上执行,我都不会在运行时遇到ImportError。根据公司政策,在每个节点上安装这些库并不完全可行,尤其是对于探索性/敏捷开发。我确实安装了pip和virtualenv以根据需要创建沙箱。我看过zipimport和pythonpackaging但这些似乎都不能满足我的需求/我在使用这些工具时遇到困难。有没有人有幸做到这

java - HADOOP HTTPFS : giving error "User: ubuntu is not allowed to impersonate ubuntu" while accessing the application through Http

我在我的集​​群上安装了hadoop1.0.4,有1个主机和3个从机,现在我正在安装HTTPFS(hadoop-hdfs-httpfs-0.20.2-cdh3u5-SNAPSHOT)以使用http协议(protocol)访问HDFS内容,我可以通过它访问正常的页面curl-i"http://myhost:14000"它工作正常:)但是如果我尝试访问HDFS然后它给我错误(ubantu是我的用户):(curl-i"http://myhost:14000/webhdfs/v1?user.name=ubantu&op=OPEN"错误:{"RemoteException":{"message"

hadoop - HDFS_NAMENODE_USER、HDFS_DATANODE_USER 和 HDFS_SECONDARYNAMENODE_USER 未定义

我是hadoop新手。我正在尝试以伪分布式模式在我的笔记本电脑中安装hadoop。我使用root用户运行它,但出现以下错误。root@debdutta-Lenovo-G50-80:~#$HADOOP_PREFIX/sbin/start-dfs.shWARNING:HADOOP_PREFIXhasbeenreplacedbyHADOOP_HOME.UsingvalueofHADOOP_PREFIX.Startingnamenodeson[localhost]ERROR:AttemptingtooperateonhdfsnamenodeasrootERROR:butthereisnoHDF

hadoop - 复制自本地 : `/user/hduser/gutenberg' : No such file or directory

到目前为止,我一直遵循michael-noll的指导,但卡在了这里。hduser@ubuntu:/usr/local/hadoop$bin/hadoopdfs-copyFromLocal/tmp/gutenberg/user/hduser/gutenbergDEPRECATED:Useofthisscripttoexecutehdfscommandisdeprecated.Insteadusethehdfscommandforit.13/11/1123:24:13WARNutil.NativeCodeLoader:Unabletoloadnative-hadooplibraryfory

php - 检查 ZIP 存档中内容的文件大小

我需要打开一个ZIP存档,检查存档中每个文件的文件大小并返回一个包含数值(大小)的数组。我可能不希望提取存档以检查文件大小。我自己尝试了很多,但似乎没有一个ZIP函数具有这样的功能,我想不出任何组合来自己编写函数。 最佳答案 我知道这个问题很老了。我希望这个答案可以帮助别人。下面的代码循环了test2.zip文件中的所有文件,并打印它的名称和大小(以字节为单位)。open('test2.zip');if($res){$i=0;while(!empty($zip->statIndex($i)['name'])){echo"Filena