草庐IT

env_variable

全部标签

java - Hadoop : set a variable like hashSet only once so that it can be utilized multiple times in each map task

您好,我有一个HashSet,它需要在hadoop中的每个映射任务中使用。我不想多次初始化它。我听说可以通过在配置函数中设置变量来实现。欢迎提出任何建议。 最佳答案 看来你还没有真正了解Hadoop的执行策略。如果你是分布式模式,你不能在多个map任务中共享一个集合(HashSet)。这是因为任务是在它们自己的JVM中执行的,并且它不是确定性的,即使不使用jvm重用,你的集合在jvm被重置后仍然存在。您可以做的是在计算开始时为每个任务设置一个HashSet。因此您可以覆盖setup(Contextctx)方法。这将在调用映射方法之前

Java 泛型和 Hadoop : how to get a class variable

我是一名.NET程序员,在Java中从事一些Hadoop工作,我有点不知所措。在Hadoop中,我正在尝试设置一个Map-Reduce作业,其中Map作业的输出键的类型为Tuple.当我使用setOutputKeyclass如下设置输出键时JobConfconf2=newJobConf(OutputCounter.class);conf2.setOutputKeyClass(Tuple.class);我遇到了一大堆错误,因为泛型和“.class”符号似乎不适用。尽管以下工作正常JobConfconf2=newJobConf(OutputCounter.class);conf2.setO

java.sql.SQLException : Unknown system variable 'OPTION' 异常

我正在使用Ambari服务器安装MYSQL,以便在ubuntu上安装hadoop。我从Xampp安装了MySql,并且工作正常。MySQL5.6版本去掉了set`Option关键字,mariaDB(xampp自带)与之一致。网站显示兼容MySQL5.6版本,应该没问题。回应theonlyrelevantlinkIfound,当我检查我的sql版本时:mysql-vTheprogram'mysql'canbefoundinthefollowingpackages:*mysql-client-core-5.6*mariadb-client-core-10.0这就是我得到的。我相信链接中提到

由 Ambari 覆盖的 Hadoop 自定义 - hadoop-env.sh

这似乎是一项简单的任务:更改/etc/hadoop/conf/hadoop-env.sh中的JAVA_HOME以使用不同版本的Java。但是,Ambari似乎会使用它的模板方案覆盖您在hadoop-env.sh中所做的任何更改。模板似乎包含以下行:exportJAVA_HOME={{java_home}}那么,现在如果这用于生成和替换每个节点上的环境,我该如何定义{{java_home}}? 最佳答案 从Ambari1.7.0开始,您可以从AmbariWebUI修改hadoop-env。您可以通过此页面上的链接了解Ambari1.7

hadoop - 在分布式 Hadoop 集群中使用 ENV 变量

我的目标是在我们的Hadoop集群上运行应用程序,而无需将显式配置放入每个应用程序。因此,我试图将集群的配置放入ENV变量中,并将它们传播到集群中的每个节点。例如我定义:exportHIVE2_JDBC_URL=jdbc:hive2://localhost:10000以后像这样使用它:beeline-u$HIVE2_JDBC_URL/-e"SELECT*FROM;"虽然这适用于这个特定的用例(在cli中),但它有两个很大的缺点:我必须根据更改手动更新每个节点上的ENV变量Oozie工作流无法读取ENV变量有没有一种方法可以使用Ambari检索此设置,我可以定义我自己的自定义设置,然后在

variables - 通过参数初始化Hadoop中的公共(public)静态变量

我在更改Hadoop中的公共(public)静态变量时遇到问题。我正在尝试从命令行将一些值作为参数传递给jar文件。这是我的代码:publicclassMyClass{publicstaticlongmyvariable1=100;publicstaticclassMapextendsMapper{publicstaticlongmyvariabl2=200;publicvoidmap(Objectkey,Textvalue,Contextcontext)throwsIOException,InterruptedException{}}publicstaticclassReduceex

java - 如何在 hadoop-env.sh 中为 hadoop 守护进程单独定义内存

据我所知,hadoop-env.sh是hadoop守护进程设置环境的配置文件。在这个文件中,我如何定义HADOOP_HEAPSIZE是为守护进程定义堆大小的属性。这是否意味着它适用于所有守护进程,如名称节点、数据节点、任务跟踪器、作业跟踪器和辅助名称节点,每台机器都将占用1000MB内存。如果是,那么我怎样才能让每一个都不同。我在hadoop-env.sh中观察了以下几个条目exportHADOOP_NAMENODE_OPTS="-Dcom.sun.management.jmxremote$HADOOP_NAMENODE_OPTS"exportHADOOP_SECONDARYNAMEN

variables - 将查询结果存储在变量中

我有一个查询,我想将其结果存储在一个变量中我该怎么做?我试过了./hive-e"usetelecom;insertoverwritelocaldirectory'/tmp/result'selectavg(a)fromabc;"./hive--hiveconfMY_VAR=`cat/tmp/result/000000_0`;我能够在MY_VAR中获得平均值,但它需要我进入HiveCLI,这不是必需的有没有办法在hiveCLI中访问unix命令? 最佳答案 用例:在mysql中以下是有效的:set@max_date:=selectma

php - $_ENV 、 $_SESSION 和 $_COOKIE 之间有什么区别

大多数情况下,我使用过$_SESSION,但是在阅读有关Session的内容时,我得到的术语很少$_ENV&$_COOKIE。我不清楚什么时候使用哪个,我对我可以使用它们的情况感到困惑。那么这些术语有何不同? 最佳答案 您可以阅读:http://php.net/manual/en/language.variables.superglobals.php. 关于php-$_ENV、$_SESSION和$_COOKIE之间有什么区别,我们在StackOverflow上找到一个类似的问题:

php - 使用 extract($variables) 获取内容,但变量未定义

我还没有掌握extract()函数和传输变量的窍门。我在用户Controller中有一个方法,其中定义了一些变量,并以数组形式发送到父Controller中的View函数,其中提取了数组。然后需要View。但是变量结果未定义。虽然可以打印数组内容。这是具有简化配置文件功能的用户Controller:classUserextendsController{publicfunctionprofile(){$profiledetails=$this->profiledetails();$profilestatus=$this->profileStatus();$this->view('prof