草庐IT

log_slow_queries

全部标签

python - 使用 Spark 的默认 log4j 配置文件 : org/apache/spark/log4j-defaults. 属性将默认日志级别设置为 "WARN"

我是spark的新手,我将spark2.1.0与python2.7一起使用,但无法正常工作。我一直在寻找一个星期来找到我的问题的解决方案,但没有成功。当我在commmadLine中运行pyspark时出现以下错误:Python2.7.13(v2.7.13:a06454b1afa1,Dec172016,20:42:59)[MSCv.150032bit(Intel)]onwin32Type"help","copyright","credits"or"license"formoreinformation.UsingSpark'sdefaultlog4jprofile:org/apache/s

hadoop - hive insert overwrite table with inner sub query of count of columns 作为结果

你好,我在源表“状态表”下面有datestatusname2017-06-22true1.tar2017-06-22true2.tar2017-06-22false3.tar2017-06-22true4.tar2017-06-22false5.tar2017-06-21false6.tar2017-06-21false6.tar2017-06-21false6.tar2017-06-21true6.tar我在目标表列下面有预期的数据TrueFalseTotalDate3252017-06-221342017-06-21我在下面写了查询将数据从源表加载到目标表,但它说表达式不在GROU

apache-spark - 解决 NoClassDefFoundError : org/apache/spark/Logging exception

我正在试用hbase-spark连接器。首先,我正在尝试this代码。我的pom依赖项是:org.apache.sparkspark-core_2.112.0.0org.apache.sparkspark-sql_2.112.0.0org.apache.hbasehbase-spark2.0.0-alpha4运行代码时出现以下异常:Exceptioninthread"main"java.lang.NoClassDefFoundError:org/apache/spark/Loggingatjava.lang.ClassLoader.defineClass1(NativeMethod)a

java - 如何使用 log4j.properties 使日志文件根据大小旋转并压缩

主题-RollingFileAppender,以及如何压缩旋转的文件RollingfileAppender根据文件大小旋转日志文件。MaxFileSize表示文件的最大大小,而MaxBackupIndex表示要保存在日志文件夹中的文件数量。示例属性文件如下:1log4j.rootLogger=INFO,fileLogger2log4j.appender.fileLogger=org.apache.log4j.RollingFileAppender3log4j.appender.fileLogger.layout=org.apache.log4j.PatternLayout4log4j.

security - Hadoop 无法访问/logs/。在安全模式

我正在使用hadoop-2.6.0并启用了kerberos的安全性。一切正常。但我无法从浏览器访问日志文件。它显示Problemaccessing/logs/.Reason:Userbabuisunauthorizedtoaccessthispage.我尝试了所有用户,但没有成功。谁能帮我如何授权任何用户访问日志文件? 最佳答案 您不应该直接在FS中访问日志,访问仅限于NM用户和yarn组。使用日志聚合服务检索/查看日志。参见Simplifyinguser-logsmanagementandaccessinYARN.

sql - 斯卡拉 : Spark sqlContext query

我的文件中只有3个事件(第3列)01、02、03。模式是unixTimestamp|id|eventType|date1|date2|date3639393604950|1001|01|2015-05-1210:00:18|||639393604950|1002|01|2015-05-1210:04:18|||639393604950|1003|01|2015-05-1210:05:18|||639393604950|1001|02||2015-05-1210:40:18||639393604950|1001|03|||2015-05-1219:30:18|639393604950|1

ElasticSearch 复合查询 Boolean Query

官网文档网址:Booleanquery|ElasticsearchGuide[7.17]|Elastic目录复合查询BooleanQuery利用bool查询实现功能 总结 复合查询BooleanQuery布尔查询是一个或多个查询子句的组合。子查询的组合方式有:must:必须匹配每个子查询,类似“与should:选择性匹配子查询,类似“或”mustnot:必须不匹配,不参与算分,类似“非filter:必须匹配,不参与算分利用bool查询实现功能案例:搜索名字包含“如家”,价格不高于400,在坐标31.21121.5周围10km范围内的酒店GET  /hotel/_search{        "

hadoop - 配置单元 : getting parseexception in simple create external table query

我已经在mac上设置了hive。在执行简单的创建外部表查询时。我正在跟踪堆栈跟踪:hive>CREATEEXTERNALTABLEweatherext(wbanINT,dateSTRING)>ROWFORMATDELIMITED>FIELDSTERMINATEDBY‘,’>LOCATION‘/hive/data/weatherext’;NoViableAltException(80@[])atorg.apache.hadoop.hive.ql.parse.HiveParser.columnNameTypeOrPKOrFK(HiveParser.java:33341)atorg.apac

java - Apache Flume/var/log/flume-ng/flume.log(权限被拒绝)

我正在尝试从/home/cloudera/Documents/flume/读取日志文件并使用apacheflume将其写入hdfs。我使用以下命令在hdfs中创建flumeLogTest文件夹:sudo-uhdfshadoopfs-mkdirflumeLogTestsudo-uhdfshadoopfs-chownflume:flumeflumeLogTest我的配置文件是:agent.sources=srcagent.channels=chagent.sinks=snkagent.sources.src.type=execagent.sources.src.command=tail-f

logging - cdh4 hadoop 中作业的详细日志在哪里?

我只是在hdfs中找到jobhistory/home/mps/cdh/users/history/done_intermediate/mps/job_1405497023620_0009-1405505656182-mps-simjoin%2D1.0.jar-1405505683781-0-0-FAILED-default.jhist但是这个工作历史信息远非像这样的详细信息:{"type":"TASK_FAILED","event":{"org.apache.hadoop.mapreduce.jobhistory.TaskFailed":{"taskid":"task_14054970