草庐IT

database_name

全部标签

database - 针对不断变化的大型数据集发出实时警报

我有一个庞大的数据集,我必须监控其中的异常情况并发送警报。最接近我正在尝试做的例子如下。假设关系数据库中有一个股票表:stocks:iddatestock_nameprice假设我们正在处理一百万只股票。白天,股票价格根据持续和频繁的实时信息不断更新。在一天结束时,每只股票的最后记录价格是当天的收盘价。第二天,我们向表中添加另外一百万条记录并再次开始处理它。假设用户可以配置如下警报:“当AAPL的走势超过过去10天的平均值10%时,提醒我”或“当任何股票在过去10天内的波动幅度超过其平均水平的10%时,提醒我”我们需要满足来自不同用户的100条提醒。持续轮询并尝试定期匹配警报是不切实际

hadoop - 当 Name Node 在 YARN 中失败时,工作状态是什么?

当一个job在集群中运行时,如果NameNode突然挂了,那么这个job的状态是什么(failed或者killed)?如果失败意味着谁在更新作业状态?这在内部是如何工作的? 最佳答案 备用Namenode将通过故障转移过程变为事件Namenode。看看HowdoesHadoopNamenodefailoverprocessworks?YARN架构围绕着ResourceManager、NodeManager和ApplicationsMaster。作业将继续进行,而不会因名称节点故障而受到任何影响。如果以上三个进程中的任何一个失败,将根

java - 连接到 Kerberrized HDFS,java.lang.IllegalArgumentException : Failed to specify server's Kerberos principal name;

我正在尝试使用以下代码连接到Kerberizedhdfs集群,使用以下相同的代码我能够使用HBaseConfiguration访问hbaseofcourse,Configurationconfig=newConfiguration();config.set("hadoop.security.authentication","Kerberos");UserGroupInformation.setConfiguration(config);UserGroupInformationugi=null;ugi=UserGroupInformation.loginUserFromKeytabAnd

database - Hadoop/Hive 查询将一列拆分为几列

我正在使用HIVE和两个看起来像(或多或少)的表:-TABLE1定义为[(Variables:string),(Value1:int),(Value2:int)]字段“变量”看起来像“x0,x1,x2,x3,...,xn”-TABLE2定义为[(Value1Sum:int),(Value2Sum:int),(X1:string),(X4:string),(X17:string)]我使用以下查询将table1“转换”为table2:INSERTOVERWRITETABLEtable2SELECTsum(v1),sum(v2),x1,x4,x17FROM(SELECTValue1asv1,

MySQL新建表:1044 - Access denied for user ‘root‘@%‘ to database ‘XXX‘终极解决方案

1.问题描述情况一:Navicat连接远程mysql数据库,创建数据库时出现错误:情况二:在linux中命令创建数据库出现如下报错:2.原因分析root权限不够,先使用“SELECThost,user,Grant_priv,Super_privFROMmysql.user;”查询,发现已经是Y了。通过SELECT*FROMmysql.user;命令查询权限信息,可以看到root对应的很多权限都是N,如下图所示:至于为什么会出现root权限不够,可能是安装mysql的时候MySQL权限配置不正确,或者修改了相关的配置文件等。3.解决方案将root权限全部修改为Y,执行如下代码(记得退出mysql

database - 用于 Web 应用程序的 Hadoop

我是Hadoop的初学者。我只是想知道我是否可以在Web应用程序中使用Hadoop作为后端而不是使用关系数据库? 最佳答案 您不能首先将Hadoop与RDBMS进行比较,因为它不是数据库。它只是为您提供一个文件系统(HDFS),它像任何其他文件系统一样缺乏随机读/写的能力。如果你真的想为你的网络应用程序提供分布式后端,你可以在Hadoop之上使用类似HBase的东西。它将为您提供实时、随机的读/写能力。而且,是的,最重要的是,正如@Abhinav已经说过的那样,Hadoop最适合批处理之类的东西。

hadoop - mapred-site.xml 中 mapreduce.framework.name 的经典、本地有什么区别?

官方对该参数的描述如下:TheruntimeframeworkforexecutingMapReducejobs.Canbeoneoflocal,classicoryarn.我知道值“yarn”用于MRv2,它会将mapreduce作业提交给resourcemanager。但是本地和经典之间有什么区别?哪个对应MRv1?非常感谢! 最佳答案 你是对的,“yarn”代表MRv2。“经典”用于MRv1,“本地”用于MR作业的本地运行。但是为什么需要MRv1?Yarn现在已经结束测试,它比旧的MRv1框架更稳定,而您的MapReduce作

database - 100 万个句子保存在数据库中 - 删除不相关的英语单词

我正在尝试使用从情绪中提取的正面/负面词语来训练朴素贝叶斯分类器。示例:我喜欢这部电影:))我讨厌下雨:(我的想法是根据使用的情绪提取正面或负面的句子,但为了训练分类器并将其保存到数据库中。问题是我有超过100万个这样的句子,如果我一个字一个字地训练,数据库会去折腾。我想删除所有不相关的单词示例“I”、“this”、“when”、“it”,这样我必须进行数据库查询的次数就会减少。请帮助我解决这个问题并建议我更好的方法谢谢 最佳答案 有两种常见的方法:编译stoplist.POStag把那些你认为不感兴趣的句子扔掉。在这两种情况下,可

hadoop - 安全模式异常 : Name node is in safe mode

我尝试将文件从我的本地磁盘复制到hdfs。起初它给出了SafeModeException。在寻找解决方案时,我读到如果再次执行相同的命令,问题就不会出现。所以我再次尝试,它没有给出异常。hduser@saket:/usr/local/hadoop$bin/hadoopdfs-copyFromLocal/tmp/gutenberg//user/hduser/gutenbergcopyFromLocal:org.apache.hadoop.hdfs.server.namenode.SafeModeException:Cannotcreatedirectory/user/hduser/gut

database - HBase 错误 - 分配 -ROOT- 失败

我刚刚从cloudera(3)安装了hadoop和hbase,但是当我尝试转到http://localhost:60010时它只是坐在那里不断加载。我可以正常访问区域服务器-http://localhost:60030...查看主hbase服务器日志,我可以看到以下内容。看起来像是根区域的问题。所有这些都安装在运行Ubuntu(Natty)11的ext41TB分区上。没有集群/其他盒子。任何帮助都会很棒!11/05/1519:58:27WARNmaster.AssignmentManager:Failedassignmentof-ROOT-,,0.70236052toserverNam