草庐IT

zend_db_select

全部标签

sql - Impala select * 不显示表的所有详细信息

我在impalaselect*fromtable中有一个sql查询,但是当我执行这个时,某些列丢失了。而当我执行describetable时,那些列就在那里。我无法显示该代码段,但未显示的类型是映射、数组和结构。 最佳答案 Impala不支持。复杂类型必须解包才能显示。TheresultsetofanImpalaqueryalwayscontainsallscalartypes;theelementsandfieldswithinanycomplextypequeriesmustbe"unpacked"usingjoinquerie

hadoop - 执行以下 Hive 查询 : SELECT COUNT(*) FROM TABLE; for a table with 8bn rows/40 columns/400Gb? 的大概数字是多少

执行以下Hive查询的大概数字是多少:SELECTCOUNT(*)FROMTABLE;对于下表:行数:~80亿列数:40,各种大小的int、double和stringHDFS上的大小:~400Gb我想将任何大概数字与真实数字进行比较,以查看系统配置是否正确。如果我错过了一些重要的事情,我深表歉意,我是Hive和Hadoop的新手。此外,如果机器数量也按比例增加,执行时间是否会与行数成线性比例? 最佳答案 提供大概数字是不可能的。但是我们可以列出影响因素:集群中配置的MapTask数量block大小(决定将使用的映射器的数量)执行时间

如果我更改DB,LINQ查询会相同吗?

以防万一,我想从SQLServer移动到Postgres,并且使用EF使用SQLServer是Alredy,那么我需要更改代码吗?使用EF的所有查询是否相同?看答案所有实施的数据源IQueryable通用接口可以通过LINQ以相同的方式查询。

mongodb - Spark with Mongo DB : java. lang.IncompatibleClassChangeError:实现类

我正在尝试使用Scala将示例MongoDB集合加载到Spark,然后将RDD保存到文本文件。以下是我的代码:valsc=newSparkContext(conf)valmongoConfig=newConfiguration()mongoConfig.set("mongo.input.uri","mongodb://localhost:27017/myDB.myCollectionData")valsparkConf=newSparkConf()valdocuments=sc.newAPIHadoopRDD(mongoConfig,//ConfigurationclassOf[Mon

hadoop - 测试运行后 HBASE DB 大小增加

我使用的是HDFS+HBASE。我创建了一个数据库并运行了2小时的测试。我想在测试运行后检查数据库大小的增加。我尝试使用以下方法阅读:hadoopdfsadmin-reportandhadoopfs-dus/hbase.还尝试使用检查磁盘大小du-sk/HADOOP.观察运行测试后,大小显示减少而不是增加。正在使用的版本:Hadoop1.0.0、HBase0.90.5、ZooKeeper3.3.4。列族上的压缩是无。请帮助获得正确的过程来计算由于测试而增加的数据库大小。 最佳答案 Lakshmi,650K对于HBase/Hadoop

sql - Hive是否支持Select中的Select?

Hive中的以下代码是否可能,并进行一些更改?:insertintotablewebmapselecta.resreference,b.resresource,(selectcount(ip)fromweblogwhereresource=a.resandreferer=b.res)weightfromtoprefresajointoprefresb;我在hive-0.10.0-cdh4.5.0中运行它并得到错误:FAILED:ParseExceptionline3:1cannotrecognizeinputnear'select''count''('inexpressionspeci

hadoop - Hadoop DB 的 ORM 支持

我正在尝试使用Hadoop和Spring(MVC、IOC、数据、安全性)引导应用程序。我想知道哪种ORM适合这些技术。 最佳答案 ApacheGora开源框架为大数据提供内存数据模型和持久性。Gora支持持久存储到列存储、键值存储、文档存储和RDBMS,并通过广泛的ApacheHadoop™MapReduce支持分析数据。-查看更多信息:http://gora.apache.org/#sthash.aHUqfiFl.dpuf 关于hadoop-HadoopDB的ORM支持,我们在Stac

hadoop - hive 中的 Select 语句返回一些具有空值的列

我看到很多人问过这种类型的问题,但这些解决方案对我不起作用。我创建了一个外部配置单元表,因为我的数据来自仅限map的作业输出。然后,通过加载命令我给出了特定文件的路径。它显示正常。但是当我给出select*fromtable命令时,它会返回一些具有空值的列。我执行的每个命令都在错误图片中。我在文件中的分隔符是||,所以我在创建表命令中也提到了同样的内容。这是我的输入文件图片filepic.这是errorpic.我也尝试过普通表而不是外部表。那也显示了同样的错误。我还尝试将定界符称为//||和\|\|。但没有一个奏效。 最佳答案 您面

hadoop - 如何在 Hive 的 SELECT 语句中提取定界值右侧的字符

我需要提取“/”右侧的所有字符作为选择语句的一部分。cityAmerica/ChicagoEurope/London预期输出是citynameChicagoLondon这是我的查询,它不起作用selectsubstring(city,charindex('/',city)+1,length(city))ascitynamefromtable; 最佳答案 您可以使用正则表达式来提取城市名称。使用正则表达式,您的查询将是这样的。selectregexp_extract(city,'([a-zA-Z]+)',1)fromtable_nam

SQL/HIVE - 不同计数查询 - SELECT COUNT (DISTINCT columns,..) 与 SELECT COUNT(*) 与 DISTINCT 记录的子查询有何不同

在HIVE中,我尝试使用2种方法获取不同行的计数,SELECTCOUNT(*)FROM(SELECTDISTINCTcolumnsFROMtable);SELECTCOUNT(DISTINCTcolumns)FROMtable;两者都产生了不同的结果。第一个查询的计数大于第二个查询。他们的工作方式有何不同?提前致谢。 最佳答案 对您的查询做一点小改动,例如将您的子查询命名为:SELECTCOUNT(*)FROM(SELECTDISTINCTcolumnsFROMtable)myquery;