查询

azure - 从 Azure SQL 数据仓库查询 Hadoop ORC 表

我在从AzureSQL数据仓库读取在AzureHDInsight中创建的ORC表时遇到问题。请参阅下面的顺序来设置HDInsight实例以及AzureSQL数据仓库。我创建了一个文本文件(Sales.txt)，内容如下20150614|1|10.5020150618|1|100.7520150924|1|89.7520160214|2|10456.9020150922|3|34.7020151021|3|43.7020151225|3|65.9020151231|3|87.5020160101|4|1349.4020160512|4|3982.4020150608|5|398.9020

Hadoop azure code li Sales orc azure-sqldw

mongodb - Hbase 数据应该如何才能快速查询响应？

我的情况符合以下规则:一个用户一次只能在一个地点。如果用户A在地点X签到，然后在fieldY，他们不再在fieldX。签到最多只能“持续”3小时。如果用户A在地点X签到然后3小时内什么都没有，他们不再在地点X。数据将使用Kafka和spark-streaming解析到HBase。我想使用HBase，TTL为3小时，版本控制为1，满足上述条件。问题是我很困惑如何在HBase中组织数据以获得更快的查询响应，我应该使用具有field名称或field名称的单个列作为不同的列名称吗？哪个更好，为什么？需要执行的查询是:1.用户A现在在哪里？2.现在X地点有哪些用户？

mongodb Hbase section 签到 hadoop cassandra

hadoop - 子查询中的子查询在配置单元中不起作用

我有一个复杂的查询，我在这里给出了它的简化版本。想知道为什么它不起作用。select*from((select1)t1union(select2)t2);出现以下错误NoViableAltException(290@[147:5:((IdentifierLPAREN)=>partitionedTableFunction|tableSource|subQuerySource|virtualTableSource)])atorg.antlr.runtime.DFA.noViableAlt(DFA.java:158)atorg.antlr.runtime.DFA.predict(DFA.ja

配置单 hadoop HiveParser apache hive cloudera bigdata

hadoop - 有关如何从 Hive 查询中设置 Hive 属性的示例

我需要一个快速示例来说明如何使用查询更改配置单元中的属性，例如，我想更改属性“mapred.reduce.tasks”，因此，如何在查询中执行此更改。我正在为HDPCD考试训练自己，考试的目标之一是“从Hive查询中设置Hadoop或Hive配置属性”所以我想这与在Hive控制台中执行类似的操作不同:setmapred.reduce.tasks=2; 最佳答案要更改Hadoop和Hive配置变量，您需要在Hive查询中使用set。所做的更改将仅适用于该查询sessionset-v打印所有Hadoop和Hive配置变量。SETmap

中设 Hive section code hadoop hql hortonworks-data-platform bigdata

如果我更改DB，LINQ查询会相同吗？

以防万一，我想从SQLServer移动到Postgres，并且使用EF使用SQLServer是Alredy，那么我需要更改代码吗？使用EF的所有查询是否相同？看答案所有实施的数据源IQueryable通用接口可以通过LINQ以相同的方式查询。

更改相同 section 使用

当查询结果不是类时，JPA查询方法的返回类型是什么？

我在JPA中有此查询：@Query("SELECTprogramId,COUNT(id)FROMTherapyGROUPBYprogramIdORDERBYCOUNT(id)DESC")Listtop10ProgramsOfTherapies();它运行良好，但是它返回了一个对象列表，我无法从中获取数据。我应该使用什么返回类型来读取结果数据？看答案此查询将返回对象数组的列表：Object[]因此，您需要这样更改代码：@Query("SELECTprogramId,COUNT(id)FROMTherapyGROUPBYprogramIdORDERBYCOUNT(id)DESC")Listtop1

查询返回 code section programId

hadoop - Phoenix sql 查询不适用于大型数据集

我在hbase中有500万条记录，并试图找到记录的总数，然后我在使用phoenix命令行时遇到以下错误。Error:org.apache.phoenix.exception.PhoenixIOException:Failedtogetresultwithintimeout,timeout=60000ms(state=08000,code=101)org.apache.phoenix.exception.PhoenixIOException:org.apache.phoenix.exception.PhoenixIOException:Failedtogetresultwithintim

Phoenix 大型 java apache hadoop hbase apache-phoenix bigdata

hadoop - 如果 Impala 查询内存不足会怎样？

如果Impala查询内存不足会发生什么:Impala守护进程是否崩溃？它会写入磁盘吗？详细的解释会有所帮助! 最佳答案这取决于Impala的版本及其配置方式。一般来说，Impala会在内存不足时终止查询。有一个进程范围的内存限制，此时任何请求内存的查询都将被终止。还有另一个可选的、每个查询的内存限制。Impala2.0及更高版本支持“溢出”大型连接和聚合运算符，这有助于避免这些内存不足的情况。关于hadoop-如果Impala查询内存不足会怎样？，我们在StackOverflow上找

hadoop Impala section stackoverflow cloudera

hadoop - 无法减去涉及 Hive 查询中别名的两列

我正在尝试执行以下查询，其中我使用窗口来获取下一个日志时间戳，然后在它和当前时间戳之间进行减法。SELECTLEAD(timestamp)OVER(PARTITIONBYidORDERBYtimestamp)ASlead_timestamp,timestamp,(lead_timestamp-timestamp)asdeltaFROMlogs;但是，当我这样做时，出现以下错误:失败:SemanticException[错误10004]:第4:1行无效的表别名或列引用“lead_timestamp”:(可能的列名称为:logs.timestamp、logs.latitude、logs.l

hadoop Hive timestamp lead_timestamp section

hadoop - 作为 Map only 作业执行的 Hive 查询

最近遇到一个问题WillallHivequeriesbeconvertedintomapandreducejobs?我知道Hive查询被转换为一系列MapReduce作业。我不是在谈论在Hive中调用外部脚本。是否存在不需要reduce作业且Hive可以通过Map作业本身获得结果的情况。你有什么想法？最佳答案是的。这仅取决于您正在运行的作业类型。例如，如果您有一个具有架构(姓名、ID、部门)的员工表。以下查询运行仅map作业。Mapper从配置单元表中接收(Name,id,department)作为值，并发出Name和Nullw

hadoop Hive section strong mapreduce hiveql hadoop2

246 247 248249250 251 252