create-notebook

hadoop - 如何在 hive create table "TBLPROPERTIES"中引用 HBase 命名空间

我正在尝试使用HBase表('test_table)作为源创建Hive外部表。HBase表是在HBase命名空间“test_namespace”下创建的。在应用程序的其他部分，我使用以下语法访问表test_namespace:test_table或hbase://test_namespace:test_table按照同样的方法我创建了一个配置单元脚本CREATEEXTERNALTABLEIFNOTEXISTSTEST_INDIVIDUAL(keystring,teststring,photostring,locationstring)STOREDBY'org.apache.hadoop

TBLPROPERTIES 何在 hivehbase krishna ratings hadoop namespaces hive hbase

scala - 监听器异常 : Mkdirs failed to create/tmp/temporary ( full permission given to the dir. )

当我编写流数据时显示此错误时，我正在学习结构化流CountQuery:org.apache.spark.sql.streaming.StreamingQuery=org.apache.spark.sql.execution.streaming.StreamingQueryWrapper@604770e3org.apache.spark.sql.streaming.StreamingQueryException:QueryCount[id=4ce8572a-24c9-4cde-97e4-051426cbb15e,runId=59c60d53-73ee-43a4-8792-d5907a88

监听器 permission apache section ThreadPoolExecutor scala apache-spark hadoop spark-structured-streaming

hadoop - Apache Drill 无法从 HDFS 读取文件(资源错误 : Failed to create schema tree)

在我们的HDFS集群的一个边缘节点上设置drill后，我无法读取任何hdfs文件。我可以从本地文件查询数据(只要它们位于具有777权限的文件夹中)但是从hdfs查询数据失败并出现以下错误:Error:RESOURCEERROR:Failedtocreateschematree.[ErrorId:d9f7908c-6c3b-49c0-a11e-71c004d27f46onserver-name:31010](state=,code=0)查询:0:jdbc:drill:zk=local>select*fromhdfs.`/names/city.parquet`limit2;从本地文件查询工

hadoop Apache section code pre apache-drill

sql - SQOOP - 导入失败 : Can not create a Path from a null string

我正在使用SQOOP增量更新将表从SQL服务器加载到HBase表。但是SQL表中的空值不会导入到HBase中。我知道Hbase不支持空值，并且包含空值的字段不会出现在Hbase中。但我担心的是，当某个特定列对大多数记录具有空值时，即使该字段中存在某些记录的值，也会被跳过。以下是SQL表结构CREATETABLE[dbo].[user_test]([user_id][nvarchar](20)NOTNULL,[user_name][nvarchar](100)NULL,[password][varchar](128)NULL,[created_date][datetime2](7)NUL

create string COALESCE user user_id sql hadoop hbase sqoop

java - Apache 凤凰java.lang.OutOfMemoryError : unable to create new native thread

我有一个微型Hadoop集群，它有5个数据节点和1个名称节点，所有4核/4线程机器每个都有4GB内存，除了一个数据节点有8GB内存。他们都在运行RHEL6x86_64。HBase版本为1.2，Phoenix版本为4.14我正在通过Phoenix查询服务器和“瘦”JDBC客户端连接到ApachePhoenix。Phoenix查询服务器在名称节点上运行。我正在尝试更新插入约2000个元组，每10分钟约25列，该表已经插入了超过200万个元组，但有时我会收到以下形式的异常:Causedby:java.lang.OutOfMemoryError:unabletocreatenewnativet

java OutOfMemoryError section native hadoop hbase apache-phoenix

hadoop - 如何解决错误 "file:/user/hive/warehouse/records is not a directory or unable to create one"？

hive>CREATETABLErecords(yearSTRING,temperatureINT,qualityINT)>ROWFORMATDELIMITED>FIELDSTERMINATEDBY'\t';FAILED:ExecutionError,returncode1fromorg.apache.hadoop.hive.ql.exec.DDLTask.MetaException(message:file:/user/hive/warehouse/recordsisnotadirectoryorunabletocreateone)如何解决错误？/user/hive/warehous

amp directory code hive warehouse hadoop hdfs

unit-testing - 测试 Spark : how to create a clean environment for each test

在测试我的ApacheSpark应用程序时，我想进行一些集成测试。出于这个原因，我创建了一个本地spark应用程序(启用了配置单元支持)，在其中执行测试。如何在每次测试后清除derbyMetastore，以便下一次测试再次拥有干净的环境。我不想做的是在每次测试后重新启动spark应用程序。是否有任何最佳实践可以实现我想要的？最佳答案我认为为集成测试引入一些应用程序级逻辑打破了集成测试的概念。从我的角度来看，正确的方法是为每个测试重新启动应用程序。无论如何，我相信另一种选择是为每个测试启动/停止SparkContext。它应该清除

unit-testing environment section 测试 strong apache-spark hadoop testing hive

hadoop - SQOOP 从 Teradata 导入 : Create table Ok but without data

我使用sqoop通过我的TD数据库拨号。当我尝试这个时，一切正常(我的表是在默认配置单元数据库中创建的)sqoopimport\-libjars$LIB_JARS\-Dteradata.db.input.job.type=hive\-Dteradata.db.input.target.table=hive_table\-Dteradata.db.input.target.table.schema="c1bigint"\-m1\--connectjdbc:teradata://PRD/Database=database\--connection-managerorg.apache.sqo

Teradata without section database Dteradata hadoop import hive sqoop

hadoop - Sqoop Teradata 连接器问题 - 错误 : The user does not have CREATE TABLE access to database

当我尝试从TeradataView导入表时，我遇到了Sqoop的Teradata连接器问题。我只能访问View。但不知何故，当sqoop作业开始时，它试图在我正在访问的TeradataDB中创建一个表，但无权在该DB/schema中创建任何表我低于错误13/05/3103:40:12ERRORtool.ImportTool:EncounteredIOExceptionrunningimportjob:com.teradata.hadoop.exception.TeradataHadoopSQLException:com.teradata.jdbc.jdbc_4.util.JDBCExc

Teradata database java apache hadoop hdfs sqoop

hadoop - HIVE:CREATE TABLE AS SELECT 命令无法指定目标表的列列表

我怎样才能让它工作？hive>desctemp;OKaintbintTimetaken:0.077seconds,Fetched:2row(s)我想创建列名为c和d的t2HIVE表，但出现以下错误。hive>createtablet2(cint,dint)asselecta,bfromtemp;FAILED:SemanticException[Error10065]:CREATETABLEASSELECTcommandcannotspecifythelistofcolumnsforthetargettable 最佳答案您无需再次提

列列 hadoop section code pre hive

159 160 161162163 164 165