草庐IT

report_server

全部标签

sql-server - Oozie Sqoop 作业

我正在尝试将sqoop作业作为oozie操作运行。我将MySQL作为jobtracker节点上的元存储。我在某处读到ooziesqoop无法通过导入创建配置单元表。所以我试图将数据转储到hdfs中。现在还是这样吗?我检查了共享库。我正在尝试从MSSQL数据库中获取Sqoop。当我运行不需要来自shell的元存储的sqoop命令时,它可以工作。sqoopimport--connect'jdbc:sqlserver://host;username=sqoopimport;password=password;database=db1'--tablet1--target-dir/user/ro

java - HBase:/hbase/meta-region-server节点不存在

我在上面安装了cloudera和hdfs、mapreduce、zookeper、hbase。具有这些服务的4个节点(3个动物园管理员)。全部由cloudera向导安装,在cloudera中没有配置问题。从Java连接时出现错误:9:32:23.020[main-SendThread()]INFOorg.apache.zookeeper.ClientCnxn-Openingsocketconnectiontoserver/172.20.7.6:218109:32:23.020[main]INFOorg.apache.hadoop.hbase.zookeeper.RecoverableZo

java - 连接到 Kerberrized HDFS,java.lang.IllegalArgumentException : Failed to specify server's Kerberos principal name;

我正在尝试使用以下代码连接到Kerberizedhdfs集群,使用以下相同的代码我能够使用HBaseConfiguration访问hbaseofcourse,Configurationconfig=newConfiguration();config.set("hadoop.security.authentication","Kerberos");UserGroupInformation.setConfiguration(config);UserGroupInformationugi=null;ugi=UserGroupInformation.loginUserFromKeytabAnd

sql-server - 如何使用 Sqoop 将数据从关系数据库导入沙箱 Hive?

如何使用Sqoop将数据从关系数据库导入沙盒中的Hive。我在我的电脑上安装了HortonWorks沙箱。Nw我想知道这个迁移。我已经引用了这个链接http://hortonworks.com/kb/using-apache-sqoop-for-data-import-from-relational-dbs/但我有些疑惑1、运行需要Sqoop软件吗?2,在上面提到的链接中有一些代码,我将把这段代码放在哪里?在Hive查询窗口中?3、是否可以完全迁移数据库(或仅按时间表迁移)?4、存储过程和Viwes我将把所有这些都保存在哪里? 最佳答案

sql-server - 为什么 Hive 不支持存储过程?

为什么hive不支持存储过程?如果它不支持那么我们将如何处理Hive中的Sp?有任何替代解决方案吗?(因为我们已经在mssql中有一个数据库)HBASE呢?支持SP吗? 最佳答案 首先,Hadoop或Hive不是SQLDB的替代品。您绝不能考虑将这2个中的任何一个用作RDBMS的替代品。Hive的开发只是为了在现有Hadoop集群之上提供仓储功能,考虑到大量的SQL用户,包括专家数据库设计人员和管理员,以及使用SQL从其数据仓库中提取信息的临时用户.尽管它为您提供了类似SQL的界面,但它不是SQL数据库。Hive最适合数据仓库应用程

ubuntu 22.04.3 live server图文安装流程

备注:以下操作全用键盘,tab切换,enter确认,方向键移动;一、安装操作系统1、选择安装,第一个;2、选择语言,这里只能选择英语,无中文;3、继续而不更新 4、键盘,这里可以选择中文;5、选择第一个即可; 6、配置网络,默认是自动获取,需要配置手动,就在三角形哪里按回车,依次填写://这里以192.168.1.220举例7、如果需要配置代理请在这里配置,一般略过;8、配置源,简单说:就是下载更新源,一般输入国内阿里源地址; 9、这里默认就是自动分区并且启用lvm,保持默认即可;10、确认上一步的操作; 11、继续即可;12、配置用户名和主机名,密码;13、是否升级到专业版pro,也就是付费

hadoop - HDFS 容量 : how to read "dfsadmin report"

我正在使用Hadoop2.6.0。当我运行“hdfsdfsadmin-report”时,我得到了这样的东西(简化):ConfiguredCapacity:3TBPresentCapacity:400GBDFSRemaining:300GBDFSUsed:100GB我想知道“配置容量”是什么,“当前容量”是什么。看起来“PresentCapacity”是有效的。我怎样才能增加这个? 最佳答案 配置容量是用于数据目录的磁盘/卷的总可用容量。例如:我在/Hadoop/sdb1、/Hadoop/sdc1、/Hadoop/sdd1上安装了三个

idea启动项目,出现报错:Application Server was not connected before run configuration stop

文章目录前言一、开发环境二、分析问题1.检查日志信息2.解决方案修改端口Tomcat参数配置总结前言最近公司的一个传统项目,通过idea启动后,控制台立马就打印了启动完成的日志信息,但是通过前端页面又无法正常访问,随即展开了一番调查。一、开发环境IntelliJIDEA2023.1.2apache-tomcat-8.5.56jdk1.8.0_131SSH(spring2.5.6+Struts22.5.22+Hibernate3.3.2.GA)二、分析问题1.检查日志信息通过对idea控制台信息检查,发现并没有加载项目信息,启动的日志均是tomcat的信息,如下:随后停止了应用,发现右下角有一个

hadoop - HDFS 占用空间 : "hdfs dfs -du/" vs "hdfs dfsadmin -report"

哪种工具最适合测量HDFS空间消耗?当我总结“hdfsdfs-du/”的输出时,与“hdfsdfsadmin-report”(“DFSUsed”行)相比,我总是消耗更少的空间。是否有du没有考虑的数据? 最佳答案 Hadoop文件系统通过将数据副本放置到多个节点来提供重新标记存储。副本数是复制因子,通常大于一。命令hdfsdfs-du/显示空间在没有复制的情况下消耗了您的数据。命令hdfsdfsadmin-report(使用DFS行)显示实际磁盘使用情况,同时考虑了数据复制。所以当从dfs-ud命令获取数字时,它应该大几倍。

java - Hadoop 作业 : Task fail to report status for 601 seconds

在伪节点上运行hadoop作业时,任务失败并被杀死。错误:任务尝试_未能报告状态601秒但相同的程序正在通过Eclipse运行(本地作业)。任务:大约有25K个关键字,输出将是所有可能的组合(一次两个),即大约25K*25K个整体可能是什么问题? 最佳答案 由于某种原因,任务在您的伪节点上执行时没有进行。您可以增加mapred-site.xml中的设置“mapred.task.timeout”。mapred-default.xml中相同的默认值为:mapred.task.timeout600000Thenumberofmillise