草庐IT

email_from

全部标签

Hadoop DBWritable : Unable to insert record to mysql from Hadoop reducer

插入表时遇到重复输入问题。我一直使用Hadoopmapper从文件中读取记录。它成功地从文件中完全读取记录​​。但是当通过Hadoopreducer将记录写入mysql数据库时,出现以下错误。java.io.IOException:键“PRIMARY”的重复条目“505975648”但是Mysql表仍然是空的。无法从HadoopDBWritablereducer将记录写入mysql表。错误日志如下:警告:com.mysql.jdbc.exceptions.jdbc4.MySQLNonTransientConnectionException:Connection.close()已被调用。

hadoop - 'From' 语句中 HiveQL 中的 UDF

是否可以在HiveQL的“From”语句中使用UDF?例如:SELECT*FROMgetTableName();其中getTableName()是某种UDF,它将根据某些业务规则返回不同的表名。 最佳答案 没有。UDF作为MapReduce作业的一部分进行评估。因此这个查询会给你一个错误。 关于hadoop-'From'语句中HiveQL中的UDF,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/qu

java - 吗啉 : How to remove everything from _attachment_body

如标题所示,有人知道如何删除_attachment_body中的所有内容吗?非常感谢 最佳答案 使用setValues命令-{setValues{_attachement_body:[]}}MorphlineReferenceGuide 关于java-吗啉:Howtoremoveeverythingfrom_attachment_body,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questio

hadoop - 累积写入 : Trying to create and insert data from mapreduce

我正在尝试使用MapReduce将数据写入Accumulo的表中。以下是我的accumulomapreduce代码。Jobjob=Job.getInstance(conf);AccumuloOutputFormat.setZooKeeperInstance(job,accumuloInstance,zooKeepers);AccumuloOutputFormat.setDefaultTableName(job,accumuloTableName);AccumuloOutputFormat.setConnectorInfo(job,accumuloUser,newPasswordToke

hadoop - 配置单元 hadoop : selecting data from table getting error

我在Hive中创建了一个外部表后,我想知道推文的数量,所以我写了下面的查询,但是我得到了这个错误,请问如何解决这个问题,这是mapred-site.xml的配置mapred.job.trackerlocalhost:8021hive>selectcount(*)fromtweet;TotalMapReducejobs=1LaunchingJob1outof1Numberofreducetasksdeterminedatcompiletime:1Inordertochangetheaverageloadforareducer(inbytes):sethive.exec.reducers.

sql - Hive 必须使用 UNION ALL 指定实际数据源(FROM)

我对HiveUNIONALL规范有疑问。此查询是一个有效的Hive查询。SELECT1asid,'Tom'asname此作业按预期返回正确的一条记录结果。+----------+----------------+|id|name|+----------+----------------+|1|Tom|+----------+----------------+但是当使用UNIONALL提交此查询时,我遇到了一个问题。SELECTid,nameFROMmembersUNIONALLSELECT1asid,'Tom'asname,此SQL产生Error:java.lang.IllegalAr

sql - 如何正确格式化 "select top 1000 * from schema.table_name;"以在 Toad 4 Apache Hadoop 中工作?

尝试在Toad4ApacheHadoop(Hive)中运行它,它无法识别top函数。我该如何重新格式化?selecttop1000*fromFinance.ACCT_LIST 最佳答案 您可以使用LIMIT:select*fromFinance.ACCT_LISTorderbysomecolumnlimit1000如果你想得到一组一致的行,你应该添加一个orderby子句。 关于sql-如何正确格式化"selecttop1000*fromschema.table_name;"以在Toad

hadoop - 尼菲 : how to use fileFileter for fetching files from hadoop?

关闭。这个问题需要更多focused.它目前不接受答案。想改进这个问题吗?更新问题,使其只关注一个问题editingthispost.关闭5年前。Improvethisquestion我想根据文件名从hadoop目录中获取文件,从逻辑上讲它看起来像这样${filename}.*(因为我有几个名称相似的文件,它们看起来像这样2011-01-01.1,2011-01-01.2等)我尝试使用listhdfs+fetchhdfs但它们不符合我的逻辑你能告诉我如何在nifi环境中完成它吗?是否可以通过ExecuteScript处理器中的常规代码来完成此任务?如何通过groovy代码连接hdfs目

sql - SQOOP - 导入失败 : Can not create a Path from a null string

我正在使用SQOOP增量更新将表从SQL服务器加载到HBase表。但是SQL表中的空值不会导入到HBase中。我知道Hbase不支持空值,并且包含空值的字段不会出现在Hbase中。但我担心的是,当某个特定列对大多数记录具有空值时,即使该字段中存在某些记录的值,也会被跳过。以下是SQL表结构CREATETABLE[dbo].[user_test]([user_id][nvarchar](20)NOTNULL,[user_name][nvarchar](100)NULL,[password][varchar](128)NULL,[created_date][datetime2](7)NUL

hadoop - Q : how to unnest bags from complicated data structure in PIG

原来我有这样的结构:+-------+-------+----+----+----+-----+|time|type|s1|s2|id|p1|+-------+-------+----+----+----+-----+|10:30|send|a|b|1|110||10:35|send|c|d|1|120||10:31|reply|e|f|3|221||10:33|reply|a|c|1|210||10:34|send|a|a|3|113||10:32|reply|c|d|3|157|+-------+-------+----+----+----+-----+我想规范化表格:按id对条目