草庐IT

Connector

全部标签

hadoop - 基于时间的桶记录(kafka-hdfs-connector)

我正在尝试使用Confluent平台提供的kafka-hdfs-connector将数据从Kafka复制到Hive表中。虽然我能够成功完成,但我想知道如何根据时间间隔对传入数据进行存储。例如,我希望每5分钟创建一个新分区。我尝试使用io.confluent.connect.hdfs.partitioner.TimeBasedPartitioner和partition.duration.ms但我认为我做错了。我在Hive表中只看到一个分区,所有数据都进入该特定分区。像这样:hive>showpartitionstest;OKpartitionyear=2016/month=03/day=

scala - 如何在本地使用 Spark BigQuery Connector?

出于测试目的,我想使用BigQueryConnector在BigQuery中写入ParquetAvro日志。在我撰写本文时,无法直接从UI读取Parquet以摄取它,因此我正在编写一个Spark作业来执行此操作。在Scala中,作业体暂时如下:valevents:RDD[RichTrackEvent]=readParquetRDD[RichTrackEvent,RichTrackEvent](sc,googleCloudStorageUrl)valconf=sc.hadoopConfigurationconf.set("mapred.bq.project.id","myproject"

java - storm hdfs connector ...尝试使用storm将数据写入hdfs

我正在尝试使用“storm-hdfsconnector0.1.3”将数据写入HDFS。github网址:https://github.com/ptgoetz/storm-hdfs,我已将此依赖项添加到我的Maven项目中。com.github.ptgoetzstorm-hdfs0.1.3-SNAPSHOTprovided将数据写入HDFS的示例拓扑在storm-hdfs项目本身中提供。我只是修改它以匹配我的文件位置。HdfsFileTopology是:packagemy.company.app;importbacktype.storm.Config;importbacktype.sto

java - 连接 Java - MySQL : Public Key Retrieval is not allowed

我尝试使用连接器8.0.11将MySQL数据库与Java连接起来。一切似乎都很好,但我得到了这个异常(exception):Exceptioninthread"main"java.sql.SQLNonTransientConnectionException:PublicKeyRetrievalisnotallowedatcom.mysql.cj.jdbc.exceptions.SQLError.createSQLException(SQLError.java:108)atcom.mysql.cj.jdbc.exceptions.SQLError.createSQLException(S

java - 连接 Java - MySQL : Public Key Retrieval is not allowed

我尝试使用连接器8.0.11将MySQL数据库与Java连接起来。一切似乎都很好,但我得到了这个异常(exception):Exceptioninthread"main"java.sql.SQLNonTransientConnectionException:PublicKeyRetrievalisnotallowedatcom.mysql.cj.jdbc.exceptions.SQLError.createSQLException(SQLError.java:108)atcom.mysql.cj.jdbc.exceptions.SQLError.createSQLException(S

Flink Oracle CDC Connector源码解读

FlinkOracleCDC简介flinkcdc是在flink的基础上对oracle的数据进行实时采集,底层使用的是debezium框架来实现,debezium使用oracle自带的logminer技术来实现。logminer的采集需要对数据库和采集表添加补充日志,由于oracle18c不支持对数据添加补充日志,所以目前支持的oracle11、12、19三个版本。FlinkOracleCDC使用flinkoraclecdc支持sql和api两种方式。oracle需要开启归档日志和补充日志才能完成采集,同时需要提供一个有权限的账号去连接oracle数据库完成实时采集。归档日志开启方式#连接ora

Flink-JDBC SQL Connector报错: java.lang.Integer cannot be cast to java.lang.Long

序号作者版本时间备注1HamaWhite1.0.02022-11-22增加文档一、基础信息1.1组件版本Flink:  1.13.0JDK: 1.8Mysql: 8.0.15com.ververica:flink-connector-mysql-cdc:2.0.0org.apache.flink:flink-connector-jdbc_2.11:1.13.01.2建表语句1.2.1Mysql中的建表语句--新建表demoCREATETABLEdemo(sidint(6),namevarchar(255));--插入两条测试数据insertintodemovalues(1,'hamawhite

.net - 无法卸载 MySQL Connector/Net 6.3 或更高版本

由于该错误,我无法安装MySQLConnector/Net,原因是MSWebPlatform。MSI(s)(E4:D8)[12:15:40:237]:Doingaction:LaunchConditionsActionended12:15:40:SetHLMPath.Returnvalue1.Actionstart12:15:40:LaunchConditions.MSI(s)(E4:D8)[12:15:40:238]:Product:MySQLConnectorNet6.5.4--ApreviousversionofConnector/Net6.3orhigherisalreadyi

mongodb - Spark 无法使用 mongo-hadoop-connector 的 BSONFileInputFormat 编译 newAPIHadoopRDD

我在spark中使用mongo-hadoop客户端(r1.5.2)从mongoDB和bson中读取数据,链接如下:https://github.com/mongodb/mongo-hadoop/wiki/Spark-Usage.到目前为止,我可以毫无问题地从mongoDB读取数据。但是,bson配置甚至无法编译。请帮忙。我在Scala中的代码:dataConfig.set("mapred.input.dir","path.bson")valdocuments=sc.newAPIHadoopRDD(dataConfig,classOf[BSONFileInputFormat],class

java - 将 MySQL Connector/MXJ 用于应用程序的优点/缺点/替代品是什么

我最近制作了一个有趣的应用程序,使用PlayFramework和MySQLConnector/MXJ来制作一个带有数据库的完全可移植的Web服务器,独立于任何当前安装的软件(包括Java)。我对MXJ和桌面应用程序领域(与直接的Web应用程序相对)还是个新手,所以我想知道是否有其他比嵌入式MySQL更好的存储/访问大量数据的方法。我想是的,因为似乎没有多少人使用MXJ。它本质上只是将mysqld.exe打包为多种操作系统和平台的各种形式。它在自己的线程中运行,并将其数据存储在您提供的任何目录中。对于经常分析和搜索大块数据(100MB到5GB)的应用程序,还有哪些其他(快速)选项,或者我