apache-flink

java - Apache Beam 和 CombineFn 的编码器问题

我们正在使用ApacheBeam和DirectRunner构建管道作为运行者。我们目前正在尝试一个简单的管道，我们可以:从GoogleCloudPub/Sub中提取数据(目前使用模拟器在本地运行)反序列化为Java对象使用1分钟固定窗口的窗口事件使用自定义CombineFn组合这些窗口将它们从事件转换为事件列表。管道代码:pipeline.apply(PubsubIO.read().topic(options.getTopic()).withCoder(StringUtf8Coder.of())).apply("ParseEvent",ParDo.of(newParseEventFn(

java - Apache Derby 为我创建的具有有意义名称的索引提供了奇怪的名称

我正在使用这个ddl在derby中创建一个简单的演示表:CREATETABLEMY_TABLE(SESSION_IDCHAR(36),ATTRIBUTE_NAMEVARCHAR(200),CONSTRAINTMY_TABLE_PKPRIMARYKEY(SESSION_ID,ATTRIBUTE_NAME),);CREATEINDEXMY_TABLE_IX1ONMY_TABLE(SESSION_ID);我想在测试中验证是否实际创建了INDEXMY_TABLE_IX1。在线搜索我看到了两种可能的实现方法:JDBC-->使用DatabaseMetaData我可以按照以下方式做一些事情met

Apache Derby code TABLE pre java sql database jdbc

java - 在 GWT 中导入 Gears API 时找不到 org.apache.xerces.jaxp.SAXParserFactoryImpl

我创建了一个GWT使用Eclipse的项目运行良好(我能够在托管模式和GoogleAppEngine上运行它)，直到我尝试导入GearsAPIforGoogleWebToolkit.将以下行添加到我的java源文件后:importcom.google.gwt.gears.client.geolocation.Geolocation;当我尝试编译时出现以下错误:19-Jun-20093:36:09AMcom.google.apphosting.utils.jetty.JettyLoggerwarnWARNING:failedcom.google.apphosting.utils.jett

中导 SAXParserFactoryImpl code section google java gwt xerces

java - Apache Shiro 和新手 Java 安全

我对Java的安全模型一无所知，包括XML配置、策略设置、任何安全框架组件、工具(如keystore等)以及介于两者之间的一切。虽然我知道卷起袖子深入学习Java安全性最终将成为必不可少的，但我想知道使用ApacheShiro之类的东西是否有助于稍微简化过渡。因此，我对此有一些担忧。本质上，Shiro是一个用于在Java应用程序(尤其是Web应用程序)中实现安全性的“交key、包罗万象的包装器”。意思是，是否可以用他们的项目配置Shiro并从本质上调整它来执行所有相同的配置、策略设置等，如果没有它，人们将不得不“手动”(零碎地)执行所有相同的配置、策略设置等？如果不是，Shiro有什么

Apache Shiro section Java security owasp

Flink on Zeppelin (4) – 机器学习篇

今天我来讲下如何在Zeppelin里做机器学习。机器学习的重要性我就不多说了，我们直奔主题。Flink在机器学习这个领域发力较晚，社区版没有一个完整的机器学习算法库可以用，Alink[1]是目前Flink生态圈相对比较完整的机器学习算法库，Alink也在往Flink社区贡献的路上。今天我主要讲的就是如何在Zeppelin里使用Alink。为什么在Zeppelin平台使用AlinkZeppelin已经很好的集成了Flink，在Zeppelin中使用Alink可以充分利用Zeppelin集成Flink所提供的特性，包括：支持丰富的执行模式：Local/Remote/Yarn支持对接Hive支持UD

Zeppelin 机器 xff0c xff0 xff flink 机器学习大数据人工智能

java - Apache POI-HSSF 在将图片添加到 Excel 单元格时扭曲图像大小

我正在使用ApachePOI-HSSF将图片添加到单元格中。图片为120x100，但无论我做什么以及如何调整它的大小，Excel电子表格总是显示它跨越多行并将其扭曲到比宽度大得多的高度。如何保持原始尺寸？我的代码:InputStreamis=newFileInputStream(getImageURL());byte[]bytes=IOUtils.toByteArray(is);intpictureIdx=wb.addPicture(bytes,Workbook.PICTURE_TYPE_JPEG);is.close();//addapictureshapeCreationHelper

POI-HSSF Apache section AddDimensionedImage anchor java image excel apache-poi hssf

Flink学习-处理函数

简介处理函数是Flink底层的函数，工作中通常用来做一些更复杂的业务处理，处理函数分好几种，主要包括基本处理函数，keyed处理函数，window处理函数。Flink提供了8种不同处理函数：ProcessFunction：dataStreamKeyedProcessFunction：用于KeyedStream，keyBy之后的流处理CoProcessFunction：用于connect连接的流ProcessJoinFunction：用于join流操作BroadcastProcessFunction：用于广播KeyedBroadcastProcessFunction：keyBy之后的广播Proc

函数处理 span class token flink java

Flink ExecuteGraph构建源码解析

文章目录前言ExecutionGraph中的主要抽象概念源码核心代码入口源码核心流程：前言在JobGraph构建过程中分析了JobGraph的构建过程，本文分析ExecutionGraph的构建过程。JobManager(JobMaster)根据JobGraph生成ExecutionGraph。ExecutionGraph是JobGraph的并行化版本，是调度层最核心的数据结构。ExecutionGraph中的主要抽象概念1、ExecutionJobVertex：和JobGraph中的JobVertex一一对应。每一个ExecutionJobVertex都有和并发度一样多的ExecutionV

ExecuteGraph 源码 span class token flink 大数据流计算

java - 内存缓存中的 Apache spark

Spark将工作数据集缓存到内存中，然后以内存速度执行计算。有没有办法控制工作集在RAM中的驻留时间？我有大量通过作业访问的数据。最初将作业加载到RAM需要时间，当下一个作业到达时，它必须将所有数据再次加载到RAM，这非常耗时。有没有办法使用Spark将数据永久(或指定时间)缓存到RAM中？最佳答案要显式取消缓存，您可以使用RDD.unpersist()如果你想在多个作业之间共享缓存的RDD，你可以尝试以下方法:使用相同的上下文缓存RDD，并将该上下文重新用于其他作业。这样你只缓存一次，多次使用存在执行上述功能的“spark作业

Apache spark section noreferrer java caching apache-spark

java - Apache Felix SCR @Reference 速查表

我在我的应用程序中使用ApacheFelix声明式服务，我正在寻找一份备忘单，其中描述了可以为@Reference注释提供的参数。我曾经看到一个网页，其中包含关于它的非常有用的备忘单(或表格)，但我似乎找不到它。我认为这对很多Felix用户都有用。我说的参数:基数:MANDATORY_UNARY、MANDATORY_MULTIPLE、OPTIONAL_UNARY、OPTIONAL_MULTIPLE策略:EVENT，LOOKUP策略:动态、静态policyOption:贪婪，不情愿cardinality相当简单，但其他的我不清楚。他们做什么以及如何工作？最佳

Reference Apache strong bind li java apache-felix declarative-services

82 83 848586 87 88