草庐IT

apache-beam-io

全部标签

java - 使用 Apache POI 从 Excel 中写出 XML

我需要将我的excel文件转换为XML。目前,我有一个使用POI的工具可以输出2010excel文件(xlsx),但我想进一步扩展它并让它也输出XML。我似乎找不到任何关于如何在POI中执行此操作的明确示例,但搜索表明这是可能的。希望有人对此有一些直接经验吗?谢谢! 最佳答案 我从未直接使用过POI,尽管我曾使用ApacheTika(它实现了POI)来做类似的事情。解析器/处理程序接口(interface)自动将文档转换为XML,您应该能够根据自己的目的进行调整。https://tika.apache.org/1.2/parser.

java - 为什么 Apache POI OPCPackage close() 方法不会保存/写入内容以打开可写文件?

使用以下代码,不会保存对我的Excel电子表格所做的单元格值更改:OPCPackagepkg=OPCPackage.open(inputFile);XSSFWorkbookwb=newXSSFWorkbook(pkg);ModifyWorkbook();pkg.close();以下是我写的解决方法,但我不明白为什么有必要。OPCPackagepkg=OPCPackage.open(inputFile);XSSFWorkbookwb=newXSSFWorkbook(pkg);ModifyWorkbook();Filetmp=File.createTempFile("tempSpreads

java - RabbitMQ - Apache Camel Reading Messages 如何处理失败的消息

我有以下PHP应用程序。将用户注册发布到消息队列。Java应用程序从该队列中读取并导入它。希望下图能够描述它。我只处理Java方面的事情。json消息已经存在于队列中。路由(Java消费端)。@ComponentpublicclassSignUpRouting{errorHandler(deadLetterChannel("rabbitmq://signUpDeadLetter.exchange?username=etc..").useOriginalMessage());from("rabbitmq://phpSignUp.exchange?username=etc....").ro

java - Apache Storm Bolt 任务在一段时间后未收到消息

我们有一个Storm拓扑,其中配置了一个spout和两个bolts。Spout不断地从数据库中查询数据并将元组发送到第一个bolt进行一些处理。第一个bolt进行一些处理并将元组发送到第二个bolt,第二个bolt调用第三方网络服务并发送数据。所以,一段时间后发生了什么,最后一个bolt没有得到任何元组,如果我们重新启动拓扑它工作正常。这里只有最后一个bolt有问题。其他spout和firstbolt运行良好,我没有使用acking框架。在这种情况下,我只配置了一个worker`。TopologyBuilderbuilder=newTopologyBuilder();builder.s

java - Apache Poi 3.13 找不到打开 XLSX 文件的类

我正在使用apachePOI通过Java读写Excel文件,但我无法在源代码中找到WorkbookFactory或XSSFWorkbook来读取xlsx文件。pom.xml:3.13org.apache.poipoi${poi.version}org.apache.poipoi-ooxml${poi.version}我在apachepoi的变更日志中找不到任何可能导致此行为的信息。编辑:这是我的实现(暂时只是一个简单的方法)publicstaticHSSFSheetgetXLSSheet(StringfileName,intsheetIndex)throwsIOException{In

javax.xml.ws.WebServiceException : java. io.IOException:写入服务器 Tomcat 8 时出错

我们最近将在JRE1.7.0_17/Tomcat7.0.39上运行的JAX-WS网络服务的技术堆栈更新为JRE1.8.0_66/Tomcat8.0.28。Web应用程序在WindowsServer2012上运行。Web服务使用JAX-WS的Metro实现。客户端使用JRE7和内置于JRE中的JAX-WS客户端API在各种Windows版本上运行。网络服务用于将文件从客户端机器上传到网络服务,网络服务将文件保存在文档管理系统中。该实现在Java7/Tomcat7下运行得非常完美,但我们遇到了在Java8/Tomcat8服务器端运行更大负载(2MB或更大)的问题。来自客户端的堆栈跟踪是:1

java - Apache Spark 如何将函数发送到引擎盖下的其他机器

我开始使用Pyspark进行一些数据处理。我可以做一些像这样的事情对我来说很有趣rdd.map(lambdax:(x['somekey'],1)).reduceByKey(lambdax,y:x+y).count()它会将这些函数中的逻辑发送到可能多台机器上以并行执行。现在,如果我有Java背景,如果我想将包含某些方法的对象发送到另一台机器,那台机器需要知道通过网络流式传输的对象的类定义。最近java有了函数式接口(interface)的想法,它将在编译时为我创建该接口(interface)的实现(即MyInterfaceimpl=()->System.out.println("Stu

java - Apache Kafka 1.0.0 Streams API Multiple Multilevel groupby

我如何在KafkaStreamsAPI中使用具有多个约束的.groupby。与下面的Java8StreamsAPI示例相同publicvoidtwoLevelGrouping(Listpersons){finalMap>>personsByCountryAndCity=persons.stream().collect(groupingBy(Person::getCountry,groupingBy(Person::getCity)));System.out.println("PersonslivinginLondon:"+personsByCountryAndCity.get("UK"

java - SlidingWindows 用于 Apache Beam 上的慢速数据(大间隔)

我正在使用ChicagoTrafficTracker数据集,每15分钟发布一次新数据。当有新数据可用时,它表示记录与“实时”相差10-15分钟(example,查找_last_updt)。例如,在00:20,我得到时间戳为00:10的数据;在00:35,我从00:20开始;在00:50,我从00:40开始。因此,我可以“固定”获取新数据的时间间隔(每15分钟一次),尽管时间戳的时间间隔略有变化。我正在尝试在Dataflow(ApacheBeam)上使用这些数据,为此我正在玩滑动窗口。我的想法是收集和处理4个连续的数据点(4x15分钟=60分钟),理想情况下,一旦有新数据点可用,就更新我

java - IWAB0399E 从 WSDL 生成 Java 时出错 : java. io.IOException:错误:缺少 <soap:fault> 元素 inFault

我有一个供内部使用的WCF4.0服务。另一个团队正尝试在Java中使用它。IWAB0399EErroringeneratingJavafromWSDL:java.io.IOException:ERROR:MissingelementinFault"PasswordReuseFaultFault"...一个消息来源表明它可能是一个Soap1.1vs.Soap1.2issue确实是我的WCF生成了WSDL注意而不是预期的我很确定这就是问题的原因。如何让WCF生成soap1.1WSDL?或我应该告诉Java团队做什么,以便他们的工具能够理解更新的协议(protocol)?编辑:我发现basi