草庐IT

java - 使用Java解析时如何在文档元素之前保留空格?

在我的应用程序中,我更改了XML文件的某些部分,这些文件的开头如下:...注意之前的空行.加载、更改和保存后,结果很不尽如人意:...我发现评论和文档节点之间的空白(一个换行符)根本没有在DOM中表示。以下自包含代码可靠地重现了该问题:Stringsource="\n\n";byte[]sourceBytes=source.getBytes("UTF-16");DocumentBuilderbuilder=DocumentBuilderFactory.newInstance().newDocumentBuilder();Documentdoc=builder.parse(newByte

java - 解析 Java 源代码

我被要求开发一个软件,该软件应该能够创建输入Java源代码的流程图/控制流。所以我开始研究它并得出以下解决方案:要创建流程图/控制流,我必须识别给定源代码中的控制语句和函数调用现在我有两种识别方法:通过编写我自己的语法来解析源代码(我认为这是一个复杂的解决方案)。我正在考虑为此使用Antlr。以文本形式读取输入源代码文件并搜索特定模式(可能会变得低效)我在这儿吗?或者我错过了一些非常基本和简单的东西?哪种方法会花费更少的时间并有效地完成工作?在这方面的任何其他建议也将受到欢迎。任何其他有效的方法都会有所帮助,因为输入的源代码可能跨越多个文件并且可能相当复杂。我擅长.NET语言,但这是我

java - 维基百科 : Java library to remove wikipedia text markup removal

我下载了维基百科转储,现在想删除每个页面内容中的维基百科标记。我尝试编写正则表达式,但它们太多而无法处理。我找到了一个python库,但我需要一个java库,因为我想集成到我的代码中。谢谢。 最佳答案 分两步进行:让一些现有工具将MediaWiki标记转换为纯HTML;将纯HTML转换为文本。下面的演示:importnet.java.textilej.parser.MarkupParser;importnet.java.textilej.parser.builder.HtmlDocumentBuilder;importnet.jav

java - SAX 解析器 : Ignoring special characters

我正在使用Xerces来解析我的XML文档。问题是像 这样的XML转义字符出现在characters()方法中作为非转义字符。我需要按原样在characters()方法中获取转义字符。谢谢。UPD:试图在我的DefaultHandler的后代中覆盖resolveEntity()方法。从调试中可以看出,它被设置为XML阅读器的实体解析器,但未调用覆盖方法的代码。 最佳答案 我认为您的解决方案还不错:几行代码就可以完全满足您的需求。问题是ContentHandler接口(interface)没有提供startEntity和en

java - 为什么 SimpleDateFormat.parse().getTime() 返回不正确(负)值?

我有一个String类型的时间戳,我试图将它转换为double(并在几秒钟内找到结果),这是我所做的:doublemytimeStamp=0;StringtimeStamp=newSimpleDateFormat("mmssS").format(newDate());SimpleDateFormatdateFormat=newSimpleDateFormat("mmssS");try{mytimeStamp=((double)dateFormat.parse(timeStamp).getTime())/1000;}catch(ParseExceptione1){//TODOAuto-g

java - 如何在 Java 源文件中获取给定行号的周围方法

我有一个Java源文件的行号,想以编程方式获取该行号的环绕方法。我调查了ANTLR这对我帮助不大。Janino(http://www.janino.net)看起来很有前途,我会扫描并解析(如果需要的话编译)代码。然后我可以使用JDI和ReferenceType.locationsOfLine(intlineNumber)我仍然不知道如何使用JDI来做这件事,也没有找到任何关于这个方向的教程。也许还有其他一些我完全想念的方法。 最佳答案 如果您使用的是Java6,并且您不介意使用Sun的API,那么您可以使用thejavacAPI.您

Java - 解析字符串 - String.split() 与 Pattern 和 Matcher

给定一个包含表示专有名词和类别/描述对的逗号分隔列表的字符串,使用String.split()与Pattern&Matcher方法查找特定专有名词并提取相关类别的优缺点是什么/描述对?haystack字符串格式不会改变。它将始终包含以下形式的逗号分隔数据PROPER_NOUN|类别/描述两种方法的共同变量:Stringhaystack="EARTH|PLANET/COMFORTABLE,MARS|PLANET/HARDTOBREATHE,PLUTO|DWARF_PLANET/FARAWAY";Stringneedle="PLUTO";Stringresult=null;使用String

java - 匹配 "| "的正则表达式

我正在尝试使用Java的useDelimiterScanner类上的方法来做一些简单的解析。基本上每一行都是一条由“|”分隔的记录,例如:2|JohnDoe3|JaneDoe4|JackieChan该方法将要匹配的正则表达式作为参数。谁能给我提供匹配|(两边用一个空格分隔的竖线)的正则表达式。谢谢,我将不胜感激! 最佳答案 我想到了\s\|\s,它在Java中将表示为"\\s\\|\\s"。我不知道这是否是最好的。我不需要任何硬核,只需要有用的东西,这似乎:)很抱歉回答我自己的问题,我想在输入它后它帮助我思考。

java - 用于 Java 的 GPX 解析器?

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。关闭6年前。Improvethisquestion是否有任何用于解析GPX文件的Java库?我需要将许多GPX文件解析为我们自己的数据结构(我们自己的数据库)。

java - 如何在 JSON 数据解码期间处理解析器异常?

我在我的Web应用程序中使用Jersey。发送到服务器的数据是JSON格式,然后在服务器端解码,获得的对象用于进一步处理。安全审计为这种方法提出了一些漏洞。我的休息代码:@POST@Path("/registerManga")@Produces(MediaType.APPLICATION_JSON)publicResponseregisterManga(MangaBeanmBean){System.out.println(mBean);returnResponse.status(200).build();}漫画bean:publicclassMangaBean{publicString