草庐IT

expat-parser

全部标签

xml - Nmap::Parser,大文件的段错误

我想使用Nmap::Parser将nmap扫描的XML输出转换为CSV文件,但我一开始就遇到了问题。解析小型TCP/UDP扫描工作正常,但当我尝试转换较大的文件(例如20MB)时,尤其是所有65535个UDP端口都打开|过滤的文件时,我遇到段错误。问题似乎是“parsefile”方法。我在Linux和MacOSX上尝试了不同版本的Perl5.10/5.14,结果相同。请参阅下面的代码片段。#!/usr/bin/envperlusestrict;usewarnings;useNmap::Parser;my$np1=newNmap::Parser;my$xmlin=$ARGV[0];sub

xml - 我可以使用模式强制执行 XML 属性的顺序吗?

我们的C++应用程序从如下所示的XML文件中读取配置数据:...完整的应用程序配置包含约2500个这样的XML文件(转换为超过150万个键/值属性对)。XML文件来自许多不同的来源/团队,并根据模式进行验证。但是,有时节点看起来像这样:或者这个:为了加快这个过程,我们使用Expat解析XML文档。Expat将属性公开为一个数组——像这样:voidExpatParser::StartElement(constXML_Char*name,constXML_Char**atts){//TheattributesarestoredinanarrayofXML_Char*where://then

python - 基于 expat 的 xml 解析脚本在 Linux 上不工作,在 Windows 上工作

我正在用python编写一组工具,以从交通模拟软件生成的一些xml文件中提取数据。由于生成的文件可能非常大,我使用xml.parsers.expat来解析它们。问题是,当我在工作时在WindowsXP机器上运行我的脚本时,它运行良好,但在家里,在Ubuntu10.10上,在同一个文件上,我收到以下错误:ExpatError:格式不正确(无效标记):第1行,第0列该文件最初是用utf-8编码的,标签中声明的编码是ascii,因此尝试将其更改为utf-8(或UTF8或utf8)但没有成功。由于没有BOM,我尝试编写它,但仍然没有成功。我还尝试用Unix换行符(CR)替换Windows换行符

windows - 错误 zephir_parser 扩展未加载窗口

我已遵循所有步骤here在Windows732位上安装zephir我用wampserver2.5运行php,我已经下载了PHP5.6.33并成功将它添加到wampserver我已经安装了visualstudio2012我已经创建了一个扩展命名空间:zephirinitmyapp我创建这个类是为了测试目的namespaceMyapp;classCoco{publicfunctionHarmos(doublex){returnx*x;}}但是当我从命名空间目录调用构建时zephirbuild我有这个错误thezephirparserisnotloadednote:Zephirnolonge

在 Windows 上将 EXPAT 编译为静态链接的 .a

我正在使用MingW在Windows上编写C程序,并希望使用EXPATXML库。我想静态编译我的程序,所以我需要静态.a库。有什么方法可以将EXPAT编译成Windows上的静态独立库吗? 最佳答案 如果您从ExpatSourceforgeprojectpage下载官方版本您将无法使用MSYS或MinGW编译和安装库。您将需要安装CygWin来配置、制作和安装。要编译和安装nativeMinGW库,您需要修改版本的configure脚本和libtool。只需下载expatsourcetarballprovidedbyMinGW而不是

php - 我如何使用 PHP Simple HTML DOM Parser 来解析它?

这是我需要解析成PHP程序的HTML示例:AcmeSoftwareJohnDoe,MBA123MainSt.NewYork,NY10036(212)555-1234VisitWebsite(0.3miles)JohnDoe,MBAGetDirections»这是我要从上面的HTML示例中提取到PHP中的信息:lng:-73.00898601,lat:41.71727402category:'office'AcmeSoftwareJohnDoe,MBA123MainSt.NewYork,NY10036(212)555-1234http://www.example.com我曾尝

PHP Native DOMDocument 和 Simple DOM Parser - 有大小限制吗?

我需要解析HTML文档(由MicrosoftWord生成)的内容。遍历DOM以获取我需要的信息/内容,然后将所需内容输出为CSV。我知道几乎没有脑外科手术。现在,由于PHP不是我真正喜欢的东西,而且我的日程安排很紧,我打算使用来自http://simplehtmldom.sourceforge.net/的PHPSimpleHTMLDOMParser我注意到我的脚本不工作。经过反复试验,我意识到这是由Word生成的HTML文件的文件大小造成的(它们为3MB,并且有多达30,000行HTML!)。我假设对于可以使用PHPSimpleHTMLDOMParser和nativePHPDOMDoc

php - 如何使用 PHP Simple HTML DOM Parser 启用 gzip 压缩

我已经尝试了一些方法来使用PHPSimpleHTMLDOMParser启用gzip压缩,但到目前为止似乎没有任何效果。我已经使用ini_set更改了用户代理,所以我认为也可以启用gzip压缩?include("simpdom/simple_html_dom.php");ini_set('zlib.output_compression','On');$url='http://www.whatsmyip.org/http_compression/';$html=file_get_html($url);print$html;上面的网站对其进行了测试。如果我完全以错误的方式进行此操作,请告诉我

php - 使用 Simple HTML DOM Parser 按 ID 查找表

我去年写了一个数据库播种器,用于抓取统计网站。重新访问我的代码后,它似乎不再有效,我对原因有点困惑。$html->find()应该返回找到的元素数组,但它似乎只在使用时找到第一个表。根据文档,我改为尝试使用find()并指定每个表的ID,但这似乎也失败了。$table_passing=$html->find('table[id=passing]');谁能帮我弄清楚这里出了什么问题?我不知道为什么这两种方法都不起作用,页面源清楚地显示了多个表和ID,这两种方法都应该起作用。privatefunctiongetTeamStats(){$url='http://www.pro-footbal

PHP Simple HTML DOM Parser 不处理无效的 HTML - 在第一次试用时卡住了

我正在尝试使用PHPSimpleHTMLDOMParser绝对没有运气。我的例子很简单,似乎符合手册中给出的例子(simplehtmldom.sourceforgeATnet/manual.htm)但它只是行不通,这让我难以自拔。使用简单dom给出的其他示例脚本工作正常。参见示例:linktext这是我找到的最简单的示例...如何解析它?我应该用Perl来做吗?示例HTML页面是无效的HTML。我不知道SimpleHTMLDOMParser是否能够处理格式错误的HTML(可能不是)。好吧:如果我无法让它运行,我可以尝试一些Perl解析器,例如HTML::TreeBuilder::XPa