草庐IT

large-files

全部标签

html - 提取 HTML 文件中两个标签之间的数据

我的系统上保存了一个HUUUGEHTML文件,其中包含来自产品目录的数据。数据的结构使得每个产品记录的名称位于两个标签(name)和(/name)之间。每个产品最多有3个属性:名称、产品ID和颜色,但并非所有产品都具有所有这些属性。如何在不混淆产品属性的情况下为每个产品提取这些数据?该文件也是50兆字节!代码示例....'hat'blahblahblah'1829493'blahblahblah'cyan'blahblahblahblahblahblahblahblah'shirt'blahblahblahblahblahblah'193''dress'blahblahblahblah

ruby-on-rails - rails : how to load local file into the model?

我有一个文件位于/lib/dir/file.xml我试图通过以下方式调用它:file=Nokogiri::XML(File.open('#{RAILS_ROOT}/lib/dir/file.xml'))但是我得到了错误,我不确定我做错了什么。该文件肯定存在。Errno::ENOENT:Nosuchfileordirectory-#{RAILS_ROOT}/lib/dir/file.xml如果有帮助,我正在使用Rails4和Ruby2。如何加载此文件? 最佳答案 我发现了问题所在。RAILS_ROOT已贬值。您应该改用Rails.ro

sql-server - SSIS 使用过多内存将大型 (40GB+) XML 文件加载到 SQL Server 表中

我需要使用SSIS将一个大型(40GB+)XML文件加载到SQLServer2012数据库表中。我遇到问题是因为SSIS似乎试图将整个文档加载到内存中而不是流式传输它。这是我的SSIS包的更多详细信息。我创建了一个具有以下属性的XML源:数据访问模式:来自变量的XML文件(但可以是XML文件位置)变量名:指定我电脑中XML文件路径的变量。XSD位置:定义正在读取的XML的XSD的路径。XML结构简单,只有3个层级:带有标题信息的根元素一级定义对象集合定义单个对象的叶级别(每个对象都有一组固定的字段)我需要为每个叶元素插入一个数据库记录,从更高层次重复字段。换句话说,我需要展平XML层次

php - 使用 unset() 删除 XML 中的节点; PHP/simplexml_load_file

我正在尝试使用unset()通过PHP删除XML中的节点,但无法弄清楚这里发生了什么。它似乎无法正常工作,我在这里看到了很多其他类似性质的问题,但它们似乎并没有直接解决这个问题。这是我的XML的样子:TestName1test@test.comTestName2anotherone@test.comTestName3我正在使用的循环是这样的:url='data/users.xml';$xml=simplexml_load_file($url);foreach($xml->useras$theUser){if($theUser->email[0]=="test@test.com"){ec

xml - 常规 : Compare SOAP Response with XML file

我想在groovy代码中比较我的SoapResponse和忽略顺序的xml文件:这是我的代码:importorg.custommonkey.xmlunit.Stuffimportorg.xmlunit.Stuff//ExpectedStringismyxmlconvertedtotext,sameforResponseStringDiffdiff=DiffBuilder.compare(ExpectedString).withTest(ResponseString).ignoreComments().ignoreWhitespace().checkForSimilar().withNo

xml - 如何在 Cocoa Touch 中读取 XML 'local file' 和解析

我可以使用以下代码读取远程XML:-(id)loadXMLByURL:(NSString*)urlString{tweets=[[NSMutableArrayalloc]init];NSString*filePath=[[[NSBundlemainBundle]resourcePath]stringByAppendingPathComponent:urlString];NSURL*url=[NSURLURLWithString:urlString];parser=[[NSXMLParseralloc]initWithContentsOfURL:url];parser.delegate=

xml - 查询 : how to get the previous element than the one chosen in an XML file?

好吧,如果我有例如:............出于某种原因,我得到了ID为35的条目:let$entry:=//entry[xs:integer(./@weight)=21]。我怎样才能简单地获取上一个条目(ID34)? 最佳答案 使用XPath轴preceding-sibling获取所有前面的sibling,而不是将结果集限制为最后一个。(//entry[xs:integer(./@weight)=21]/preceding-sibling::*)[last()]根据您的数据集和XQuery实现,反过来可能会更快:找到后跟一个满足条

使用 XProc 进行 XML 流式处理

我正在玩xproc、XML管道语言和http://xmlcalabash.com/.我想找到一个流式传输大型xml文档的示例。例如,给定以下巨大xml文档:Book-1Book-2Book-3Book-N我应该如何继续循环(流式传输)x->N个文档,例如Book-x并用xslt处理每个文档?xproc有可能吗? 最佳答案 您应该看看QuiXProc(http://code.google.com/p/quixproc),它是基于Calabash的XProc实现,添加了流式处理和并行处理希望这会有所帮助。

c# - 如何 : Dynamically Creating the XML file content and sending as a text file in asp.net c#

您好,我正在开发一个asp.net网页,该网页首先允许用户在指示的文本字段中输入所需的值,然后根据用户提供的数据生成一个新的文本文件。我想让用户在单击“获取文件”按钮时收到一个“Result.xml”文件。我已经搜索了该信息,我知道它一定有一个简单的解决方案,但现在我运气不好(我一定是累了)。我尝试了以下代码,但没有成功:DataSetds=newDataSet();ds.Tables.Add("TEST");ds.writexml("test.xml");Response.TransmitFile("test.xml");但是程序说找不到任何文件。我也不想将物理文件“写入”服务器,我

c# - Directory.GetFiles() 但仅包含具有特定内容的文件(例如 "my file contents")使用 C#

我想搜索所有包含特殊标签的XML文件,例如其内容中的“字段”。如何使用C#中的Directory.GetFiles(...)方法实现此目的?string[]filePathsFields=Directory.GetFiles(@"E:\Code\","*.xml",SearchOption.AllDirectories); 最佳答案 你不能。如果你想按内容过滤,你需要打开并阅读每个文件,看看它是否包含你的内容。 关于c#-Directory.GetFiles()但仅包含具有特定内容的文件