草庐IT

存储算法

全部标签

xml - XML 解析器/验证器的算法复杂性

我需要了解不同XML工具(解析器、验证器、XPath表达式求值器等)的性能如何受到输入文档的大小和复杂性的影响。是否有资源记录了CPU时间和内存使用情况如何受到……好吧,什么?文档大小(以字节为单位)?节点数?关系是线性的、多项式的还是更糟?更新在IEEEComputerMagazine,第41卷第9期,2008年9月的一篇文章中,作者调查了四种流行的XML解析模型(DOM、SAX、StAX和VTD)。他们运行了一些非常基本的性能测试,这些测试表明当输入文件的大小从1-15KB增加到1-15MB或大约1000倍时,DOM解析器的吞吐量将减半。其他模型的吞吐量没有受到显着影响。遗憾的是,

xml - 在 XML 中存储引用数据的可接受方式是什么?

在XML中存储引用数据的可接受方式是什么?例如,对于一个节点,哪个是正确的?(a)杰西“body”文图拉(b)杰西“尸体”文图拉(c)杰西“尸体”;文图拉(d)以上都不是(请说明)如果(a),你对属性做了什么?如果(c),混合HTML和XML真的合适吗?同样,您如何处理单引号和弯引号? 最佳答案 您的正确答案是A&C,因为"不是必须在元素数据中编码的字符。您应该始终对XML编码字符,例如>,,和&以确保如果它们不在CDATA部分内,您不会遇到问题。这些都是元素数据需要关注的重点。在谈论属性时,您还必须注意'和"内部属性值取决于您用来

xml - 在数据库中存储 XML 是 "bad"吗?

我从多个来源听说将XML存储在数据库中是“不好的”,但我从未看到/听到过关于为什么会这样的实际解释。是真的吗?如果是真的,你能解释一下为什么吗?此外,您能告诉我在数据库中存储XML的“好”案例是什么吗? 最佳答案 这里有一些非常愚蠢的答案-仅仅因为数据库支持一种数据类型并不意味着您应该使用它。这些东西总是作为功能添加进来,因为竞争对手有它们,而不是因为它们是正确的事情。全局变量?触发器?是否有人会仅仅因为您可以使用它们并且它们就在那里而愿意为它们辩护?如果您有多个属性,在关系数据库中处理它们的最佳方法是使用一对多关系。从XML开销中

xml - 推出您自己的 XML 解析器/XML 解析算法?

因此,作为一个有趣的项目,我决定编写自己的XML解析器。不,不解析特定文档,不,不使用XML解析器库。我的意思是编写代码将任何XML文档解析为可用的数据结构。只是因为我喜欢挑战。:-)话虽如此,到目前为止它被证明是……有趣的。它不像最初看起来那么容易解析(尤其是当您开始考虑特殊字符、CDATA、空标签、注释等时)。是否有任何人知道的任何有据可查的XML解析算法或解释?似乎到处都有记录完备的Queue和Stack以及BTree等等等等的实现,但我不确定我是否见过一个简单的、记录完备的XML解析器算法...我再说一遍:我不是在寻找预构建的解析器库!我正在寻找关于如何创建我自己的预构建解析器

xml - XML 的最佳压缩算法?

我对压缩几乎一无所知,所以请耐心等待(这可能是一个愚蠢而痛苦的明显问题)。假设我有一个带有几个标签的XML文件。text现在假设我的多个XML文件中有一堆非常长的标签和许多属性。我需要将它们压缩到尽可能小的尺寸。最好的方法是使用特定于XML的算法,该算法为各个标签分配假名,如vlt1或vlt2。但是,这不会像我尝试的那样“开放”,我想使用像DEFLATE或LZ这样的通用算法。如果存档是.zip文件,它也会有所帮助。由于我处理的是纯文本(没有像图像这样的二进制文件),所以我想要一种适合纯文本的算法。哪个生成的文件大小最小(首选无损算法)?顺便说一下,场景是这样的:我正在为包含XML文件的

xml - 如何在数据库中存储文章或其他大文本

我目前正在为自己设计一个数据库驱动的网站。主要原因是出于学习目的,但我不会说谎,其中包含少量的虚荣心!虽然我相信到目前为止我的数据库设计相当不错,但我仍然不能完全确定存储文章或其他大文本的最佳方式。我知道大多数DBMS都具有TEXT数据类型或等效数据类型,并且可以容纳大量文本。然而,将一篇完整的文章存储为一个长字符串会导致阅读不愉快,因此需要格式化。我是否将文章文本与所有HTML或BBcode标记一起存储-还是仅在HTML或XML文档中创建页面并将此文件的路径存储在数据库中更好?我非常喜欢将文章存储为XML文档的想法,因为我可以轻松地使用自定义标签标记文章,并使用PHP的XML和XSL

xml - 以 XML 格式存储 base64 数据?

如何在XML中存储base64字符串?您是否使用CDATA在XML中存储base64字符串?它允许在字符串中使用会有所帮助吗?base64是否可配置,如果它们与XML冲突,您告诉它不要使用某些字符? 最佳答案 您可以将其存储为文本或属性值;不需要转义或CDATA部分。标准的base64字符+和/(a-z、A-Z和0-9)根本不会干扰XML解析。 关于xml-以XML格式存储base64数据?,我们在StackOverflow上找到一个类似的问题: https:

算法为何重要(《数据结构与算法图解》by 杰伊•温格罗)

本文内容借鉴一本我非常喜欢的书——《数据结构与算法图解》。学习之余,我决定把这本书精彩的部分摘录出来与大家分享。 写在前面算法这个词听起来很深奥,其实不然。它只是解决某个问题的一套流程。 准备一碗麦片的流程也可以说是一种算法,它包含以下4步(对我来说是4步吧)。(1)拿个碗。(2)把麦片倒进碗里。(3)把牛奶倒进碗里。(4)把勺子放到碗里。在计算机的世界里,算法则是指某项操作的过程。上一章我们研究了4种主要操作,包括读取、查找、插入和删除。这一章我们还是会经常提到它们,而且一种操作可能会有不止一种做法。也就是说,一种操作会有多种算法的实现。我们很快会看到不同的算法能使代码变快或者变慢——高负载

windows - 我可以直接使用 SAPI 将语音从存储的音频实时转换为文本吗

我真正想要实现的是这个-->假设我播放一个音频文件(使用我的应用程序),它可以从互联网流式传输/或直接从本地存储访问。现在我想将SAPI配置为收听此源而不是麦克风,并像往常一样将语音从音频转换为文本。 最佳答案 我不认为SAPI本身支持这个。您可以使用一些SAPI的“外部”方法:获取male-to-maleminiplugcable并将声卡的输出插入声卡的输入使用VirtualAudioCable它基本上达到了第一名,但使用的是虚拟声卡软件而不是硬件。一开始要了解虚拟音频电缆的工作原理和使用方法可能会非常棘手,但一旦您理解了它,它就

windows - 将文件输出存储到变量中

我想将文本文件的输出存储到一个变量中,这样我就可以将整个文件作为参数传递。我使用的是Windows2003Server。文本文件有多行,如:10.20.210.100fish10.20.210.101rock我正在使用:Set/Pvar=它只读取文件的第一行。我也尝试使用FOR循环,但它只将最后一行分配给变量。 最佳答案 没有简单的方法可以将文件的完整内容放入一个变量中。变量的长度限制为~8100。而且把CR/LF弄成一个变量比较复杂但是使用FOR循环你可以获得每一行。试试看batchscriptreadlinebyline编辑:要