Wikipedia

xml - 解析 Wiki XML 转储 ver0.4 变得很困难

我正在尝试使用“Parse-MediaWikiDump-1.0.4”和“Wikiprep.pl”脚本来解析维基百科XML转储。我想这个脚本在ver0.3WikiXMLDumps上工作正常，但在最新的ver0.4Dumps上不工作。我收到以下错误。无法在wikiprep.pl第390行通过包“Parse::MediaWikiDump::Pages”找到对象方法“page”。此外，在“Parse-MediaWikiDump-1.0.4”文档下@http://search.cpan.org/~triddle/Parse-MediaWikiDump-1.0.4/lib/Parse/MediaW

xml - 将维基百科转储索引到 elasticsearch 获取 XML 文档结构必须在同一实体错误中开始和结束

我想将wikipedia索引到elasticsearch。我试过stream2es+elasticsearch2.0.0和WikipediaRiver插件2.6.0+elasticsearch1.6.0索引最新的维基百科转储https://dumps.wikimedia.org/enwiki/20151102/enwiki-20151102-pages-articles-multistream.xml.bz2.但是两者都得到了相同的错误信息:XMLdocumentstructuresmuststartandendwithinthesameentity. 最佳

维基 elasticsearch cirrussearch enwiki 20151116 xml wikipedia

c# - 使用 xml 填充对象的设计模式

我有一个要用xml填充的对象。我认为我可能会使用接受此xml的构造函数来构建对象。但是，是否有更好的设计模式来做到这一点？是否由对象来处理所有的xml解析？谢谢! 最佳答案不，您不应该将xml发送到构造函数，因为您正在将模型与反序列化逻辑耦合。您应该创建一个类来为您处理反序列化并返回一个实例。为什么这很重要可能还不清楚。但是想象一下，将来您可能拥有来自数据库的数据，您不想将数据库连接传递给构造函数，对吗？相反，您可以创建一个不同的类，该类使用数据库来生成您的类的实例。这里有一些不错的读物:http://en.wikipedia.o

c#xml section wikipedia noreferrer java design-patterns object

python - 是否有解析器/方式可用于使用 Python 解析维基百科转储文件？

我有一个项目，我收集属于特定类别的所有维基百科文章，从维基百科中提取转储，并将其放入我们的数据库中。所以我应该解析维基百科转储文件来完成这些工作。我们有高效的解析器来完成这项工作吗？我是一名Python开发人员。所以我更喜欢python中的任何解析器。如果不推荐，我会尝试用python编写它的一个端口并将其贡献给网络，以便其他人使用它或至少尝试一下。所以我只需要一个python解析器来解析维基百科转储文件。我开始编写一个手动解析器来解析每个节点并完成工作。最佳答案 http://jjinux.blogspot.com/2009/0

维基百科 section python xml parsing wiki wikipedia

xml - 为 "Periodic table"和所有链接抓取 wiki 页面

我想抓取以下维基文章:http://en.wikipedia.org/wiki/Periodic_table这样我的R代码的输出将是一个包含以下列的表格:化学元素简称化学元素全名化学元素wiki页面的URL(显然每个化学元素都有一行)我正在尝试使用XML包获取页面内的值，但似乎卡在了开头，所以我希望能提供有关如何操作的示例(和/或相关示例的链接)library(XML)base_url 最佳答案试试这个:library(XML)URL一些输出:>dim(m3)[1]1183>head(m3)URLNameSymbol[1,]"ht

amp Periodic 34 wikipedia http xml r web-scraping

xml - 多流维基百科转储

我下载了德语维基百科转储dewiki-20151102-pages-articles-multistream.xml。我的简短问题是:在这种情况下，“多流”是什么意思？最佳答案转储使用bz2压缩，bz2支持并行版本，可以更快地压缩/解压缩文件。使用并行版本的压缩数据被标记为multistream。当您从编程语言处理转储时，了解此信息会有所不同，因为您必须传递一个标志来告诉库如何解压缩它(并行或非并行)。关于xml-多流维基百科转储，我们在StackOverflow上找到一个类似的问

维基百科 section stackoverflow xml wiki wikipedia bzip2 wikimedia-dumps

c# - 连接到维基百科 API 的 WebRequest

这可能是一个可悲的简单问题，但我似乎无法格式化帖子webrequest/response以从WikipediaAPI获取数据.如果有人能帮我看看我的问题，我已经在下面发布了我的代码。stringpgTitle=txtPageTitle.Text;Uriaddress=newUri("http://en.wikipedia.org/w/api.php");HttpWebRequestrequest=WebRequest.Create(address)asHttpWebRequest;request.Method="POST";request.ContentType="applicatio

维基 c#section response request mediawiki webrequest wikipedia wikipedia-api

javascript - 使用 Javascript 在浏览器中以编程方式打开 "View Source"HTML 窗口？

如何以编程方式打开“查看源代码”窗口(使用一些Javascript)，就像在浏览器中右键单击并单击“查看源代码”一样？这可能吗？最佳答案您可以使用Firefox、Chrome和旧版IE支持的“查看源代码”URI模式。不需要JavaScript，只是您希望用户在源代码View中看到的页面的普通链接:viewWikipedia'shomepageHTMLsource更多信息:http://en.wikipedia.org/wiki/View-source 关于javascript-使用J

javascript section source wikipedia view-source

javascript - 使用 AJAX (XMLHttpRequest) 查询维基百科的 API

我正在尝试使用AJAX(XMLHttpRequest)实现对维基百科API的简单请求。如果我在Firefox的地址栏中键入url，我会得到一个整洁的XML，那里没有汗水。然而，调用完全相同的url://thisismyXMLHttpRequestobjecthttpObjectMain.open("GET","http://en.wikipedia.org/w/api.php?action=query&format=xml&prop=langlinks&lllimit=500&titles=kaas",true);httpObjectMain.send(null);返回空响应。根据Fi

维基 XMLHttpRequest section amp javascript ajax api wikipedia

javascript - 初学者 JavaScript OOP 与函数式

我刚刚开始研究不同的编程风格(OOP、函数式、过程式)。我正在学习JavaScript并开始学习underscore.js并开始学习this文档中的一小部分。文档说underscore.js可以用于面向对象或函数式风格，并且这两种方式会产生相同的结果。_.map([1,2,3],function(n){returnn*2;});_([1,2,3]).map(function(n){returnn*2;});我不明白哪个是函数式的，哪个是OOP，我也不明白为什么，即使在对这些编程范式进行了一些研究之后也是如此。最佳答案编程范式面向

javascript point noreferrer wikipedia oop functional-programming underscore.js

123 4 5