草庐IT

xml - 将维基百科中的表格加载到 R

我正在尝试从以下URL将最高法院大法官表加载到R中。https://en.wikipedia.org/wiki/List_of_Justices_of_the_Supreme_Court_of_the_United_States我正在使用以下代码:scotusURLR将scotusTable返回为NULL。这里的目标是在R中获得一个data.frame,我可以用它来制作SCOTUS司法任期在法庭上的ggplot。我以前用脚本来制作一个很棒的情节,但是在最近的决定之后页面上发生了一些变化,现在脚本将无法运行。我浏览了维基百科上的HTML以试图找到任何更改,但我不是网络开发人员,所以任何会

python - 是否有解析器/方式可用于使用 Python 解析维基百科转储文件?

我有一个项目,我收集属于特定类别的所有维基百科文章,从维基百科中提取转储,并将其放入我们的数据库中。所以我应该解析维基百科转储文件来完成这些工作。我们有高效的解析器来完成这项工作吗?我是一名Python开发人员。所以我更喜欢python中的任何解析器。如果不推荐,我会尝试用python编写它的一个端口并将其贡献给网络,以便其他人使用它或至少尝试一下。所以我只需要一个python解析器来解析维基百科转储文件。我开始编写一个手动解析器来解析每个节点并完成工作。 最佳答案 http://jjinux.blogspot.com/2009/0

xml - 多流维基百科转储

我下载了德语维基百科转储dewiki-20151102-pages-articles-multistream.xml。我的简短问题是:在这种情况下,“多流”是什么意思? 最佳答案 转储使用bz2压缩,bz2支持并行版本,可以更快地压缩/解压缩文件。使用并行版本的压缩数据被标记为multistream。当您从编程语言处理转储时,了解此信息会有所不同,因为您必须传递一个标志来告诉库如何解压缩它(并行或非并行)。 关于xml-多流维基百科转储,我们在StackOverflow上找到一个类似的问

c# - 连接到维基百科 API 的 WebRequest

这可能是一个可悲的简单问题,但我似乎无法格式化帖子webrequest/response以从WikipediaAPI获取数据.如果有人能帮我看看我的问题,我已经在下面发布了我的代码。stringpgTitle=txtPageTitle.Text;Uriaddress=newUri("http://en.wikipedia.org/w/api.php");HttpWebRequestrequest=WebRequest.Create(address)asHttpWebRequest;request.Method="POST";request.ContentType="applicatio

c# - 基本的 CRC32 维基百科实现与在线看到的标准 CRC32 不同

我有一个基本的CRC32实现,遵循维基百科的CodeFragment:1sample.我认为我做对了,修改为对余数多项式使用n位寄存器,而不是按照示例使用n+1位。我得到的结果和网上的CRC32实现结果不一样。在我的实现中,我必须在此处更改什么?请忽略逻辑的Console.Writeline语句。constUInt32poly=0x04C11DB7;publicstaticUInt32GenerateCRC_32(byte[]message){byte[]augmentedMsg=newbyte[message.Length+4];message.CopyTo(augmentedMsg

javascript - 使用 AJAX (XMLHttpRequest) 查询维基百科的 API

我正在尝试使用AJAX(XMLHttpRequest)实现对维基百科API的简单请求。如果我在Firefox的地址栏中键入url,我会得到一个整洁的XML,那里没有汗水。然而,调用完全相同的url://thisismyXMLHttpRequestobjecthttpObjectMain.open("GET","http://en.wikipedia.org/w/api.php?action=query&format=xml&prop=langlinks&lllimit=500&titles=kaas",true);httpObjectMain.send(null);返回空响应。根据Fi

php - 如何使用维基百科的网络 API 检索一个人的传记信息?

我正致力于通过维基百科的网络API从某个人的维基百科页面检索该人的一些特定生物详细信息。我需要检索一个人的个人信息框。我找到了如何检索内容框、介绍段落和所有内容。以下URL用于检索wiki网页的第一个介绍段落。https://en.wikipedia.org/w/api.php?format=json&action=query&prop=extracts&exintro=&explaintext=&titles=Sachin_Tendulkar但我坚持通过wikiwebAPI获取上述个人信息框,以便我可以提取我想要的具体细节。是否可以通过单个查询获取单项信息(例如仅全名或仅出生日期)(

php - 如何使用维基百科 API 从维基百科的类别页面获取所有子类别?

这个问题在这里已经有了答案:关闭11年前。PossibleDuplicate:HowtogetallarticlepagesunderaWikipediaCategoryanditssub-categories所以我正在制作一个有趣的PHP项目,该项目涉及从维基百科上的一组类别中随机抽取一个项目。例如,假设我想要一把随机武器:我的程序转到http://en.wikipedia.org/wiki/Category:Weapons并随机选择一个子类别(比如Category:Toyweapons),然后继续选择较低级别的子类别,直到它到达一个不是类别的文章(例如:super浸泡器).但是,我

php - 从维基百科 XML 转储中获取特定的 "page"

好的,这就是我需要的:我已经下载并提取了完整的维基百科XML转储(>40GB,单个XML文件)我需要检索一个特定的元素(例如条目“意大利”的页面)我该怎么做?(最好使用PHP代码或一些现有工具) 最佳答案 不能保证页面的全部内容将按顺序定位,修订可能位于同一文件中的任何位置,甚至可能位于不同的XML文件中。请使用或webAPI'saction=export最坏的情况Special:Export.此处不添加链接,因为输出量很大。 关于php-从维基百科XML转储中获取特定的"page",我

php - 网站的维基百科模板

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于StackOverflow来说是偏离主题的,因为它们往往会吸引自以为是的答案和垃圾邮件。相反,describetheproblem以及迄今为止为解决该问题所做的工作。关闭9年前。Improvethisquestion如何在我的网站上使用维基百科的外观?是否有任何准备好的模板,如HTML模板,我可以稍作更改或以任何其他方式使用?