草庐IT

html - 这个网址存在吗? RCurl 说不

感兴趣的URL是:http://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO2&Sect2=HITOFF&u=/netahtml/PTO/search-adv.htm&r=10&f=G&l=50&d=PTXT&OS=AN/(nortel)&RS=AN/nortel&Query=AN/(nortel)&Srch1=nortel.ASNM.&NextList1=Next50Hits测试其存在的所选函数是:>url.exists("http://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO2&Sect2=

xml - RCurl 无法下载 URL 内容

页面下载失败。这是我收到的错误:Errorinwhich(value==defs):argument"code"ismissing,withnodefault这是我的代码:require(RCurl)require(XML)ok 最佳答案 如果您愿意生活在Hadleyverse的最前沿,rvest可以很好地处理这个问题:library(rvest)ok_search%html_nodes("div.profile_info")%>%html_text()##[1]"phenombom32·SanFrancisco,CA""sylve

xml - 使用 R 对房地产广告进行网络抓取

作为经济研究团队的实习生,我的任务是使用R找到一种自动收集房地产广告网站上特定数据的方法。我假设相关包是XML和RCurl,但我对它们的工作了解非常有限。这是网站的主页:http://www.leboncoin.fr/ventes_immobilieres/offres/nord_pas_de_calais/?f=a&th=1&zz=59000理想情况下,我想构建我的数据库,使每一行对应一个广告。这是广告的详细信息:http://www.leboncoin.fr/ventes_immobilieres/197284216.htm?ca=17_s我的变量是:价格(“Prix”)、城市(“

xml - 如何从 R 中抓取的网页中分离出单个元素

我想使用R来抓取此页面:(http://www.fifa.com/worldcup/archive/germany2006/results/matches/match=97410001/report.html)和其他页面,以获得进球得分手和时间。到目前为止,这是我得到的:require(RCurl)require(XML)theURL并且pagetree对象现在包含指向我解析的html的指针(我认为)。我想要的部分是:GoalsscoredPhilippLAHM(GER)6',PauloWANCHOPE(CRC)12',MiroslavKLOSE(GER)17',MiroslavKLO

xml - 在 R 中抓取受密码保护的网站

我正在尝试从R中受密码保护的网站上抓取数据。四处阅读,似乎httr和RCurl包是使用密码身份验证抓取的最佳选择(我还研究了XML包).我要抓取的网站如下(您需要一个免费帐户才能访问完整页面):http://subscribers.footballguys.com/myfbg/myviewprojections.php?projector=2这是我的两次尝试(用我的用户名替换“用户名”,用我的密码替换“密码”):#Thisreturns"Status:200"withoutthedatafromthepage:library(httr)GET("http://subscribers.f

html - 如何在 R 中发布一个简单的 HTML 表单?

我是R编程的新手,我正在尝试将我在约翰霍普金斯大学数据科学类(class)中学到的一些东西付诸实践。具体来说,我想自动化从USTreasurywebsite下载历史债券价格的过程。同时使用Firefox和R,我能够确定美国财政部网站使用非常简单的HTMLPOST表单来为感兴趣的报价指定一个日期。然后它会返回所有未偿还债券的二级市场信息表。我曾尝试使用两个不同的R包向美国财政部Web服务器提交请求,但没有成功。野兔是我尝试过的两种方法:尝试#1(使用RCurl):url这会导致网页被返回并存储在td.html中,但它只包含来自treasurydirect服务器的错误消息。我知道服务器正在

html - 如何在 R 中发布一个简单的 HTML 表单?

我是R编程的新手,我正在尝试将我在约翰霍普金斯大学数据科学类(class)中学到的一些东西付诸实践。具体来说,我想自动化从USTreasurywebsite下载历史债券价格的过程。同时使用Firefox和R,我能够确定美国财政部网站使用非常简单的HTMLPOST表单来为感兴趣的报价指定一个日期。然后它会返回所有未偿还债券的二级市场信息表。我曾尝试使用两个不同的R包向美国财政部Web服务器提交请求,但没有成功。野兔是我尝试过的两种方法:尝试#1(使用RCurl):url这会导致网页被返回并存储在td.html中,但它只包含来自treasurydirect服务器的错误消息。我知道服务器正在

javascript - 如何使用 R 下载半损坏的 javascript asp 函数后面的文件

我正在尝试修复downloadautomationscript我公开提供,以便任何人都可以使用R轻松下载世界值(value)观调查。在这个网页上-http://www.worldvaluessurvey.org/WVSDocumentationWV4.jsp-PDF链接“WVS_2000_Questionnaire_Root”很容易在firefox和chrome中下载。我不知道如何使用httr自动下载或RCurl或任何其他R包。下面的chrome互联网行为的屏幕截图。该PDF链接需要跟踪到http://www.worldvaluessurvey.org/wvsdc/DC00012/F0

javascript - 如何使用 R 下载半损坏的 javascript asp 函数后面的文件

我正在尝试修复downloadautomationscript我公开提供,以便任何人都可以使用R轻松下载世界值(value)观调查。在这个网页上-http://www.worldvaluessurvey.org/WVSDocumentationWV4.jsp-PDF链接“WVS_2000_Questionnaire_Root”很容易在firefox和chrome中下载。我不知道如何使用httr自动下载或RCurl或任何其他R包。下面的chrome互联网行为的屏幕截图。该PDF链接需要跟踪到http://www.worldvaluessurvey.org/wvsdc/DC00012/F0

R 包 : RCurl and curl packages install failure on Linux

我希望你能帮助解决我在为R安装Curl和curl包时遇到的这个问题。Rdwarning:/tmp/RtmpOBkvFC/R.INSTALLd07e6c06faf4/RCurl/man/url.exists.Rd:5:missingfilelink‘file.exists’**buildingpackageindices**testingifinstalledpackagecanbeloadedErrorindyn.load(file,DLLpath=DLLpath,...):unabletoloadsharedobject'/home/majaidi/R/x86_64-redhat-l
12