feedparser_草庐IT

xml - 如何使用 nodejs 将可读流转换为有效的 JSON？

我正在尝试使用音乐会数据的ATOM提要并将其输出到JSON以便更好地使用。到目前为止，我一直在使用request获取数据和feedparser解析它，它似乎按照我的意愿工作。//datavarfeed='http://mix.chimpfeedr.com/630a0-dcshows';varwstream=fs.createWriteStream('data.json');varreq=request(feed);varfeedparser=newFeedParser({addmeta:false});req.on('response',function(res){varstream=

流转 nodejs 39 code section xml json node.js stream feedparser

Node.js Streams on(end) 在异步 on(readable) 完成之前完成

我使用Node.js请求库和node-feedparser来捕获提要，然后使用Mongoose将其发布到MongoDB数据库中。我将帖子信息存储到posts集合中，将feed信息存储到feeds集合中，但我需要将post._id存储在feeds集合中名为feeds._post的数组中。我遇到的问题是使用流接口(interface)，feedparser.on('end')在所有feedparser.on('readable')对数据库的异步调用完成之前被调用，因此我最终在Post集合中有15个帖子，而在Feed._post数组中只有11个post._id。我知道如果这只是普通的Java

readable Streams feedparser function section node.js mongodb asynchronous stream mongoose

python - Feedparser.parse() 'SSL: CERTIFICATE_VERIFY_FAILED'

我在feedparser解析HTTPSRSS提要时遇到了这个SSL问题，我真的不知道该怎么办，因为我找不到任何关于feedparser错误的文档:>>>importfeedparser>>>feed=feedparser.parse(rss)>>>feed{'feed':{},'bozo':1,'bozo_exception':URLError(SSLError(1,u'[SSL:CERTIFICATE_VERIFY_FAILED]certificateverifyfailed(_ssl.c:581)'),),'entries':[]}>>>feed["items"][]>>>

CERTIFICATE_VERIFY_FAILED CERTIFICATE section feedparser code python python-2.7 ssl rss

python - 在 Django 中使用 RSS (/Python)

对于我正在处理的站点，我想使用Django导入大量RSS提要。由于我需要快速获取它们的内容，因此我需要将它们缓存在本地(在数据库中或以其他方式)在Django中是否有一个标准的应用程序来执行RSS消费，或者在Python中是否有一个标准的方法来执行此操作？当然我可以自己实现它，但我宁愿重用一段好的代码(因为有很多东西需要考虑，比如当一个项目更新时该做什么，检查更新前等待多长时间，等等，我宁愿重用其他人的想法)。(我搜索了googledjango和rss，但似乎弹出的所有内容都是提要生成；肯定还有其他网站使用Django并使用RSS？) 最佳答案

python Django section feedparser rss

python - 带超时的 feedparser

我的代码卡在这个函数调用上:feedparser.parse("http://...")这以前有效。该网址甚至无法在浏览器中打开。你会如何解决这个案子？有超时的可能吗？我想继续，就好像什么都不会发生一样(仅打印一些消息或记录此问题) 最佳答案使用Pythonrequests库进行网络IO，feedparser仅用于解析:#Dorequestusingrequestslibraryandtimeouttry:resp=requests.get(rss_feed,timeout=20.0)exceptrequests.ReadTime

feedparser python section code

Python 提要解析器 : How can I check for new RSS data?

我正在使用feedparserpython库从提要中连续提取RSS数据。我以这样一种方式编写了我的python代码，即我可以请求RSS数据的单个实例。这是我目前的代码:importfeedparserrssPR=feedparser.parse('http://www.prnewswire.co.uk/rss/consumer-technology/wireless-communications-news.rss')rssDataList=[]forindex,iteminenumerate(rssPR.entries):rssDataList.append([item.publish

提要 Python code feedparser modified database rss

python - 如何让 SQLAlchemy 正确地将 unicode 省略号插入到 mySQL 表中？

我正在尝试使用feedparser解析RSS提要，并使用SQLAlchemy将其插入到mySQL表中。我实际上能够正常运行，但今天提要的描述中有一个带有省略号字符的项目，我收到以下错误:UnicodeEncodeError:'latin-1'codeccan'tencodecharacteru'\u2026'inposition35:ordinalnotinrange(256)如果我将convert_unicode=True选项添加到引擎，我可以让插入通过，但省略号不会显示，它只是奇怪的字符。这似乎是有道理的，因为据我所知，latin-1中没有水平省略号。即使我将编码设置为utf-8，

SQLAlchemy unicode code 39 description python mysql feedparser

python - 如何让 SQLAlchemy 正确地将 unicode 省略号插入到 mySQL 表中？

我正在尝试使用feedparser解析RSS提要，并使用SQLAlchemy将其插入到mySQL表中。我实际上能够正常运行，但今天提要的描述中有一个带有省略号字符的项目，我收到以下错误:UnicodeEncodeError:'latin-1'codeccan'tencodecharacteru'\u2026'inposition35:ordinalnotinrange(256)如果我将convert_unicode=True选项添加到引擎，我可以让插入通过，但省略号不会显示，它只是奇怪的字符。这似乎是有道理的，因为据我所知，latin-1中没有水平省略号。即使我将编码设置为utf-8，

SQLAlchemy unicode code 39 description python mysql feedparser

python - Feedparser - 从谷歌阅读器中检索旧消息

我正在使用python中的feedparser库从本地报纸检索新闻(我的目的是对这个语料库进行自然语言处理)并且希望能够从RSS提要中检索许多过去的条目。我不是很熟悉RSS的技术问题，但我认为这应该是可能的(我可以看到，例如，当我移动滚动条时，GoogleReader和Feedly可以“按需”执行此操作).当我执行以下操作时:importfeedparserurl='http://feeds.folha.uol.com.br/folha/emcimadahora/rss091.xml'feed=feedparser.parse(url)forpostinfeed.entries:tit

阅读器 Feedparser section 条目 folha python rss google-reader

python - 从 python 中的 feedparser 解析不同的日期格式？

我正在尝试通过feedparser从两个不同的RSS提要中的条目获取日期.这是我正在做的:importfeedparserasfpreddit=fp.parse("http://www.reddit.com/.rss")cc=fp.parse("http://contentconsumer.com/feed")printreddit.entries[0].dateprintcc.entries[0].date结果如下:2008-10-21T22:23:28.033841+00:00Wed,15Oct200810:06:10+0000我想达到可以轻松找出哪个更新的地步。我已经尝试使用Py

python feedparser code section datetime parsing rss