草庐IT

《花雕学AI》02:人工智能挺麻利,十分钟就为我写了一篇长长的故事

ChatGPT最近火爆全网,上线短短两个多月,活跃用户就过亿了,刷新了历史最火应用记录,网上几乎每天也都是ChatGPT各种消息。国内用户由于无法直接访问ChatGPT,所以大部分用户都无缘体验。不过呢,前段时间微软正式宣布必应搜索引擎(Bing)与OpenAI合作,并上线了采用ChatGPT技术的新版必应搜索引擎(NewBing),咱们可以通过这个渠道正规体验。不过,基于ChatGPT技术的新版必应搜索目前还没正式开放,但通过一定的技巧进行申请,大家就能体验了。上一期,通过一个实际案例,我们已经对新必应(NewBing)进行了初步的体验,具体见“《花雕学AI》01:尝试使用新必应制作《雕爷学

这个简单的小功能,半年为我们产研团队省下213个小时

大多数人对产研同学的认知都是每天做着高大上的活儿。我们以为的产研团队是:研发负责人:今年最新的技术架构是什么、我的团队适合吗?开发同学:010001,一顿代码猛如虎测试同学:OK,测试一次性全部通过!产品同学:新财年我们产品的发展方向是xxx,里程碑如下所示:12345实际的产研团队,除了那些我们以为的本职工作,还充斥着各种任务进度的跟进、同步和协调:研发负责人:今天团队的迭代开发进展怎样了?项目统计的数据怎么感觉不准啊!?开发同学:代码都写完了,又忘了更新状态,怎么总是忘记啊!?测试同学:这个需求冒烟又没过,又得打回去一遍、还要再通知开发?产品经理:业务方又来找我问需求进展了,需求怎么还是待

这个简单的小功能,半年为我们产研团队省下213个小时

大多数人对产研同学的认知都是每天做着高大上的活儿。我们以为的产研团队是:研发负责人:今年最新的技术架构是什么、我的团队适合吗?开发同学:010001,一顿代码猛如虎测试同学:OK,测试一次性全部通过!产品同学:新财年我们产品的发展方向是xxx,里程碑如下所示:12345实际的产研团队,除了那些我们以为的本职工作,还充斥着各种任务进度的跟进、同步和协调:研发负责人:今天团队的迭代开发进展怎样了?项目统计的数据怎么感觉不准啊!?开发同学:代码都写完了,又忘了更新状态,怎么总是忘记啊!?测试同学:这个需求冒烟又没过,又得打回去一遍、还要再通知开发?产品经理:业务方又来找我问需求进展了,需求怎么还是待

Python — 解析文件(docx、pdf 和 odt)并将内容转换为我的数据模型

Python--Parsingfiles(docx,pdfandodt)andconvertingthecontentintomydatamodel我正在编写一个导入/导出工具,用于导入docx、pdf和odt文件;其中写了一本书。我们已经有了一个用于.epub格式的工具,并且我们希望在此基础上扩展功能,以便该网站的用户可以拥有更大的灵活性。到目前为止,我查看了PDFMiner,还发现docx只是基于openxml格式,所以word/document.xml本质上是包含整个内容的文件,我可以用lxml解析它。我的问题是:我希望解析这些文件的内容,并从该内容中提取章节名称、图像(如果有)和章节文

Python — 解析文件(docx、pdf 和 odt)并将内容转换为我的数据模型

Python--Parsingfiles(docx,pdfandodt)andconvertingthecontentintomydatamodel我正在编写一个导入/导出工具,用于导入docx、pdf和odt文件;其中写了一本书。我们已经有了一个用于.epub格式的工具,并且我们希望在此基础上扩展功能,以便该网站的用户可以拥有更大的灵活性。到目前为止,我查看了PDFMiner,还发现docx只是基于openxml格式,所以word/document.xml本质上是包含整个内容的文件,我可以用lxml解析它。我的问题是:我希望解析这些文件的内容,并从该内容中提取章节名称、图像(如果有)和章节文