草庐IT

20230507

全部标签

20230507使用python3批量转换DOCX文档为TXT

20230507使用python3批量转换DOCX文档为TXT2023/5/720:22WIN10使用python3.11#–coding:gbk–importosfrompdf2docximportConverterfromwin32comimportclientaswc"""这里需要安转包pywin32com"""#读取pdf文件文本内容defDocxToTxt(inputFinallyPath,outputFinallyPath):  wordhandle=wc.Dispatch("Word.Application")  wordhandle.Visible=0 #后台运行,不显示  w