處理pdf文檔
第一、
從文本中提取文本

第二、
創(chuàng)建PDF
兩種方法

#使用PdfFileWriterimport PyPDF2 pdfFiles = []for filename in os.listdir('.'):if filename.endswith('.pdf'):pdfFiles.append(filename)print(pdfFiles)pdfWriter = PyPDF2.PdfFileWriter() pdfFileObj = open(pdfFiles[0],'rb')pdfReader = PyPDF2.PdfFileReader(pdfFileObj) # 得到PdfFileReader對(duì)象first,end =map(int,input('從多少頁(yè)到多少頁(yè)(用空格隔開):').split())for pageNum in range(first-1,end):pageObj = pdfReader.getPage(pageNum)pdfWriter.addPage(pageObj)pdfOutput = open ('split_pdf.pdf','wb')pdfWriter.write(pdfOutput)pdfOutput.close()
#使用PdfFileMerger()import PyPDF2merger = PyPDF2.PdfFileMerger()a = [str(i)+'webbook.pdf'for i in range(0,124)]for i in a:print(i)merger.append(open(i,'rb'))print("合并完成第"+str(i))with open('combintion.pdf','wb') as f:merger.write(f)總結(jié)
以上就是本文關(guān)于淺談Python處理PDF的全部?jī)?nèi)容,希望對(duì)大家有所幫助。感興趣的朋友可以繼續(xù)參閱本站:python先序遍歷二叉樹問(wèn)題、python實(shí)現(xiàn)人臉識(shí)別代碼、python執(zhí)行使用shell命令方法分享等,有什么問(wèn)題可以隨時(shí)留言,小編會(huì)及時(shí)回復(fù)大家的。感謝朋友們對(duì)本站的支持!
新聞熱點(diǎn)
疑難解答
圖片精選