-
當前位置:首頁 > 創(chuàng)意學院 > 營銷推廣 > 專題列表 > 正文
python在pdf中添加圖片(python pdf添加圖片)
大家好!今天讓創(chuàng)意嶺的小編來大家介紹下關(guān)于python在pdf中添加圖片的問題,以下是小編對此問題的歸納整理,讓我們一起來看看吧。
開始之前先推薦一個非常厲害的Ai人工智能工具,一鍵生成原創(chuàng)文章、方案、文案、工作計劃、工作報告、論文、代碼、作文、做題和對話答疑等等
只需要輸入關(guān)鍵詞,就能返回你想要的內(nèi)容,有小程序、在線網(wǎng)頁版、PC客戶端和批量生成器
問友Ai官網(wǎng):https://ai.de1919.com。
本文目錄:
Python基礎(chǔ)教程
2020年最新Python零基礎(chǔ)教程(高清視頻)百度網(wǎng)盤
鏈接: https://pan.baidu.com/s/1GT5kyMphtS6d-6KGivTTqA
若資源有問題歡迎追問~
有沒有好一點的讀取pdf的python包
最近在做一些數(shù)據(jù)分析的任務,很多都是pdf文件,試過pdfminer,pypdf2。pdfminer可以較好地讀出里面的文字內(nèi)容,但是一旦碰到類似于表格的排版,就會分塊按列來讀,導致解析出來的結(jié)果排班很亂。比如下面圖片中的內(nèi)容
解析出來是:
教育背景
2011.09-2015.06
重慶大學
工作經(jīng)歷
軟件工程
而我預期的是:
教育背景
2011.09-2015.06 重慶大學 軟件工程
工作經(jīng)歷
pypdf2效果更一般,很多中文字和符號都不能識別。Textract,Tika我也試過,都不行。請問大家有沒有更好的python PDF包呢?或者是我的處理方式不對?我的代碼如下:
from pdfminer.pdfinterp import PDFResourceManager, process_pdf
from pdfminer.converter import TextConverter
from pdfminer.layout import LAParams
from io import StringIO
from io import open
from subprocess import call
def readPDF(pdfFile):
rsrcmgr = PDFResourceManager()
retstr = StringIO()
laparams = LAParams()
device = TextConverter(rsrcmgr, retstr, laparams=laparams)
process_pdf(rsrcmgr, device, pdfFile, check_extractable=True)
device.close()
content = retstr.getvalue()
retstr.close()
return content
你可以試一下在線pdf裝換試試效果
效果好的話用再 selenium 來處理
在用其他包轉(zhuǎn)你需要的
我覺得你的那個包不好用是不是因為沒有那種字體?。?span style="display:none">vwr創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司
如何用python把pdf轉(zhuǎn)為cad?
1.準備一款專業(yè)的CAD轉(zhuǎn)換器,如果你的電腦里有可以直接打開。2.打開運行軟件,在軟件界面的左側(cè)我們找到“PDF轉(zhuǎn)CAD”功能。
3.選擇好了轉(zhuǎn)換類型,接下來就是添加文件,添加文件有兩個方法,一個是點擊界面中的“添加文件”,一個是直接把你的文件拖到軟件的指定區(qū)域;
4.文件添加好后,要是需要自定義選擇轉(zhuǎn)換后文件儲存的位置選擇“瀏覽”按鈕,選擇好儲存位置便可。
5.轉(zhuǎn)換界面可以進行轉(zhuǎn)換后文件格式的選擇,有“DWG、DXF”兩種格式進行選擇,可以根據(jù)自己的需求選擇輸出格式。
6.擊“批量轉(zhuǎn)換”按鈕開始文件的轉(zhuǎn)換,當所有的文件轉(zhuǎn)換狀態(tài)為百分百的時候就說明文件轉(zhuǎn)換完成了。
如何利用Python抓取PDF中的某些內(nèi)容
可以轉(zhuǎn)換成TXT再抓取
from?cStringIO?import?StringIO
from?pdfminer.pdfinterp?
import?PDFResourceManager,?PDFPageInterpreter
from?pdfminer.converter?import?TextConverter
from?pdfminer.layout?import?LAParamsfrom?pdfminer.pdfpage?
import?PDFPage
def?convert_pdf_2_text(path):
????rsrcmgr?=?PDFResourceManager()
????retstr?=?StringIO()
????device?=?TextConverter(rsrcmgr,?retstr,?codec='utf-8',?laparams=LAParams())
????interpreter?=?PDFPageInterpreter(rsrcmgr,?device)
????with?open(path,?'rb')?as?fp:
????????for?page?in?PDFPage.get_pages(fp,?set()):
????????????interpreter.process_page(page)
????????text?=?retstr.getvalue()
????device.close()
????retstr.close()
????return?text
以上就是關(guān)于python在pdf中添加圖片相關(guān)問題的回答。希望能幫到你,如有更多相關(guān)問題,您也可以聯(lián)系我們的客服進行咨詢,客服也會為您講解更多精彩的知識和內(nèi)容。
推薦閱讀:
python培訓班哪個靠譜(編程培訓機構(gòu)排名前十)
happy day特殊字體復制(happyday特殊字體復制)
杭州出名的男網(wǎng)紅(杭州出名的男網(wǎng)紅是誰)