docx模塊簡要介紹
Python/ target=_blank class=infotextkey>Python-docx包,可以用來創建docx文檔
包含段落、分頁符、表格、圖片、標題、樣式等幾乎所有的word文檔中能常用的功能。
但只對windows系統電腦的docx后綴文檔有效
Python-docx的安裝非常簡單,如下圖所示
pip install python-docx就可以安裝python-docx了
添加標題
用add_heading()方法
添加正文
用add_paragraph()方法
from docx import Document
#創建一個Document對象
document = Document()
#標題
document.add_heading('中學生必讀書籍')
#加上段落(正文)
document.add_paragraph('《石頭記》')
document.add_paragraph('《鋼鐵是怎樣煉成的》')
document.save(r"D:doctest.docx")#
生成文檔截圖
生成文檔截圖
add_run()方法可以在目前段落后添加內容的同時還可以設置字體的樣式
第12~15行添加個空段落,賦值為p,然后在此空段落后面添加粗體字和斜體字
生成文檔截圖
添加圖片
用到add_picture()方法
默認插入是圖片原大小,若果要調整大小,則需要在參數上寫上長寬大小
document.add_picture(r"D:dochusky.png", width=Inches(1.0), height=Inches(1.0))
下方代碼,我插入了一只哈士奇圖片
生成文檔截圖
添加分頁符
用到add_page_break()方法
并在新頁面添加了新的正文
可見,添加分頁符后,文檔有兩頁紙了
利用python查詢文件編碼
在處理一些csv和Excel格式文件
在讀取中文的情況下,通常會遇到一些編碼的問題
傳統方法都是嘗試用utf-8和gbk打開
然后都打不開(如以下兩圖)
上網翻閱了資料,見到推薦說多嘗試其他文字編碼
比如說GB2312編碼、GB18030編碼,但都不可以打開
我當時就想,與其猜燈謎般嘗試這么多編碼,不如看看有沒有方法直接知道這個文件是什么編碼
在搜索引擎的結果中,推薦了chardet庫來查看編碼方式的。
把文件解釋成二進制,再調用chardet模塊的detect方法讀取這個文件數據就知道這個文件是用什么編碼了。
可以看到,這個文件是用utf-16編碼格式的
用utf-16編碼,就能打開這個csv文件了
會持續更新,敬請期待,要源碼的可以私我