最近想學(xué)習(xí)一些python數(shù)據(jù)分析的內(nèi)容,就弄了個(gè)爬蟲(chóng)爬取了一些數(shù)據(jù),并打算用Anaconda一套的工具(pandas, numpy, scipy, matplotlib, jupyter)等進(jìn)行一些初步的數(shù)據(jù)挖掘和分析。
在使用matplotlib畫(huà)圖時(shí),橫坐標(biāo)為中文,但是畫(huà)出的條形圖橫坐標(biāo)總是顯示“框框”,就去查資料解決。感覺(jué)這應(yīng)該是個(gè)比較常見(jiàn)的問(wèn)題,網(wǎng)上的中文資料也確實(shí)很多,但是沒(méi)有任何一個(gè)徹底解決了我遇到的問(wèn)題。零零碎碎用了快3個(gè)小時(shí)的時(shí)間,才終于搞定。特此分享,希望能幫到有同樣問(wèn)題的童鞋。
運(yùn)行環(huán)境:
python2.7
Linux Centos7
用conda安裝的matplotlib和pandas
問(wèn)題:
matplotlib畫(huà)圖,無(wú)法顯示中文
問(wèn)題原因:
linux操作系統(tǒng)以及matplotlib的字體庫(kù)中,沒(méi)有可用的中文字體
matplotlib包默認(rèn)只支持ASCII碼,不支持unicode碼
網(wǎng)上資料總結(jié):
修改matplotlib的資源配置文件,例如增加"Simhei"字體(這個(gè)字體并不是所有的linux系統(tǒng)都有的好嘛!修改了并沒(méi)有作用)
給linux安裝中文字體,并修改matplotlib的資源配置文件。(呵呵,并沒(méi)有作用)
解決方案:
其實(shí)也是綜合了網(wǎng)上的各種解決方案。總體說(shuō)來(lái)有以下幾個(gè)步驟:
1. 獲取matplotlibrc文件所在路徑。在jupyter notebook中獲取:
import matplotlibmatplotlib.matplotlib_fname()
例如,我的這個(gè)文件在:
u'~/miniconda2/lib/python2.7/site-packages/matplotlib/mpl-data/matplotlibrc'
后續(xù)步驟會(huì)修改此文件中的font參數(shù)。
2. 看看系統(tǒng)中的所有字體,以及可用的中文字體。也是在jupyter nb中:
from matplotlib.font_manager import FontManagerimport subprocessfm = FontManager()mat_fonts = set(f.name for f in fm.ttflist)print mat_fontsoutput = subprocess.check_output( 'fc-list :lang=zh -f "%{family}/n"', shell=True)print '*' * 10, '系統(tǒng)可用的中文字體', '*' * 10print outputzh_fonts = set(f.split(',', 1)[0] for f in output.split('/n'))available = mat_fonts & zh_fontsprint '*' * 10, '可用的字體', '*' * 10for f in available: print f做完上述操作,會(huì)發(fā)現(xiàn)“可用的字體”這里為空。因?yàn)闆](méi)有中文字體給matplotlib用(所以才會(huì)中文都顯示“框框”)
3. 假設(shè)操作系統(tǒng)中沒(méi)有中文字體。此時(shí)下載一個(gè)ttf中文字體,并在cenos中安裝。要安裝那種系統(tǒng)能檢測(cè)font-family的,否則無(wú)效。
解壓rar文件。在 /usr/share/fonts 路徑下創(chuàng)建存放此字體的文件夾yourfontdir,并下載的ttf文件復(fù)制到y(tǒng)ourfontdir中(可以給文件改個(gè)英文名,方便操作)
4. 給cenos安裝這個(gè)字體。
cd /usr/share/fonts/yourfontsdir#生成字體索引信息. 會(huì)顯示字體的font-familysudo mkfontscalesudo mkfontdir#更新字體緩存:fc-cache
新聞熱點(diǎn)
疑難解答
圖片精選
網(wǎng)友關(guān)注