scikit-learn庫是什么?Python的開源社區(qū)非常活躍,也有很多和Java等開源語言一樣的框架或庫體系,其中Scikit-learn(簡寫成sklearn)是最著名的Python機器學習庫之一。官方網(wǎng)址為http://scikit-learn.org/stable/。
sklearn基于BSD開源許可證,最早由David Cournapeau在2007年發(fā)起,目前也是由社區(qū)自愿者進行維護,經(jīng)年累月,整個項目的內(nèi)容已經(jīng)相當豐富了,目前最新的穩(wěn)定版是0.17版本。
用戶手冊內(nèi)容也很友好,覆蓋面很全,包括有監(jiān)督的學習(分類)、無監(jiān)督的學習(聚類)、模型選擇與評價、數(shù)據(jù)集轉(zhuǎn)換、數(shù)據(jù)集提取應(yīng)用(數(shù)據(jù)示例下載)、大規(guī)模計算策略、計算效率七大部分。
機器學習算法大多使用sklearn庫完成,主要涉及Supervised learning和Unsupervised learning兩個部分,相信它也能幫助讀者在生產(chǎn)生活中很大程度地提高生產(chǎn)效率。
在安裝sklearn之前請確認Python已經(jīng)安裝。安裝Python的方法見附錄C。
如果發(fā)現(xiàn)Python軟件未被正確安裝,可以使用CentOS系統(tǒng)自帶的包管理工具“yum”進行安裝。安裝方法如下:
然后安裝sklearn。sklearn的安裝很簡單,只要能夠連接上互聯(lián)網(wǎng),直接使用pip安裝即可: