国产一区二区精品-国产一区二区精品久-国产一区二区精品久久-国产一区二区精品久久91-免费毛片播放-免费毛片基地

千鋒教育-做有情懷、有良心、有品質的職業教育機構

手機站

千鋒學習站 | 隨時隨地免費學

掃一掃進入千鋒手機站

領取全套視頻

關注千鋒學習站小程序
隨時隨地免費學習課程

當前位置：首頁 > 技術干貨 > pythonpandas的5種使用技巧

pythonpandas的5種使用技巧

來源：千鋒教育

發布人：xqq

時間： 2023-11-05 18:14:37 1699179277

Python正迅速成為數據科學家們更為鐘愛的編程語言。形成該現狀的理由非常充分：Python提供了一種覆蓋范圍更為廣闊的編程語言生態系統，以及具有一定計算深度且性能良好的科學計算庫。

在Python自帶的科學計算庫中，Pandas模塊是最適于數據科學相關操作的工具。本文著重介紹了Python中數據處理的5種方法。

首先導入相關模塊并加載數據集到Python環境中：

importpandasaspd

importnumpyasnp

data=pd.read_csv("***.csv",index_col="Loan_ID")

1、Apply函數

Apply函數是處理數據和建立新變量的常用函數之一。在向數據框的每一行或每一列傳遞指定函數后，Apply函數會返回相應的值。這個由Apply傳入的函數可以是系統默認的或者用戶自

defnum_missing(x):

returnsum(x.isnull())

#Applyingpercolumn:

print"Missingvaluespercolumn:"

printdata.apply(num_missing,axis=0)

2、填補缺失值

fillna()函數可一次性完成填補功能。它可以利用所在列的均值/眾數/中位數來替換該列的缺失數據。下面利用“Gender”、“Married”、和“Self_Employed”列中各自的眾數值填補對應列的缺失數據。

fromscipy.statsimportmode

mode(data['Gender'])

3、數據透視表

Pandas可建立MSExcel類型的數據透視表。例如在下文的代碼段里，關鍵列“LoanAmount”存在缺失值。我們可以根據“Gender”，“Married”和“Self_Employed”分組后的平均金額來替換。“LoanAmount”的各組均值可由如下方法確定

4、復合索引

如果您注意觀察#3計算的輸出內容，會發現它有一個奇怪的性質。即每個索引均由三個數值的組合構成，稱為復合索引。它有助于運算操作的快速進行。

從#3的例子繼續開始，已知每個分組數據值但還未進行數據填補。具體的填補方式可結合此前學到的多個技巧來完成。

fori,rowindata.loc[data['LoanAmount'].isnull(),:].iterrows():

ind=tuple([row['Gender'],row['Married'],row['Self_Employed']])

data.loc[i,'LoanAmount']=impute_grps.loc[ind].values[0]

#Nowcheckthe#missingvaluesagaintoconfirm:

printdata.apply(num_missing,axis=0)

5、Crosstab函數

該函數用于獲取數據的初始印象(直觀視圖)，從而驗證一些基本假設。例如在本例中，“Credit_History”被認為會顯著影響貸款狀態。這個假設可以通過如下代碼生成的交叉表進行驗證：

pd.crosstab(data["Credit_History"],data["Loan_Status"],margins=True)

tags: python培訓

聲明：本站稿件版權均屬千鋒教育所有，未經許可不得擅自轉載。

10年以上業內強師集結，手把手帶你蛻變精英

請您保持通訊暢通，專屬學習老師24小時內將與您1V1溝通

免費領取

今日已有369人領取成功

劉同學 138****2860 剛剛成功領取

王同學 131****2015 剛剛成功領取

張同學 133****4652 剛剛成功領取

李同學 135****8607 剛剛成功領取

楊同學 132****5667 剛剛成功領取

岳同學 134****6652 剛剛成功領取

梁同學 157****2950 剛剛成功領取

劉同學 189****1015 剛剛成功領取

張同學 155****4678 剛剛成功領取

鄒同學 139****2907 剛剛成功領取

董同學 138****2867 剛剛成功領取

周同學 136****3602 剛剛成功領取

python自動化運維常用庫

python字符串連接的5種方法

免費打包獲取

相關推薦HOT

pythonpandas是干什么用的？

Python中pandas是什么?Pandas是基于numpy的一種工具，該工具是為了解決數據分析任務而創建的。Pandas納入了大量的庫和一些標準的數據模型，提供...詳情>>

2023-11-05 20:45:49

VB.NET和Python有什么區別？

我想大家都知道VB.NET和Python都是編程語言，都是面向對象的編程語言，那么VB.NET和Python有什么區別呢?請看下文。其實Python不用過多介紹，大...詳情>>

2023-11-05 20:24:13

Python自動化辦公有哪些值得使用的庫？

眾所周知，Python的使用場景非常廣泛，無論是生活還是工作，都可以使用Python來幫助我們。Python主要可以用在爬蟲、后端開發、人工智能、機器學...詳情>>

2023-11-05 20:06:13

Python爬蟲框架有哪些？

Python被稱為爬蟲首選語言的主要原因是Python擁有眾多的爬蟲框架，不僅功能齊全，優勢眾多，還能幫助程序員用更少的代碼實現更多的功能，讓工作...詳情>>

2023-11-05 19:55:25

Python有哪些方法可以實現拼接字符串的功能？

Python作為一門新型的編程語言，其熱度也是不亞于Java的，它也是面向對象類型的，在Python也有很多數據類型，如字符串、列表、數組等，今天我們...詳情>>

2023-11-05 19:37:25