Python : DataFrame介紹

什麼是DateFrame
DataFrame 是 Python 中一個功能強大的數據結構,可用於各種數據分析任務。

在 Python 中,Pandas 庫提供了一個名為 DataFrame 的數據結構,用於表示和操作表格數據。它是 Pandas 最常用的數據結構,類似於 Excel 電子表格或 SQL 表格。

以下是一些 DataFrame 的常見用途:
數據清理和準備: DataFrame 可用於清理和準備數據分析。例如,可以使用 DataFrame 來刪除缺失值、處理異常值和格式化數據。
探索性數據分析: DataFrame 可用於探索數據。例如,可以使用 DataFrame 來計算描述性統計量、可視化數據和識別模式。
數據建模: DataFrame 可用於構建數據模型。例如,可以使用 DataFrame 來訓練機器學習模型。

DataFrame 具有以下特點:
二維結構: DataFrame 是一種二維數據結構,由行和列組成。行代表數據的記錄,列代表數據的屬性。
異質性: DataFrame 中的列可以具有不同的數據類型,例如數字、字符串、布爾值等。
帶有標籤的軸: DataFrame 具有帶有標籤的軸,行稱為索引,列稱為列名。這些標籤可幫助您輕鬆訪問和操作數據。

DataFrame 的一些常見操作包括:
數據訪問: 可以使用索引和列名來訪問 DataFrame 中的數據。
數據篩選: 可以使用布爾條件來篩選 DataFrame 中的行和列。
數據聚合: 可以使用聚合函數(如求和、求平均值、求中位數等)來聚合 DataFrame 中的數據。
數據轉換: 可以使用轉換函數來轉換 DataFrame 中的數據類型。
數據合併: 可以使用合併函數來合併多個 DataFrame。

DataFrame 的應用:
金融
分析股票市場數據以識別趨勢和做出交易決策。
評估金融風險。
建立財務模型。

零售
分析客戶數據以了解購買行為和趨勢。
針對客戶進行營銷活動。
優化供應鏈。

醫療保健
分析患者數據以診斷疾病和預測結果。
開發新藥和治療方法。
跟踪公共衛生趨勢。

政府
分析人口數據以了解趨勢和做出政策決策。
跟踪經濟指標。
管理犯罪。

科學研究
分析實驗數據以得出結論。
建立科學模型。
可視化研究結果。

如何創建 DataFrame :
方式一 : 使用字典 dict

import pandas as pd

data = {
    "姓名": ["劉玄德", "關雲長", "張翼德"],
    "身高": [172, 180, 178],
    "武器": ["雙古劍", "青龍偃月刀", "丈八蛇茅"],
    "坐騎": ["的盧","赤兔馬","烏雲踏雪"],
}

df = pd.DataFrame(data)

print(df)

輸出:
姓名 身高 武器 坐騎 0 劉玄德 172 雙古劍 的盧 1 關雲長 180 青龍偃月刀 赤兔馬 2 張翼德 178 丈八蛇茅 烏雲踏雪

方式二 : 使用清單 list

import pandas as pd

data =[
    ["劉玄德", 172, "雙股劍","的驢"],
    ["關雲長", 180, "青龍偃月刀","赤兔馬"],
    ["張翼德", 178, "丈八蛇茅","烏雲踏雪"],
]

df = pd.DataFrame(data,columns=["姓名","身高","武器","坐騎"])

print(df)

輸出:
姓名 身高 武器 坐騎 0 劉玄德 172 雙股劍 的驢 1 關雲長 180 青龍偃月刀 赤兔馬 2 張翼德 178 丈八蛇茅 烏雲踏雪



沒有留言:

張貼留言