pandasの「index」と「columns」

index,columnsアイキャッチ pandas

【宣伝】pandasのオススメの本の紹介

このブログでも詳しくpandasの使い方を紹介していますが、体系的に学びたい方や、本の方が良いという方には以下の本をオススメしておきます。

pandasライブラリ活用入門[第2版]

indexとcolumnsとは

pandasの「index」とは、下の画像のようにDataFrame(もしくはSeries)の左側に表示される行を特定するための連番のことです。(※ 連番ではなく文字列にすることもできます)

columns」とは、下の画像のようにDataFrameの上側に表示される列を特定するためのカラム名のことです。

indexとcolumnsは下のコードのようにデータフレームオブジェクト.indexデータフレームオブジェクト.columns で確認することができます。

df_score = pd.DataFrame({
    "name": ["kyosuke", "hikaru", "kyoko"],
    "score": [55, 68, 90]
})
print(df_score.index)
print(df_score.columns)

index、columnsを使って行・列を抽出する

解説用に下のサンプルDataFrameを使う。

df = pd.DataFrame({
    "student_id": [1, 2, 3, 4, 5, 6, 7, 8, 9, 10],
    "name": ["taro", "hanako", "jiro", "fuyumi", "sigeru", "satoshi", "misuzu", "taro", "saburo", "ichiro"],
    "math": [50, 68, 90, 35, 49, 77, 88, 91, 80, 100],
    "english": [10, 99, 55, 54, 30, 29, 67, 45, 46, 88]
})
df
サンプルDataFrame

DataFrameの行を抽出する

indexの値を使って行を抽出するにはloc属性を使う。

df.loc[2] # indexの値が2の行を抽出する

上の表のindexの値が2の行と見比べてみて欲しい。

ちなみに、このように抽出した行はSeriesとなる。これはtype関数を使って確認できる。

type(df.loc[2]) # 抽出した行の型を確認する

DataFrameの列を抽出する

columnsの値を使って列を抽出するのは簡単だ。次のように指定する。

df["name"] # []の中にカラム名を指定する

上の表のname列と見比べてみて欲しい。

ちなみに、このように抽出した列もSeriesとなる。type関数で確認できる。

type(df["name"]) # 抽出した列の型を確認する

Python入門【pandas編】

このブログでは「Python入門【pandas編】」の記事群を整備中です。興味のある方は下のリンク先をチェックしてみてください。

コメント

タイトルとURLをコピーしました