統計といえばRですが、ここではあえてPythonを使った統計テクニックを載せていこうと思います。Rは統計処理に特化した強力な言語ですが、統計処理に特化しているがゆえに、ほかの処理との組み合わせやアプリへの組み込みが難しくなってしまう側面があります。統計処理にPythonを用いることで、AI処理との親和性やOpenCVによる画像解析との統合が容易であり、自作アプリへの組み込みも可能になります。
データの取得
学習用データセット
オープンデータ
データの取り扱い
Series
DataFrame
- DataFrameの作成
- DataFrameの行・列の追加
- DataFrameの成分へのアクセス
- DataFrameの行数・列数を取得する
- DataFrameのデータ要約(記述統計量の取得)
- DataFrameにマルチインデックスを設定する
- マルチインデックスが設定されたDataFrameの統計量の取得
- DataFrame / Series からリストに変換する
- DataFrameから条件を指定してデータを抽出する方法(ブールインデックス参照)
- DataFrameから条件を指定してデータを抽出する方法(queryメソッド)
- DataFrameの結合
- DataFrameを1行ずつ処理する(forループ)
- DataFrameにメタデータを加える