ユーザーガイド#
ユーザーガイドは、トピック領域ごとにすべての pandas をカバーしています。各サブセクションでは、トピック(「欠損値の処理」など)を紹介し、pandas がその問題にどのようにアプローチするかを、多くの例を交えて説明します。
pandas を初めて使用するユーザーは、10分でpandasから始める必要があります。
pandas の基礎の概要については、データ構造入門および基本的な必須機能を参照してください。
特定のメソッドに関する詳細情報は、APIリファレンスで入手できます。
これらのガイドの読み方#
これらのガイドでは、以下のようなコードブロック内の入力コードが表示されます。
import pandas as pd
pd.DataFrame({'A': [1, 2, 3]})
または
In [1]: import pandas as pd
In [2]: pd.DataFrame({'A': [1, 2, 3]})
Out[2]:
A
0 1
1 2
2 3
最初のブロックは標準的な Python 入力ですが、2番目のブロックの In [1]: は、入力がノートブック内にあることを示します。Jupyter Notebook では、最後の行が出力され、プロットがインラインで表示されます。
例えば
In [3]: a = 1
In [4]: a
Out[4]: 1
は次のものと同等です。
a = 1
print(a)
ガイド#
- pandasを10分でマスターする
- データ構造入門
- 必須の基本機能
- IOツール (テキスト、CSV、HDF5など)
- PyArrow機能
- データのインデックス作成と選択
- MultiIndex / 高度なインデックス作成
- コピーオンライト (CoW)
- マージ、結合、連結、比較
- データの再形成とピボットテーブル
- テキストデータの操作
- 欠損データの操作
- 重複するラベル
- カテゴリデータ
- Nullable整数データ型
- Nullable Booleanデータ型
- グラフの視覚化
- 表の視覚化
- グループ化: 分割-適用-結合
- ウィンドウ操作
- 時系列 / 日付機能
- 時間差
- オプションと設定
- パフォーマンスの向上
- 大規模データセットへのスケーリング
- 疎なデータ構造
- よくある質問 (FAQ)
- クックブック