バージョン 0.5.0 (2011年10月24日)#

新機能#

標準の結合オプションを持つ DataFrame.align メソッドを追加
read_csv および read_table メソッドに parse_dates オプションを追加し、インデックス列の日付をオプションで解析できるようにしました。
read_csv および read_table に nrows, chunksize, iterator 引数を追加。後者2つは、フラットファイルのチャンクを遅延的にイテレートできる新しい TextParser クラスを返します (GH 242)。
DataFrame.join で複数の列を結合する機能を追加 (GH 214)
重複値をより簡単に識別するためのプライベート関数 _get_duplicates を Index に追加しました (ENH5c)
DataFrameへの列属性アクセスを追加しました。
DataFrame列のPythonタブ補完フックを追加しました。 (GH 233, GH 230)
オブジェクトを含むSeriesに対する Series.describe を実装しました (GH 241)
キーで結合する際に、DataFrame.join に内部結合オプションを追加しました (GH 248)
__getitem__ にリストを渡すことでDataFrameの列を選択する機能を実装しました (GH 253)
Indexオブジェクトをそれぞれ交差/結合するための & と | を実装しました (GH 261)
pandas名前空間に pivot_table ユーティリティ関数を追加しました (GH 234)
Panel.rename_axis 関数を実装しました (GH 243)
DataFrameがコンソール出力でインデックスレベル名を表示するようになりました (GH 334)
Panel.take を実装しました。
別のDataFrame浮動小数点文字列書式設定のために set_eng_float_format を追加しました (ENH61)
既存の列からDataFrameインデックスを作成するための便利な set_index 関数を追加しました。
groupby 階層インデックスレベル名を実装しました (GH 223)
DataFrame.to_csv で異なる区切り文字のサポートを追加しました (GH 244)

パフォーマンスの向上#

VBENCH ファイル解析関数 read_csv と read_table における主要なパフォーマンス改善
VBENCH タプルを非常に高速にndarrayに変換するCython関数を追加しました。多くのMultiIndex関連操作を高速化します。
VBENCH マージ/結合コードをすっきりしたクラスにリファクタリングし、float/オブジェクトケースで不要な計算を無効にすることで、約10%のパフォーマンス向上を実現しました (GH 211)
VBENCH 0.3.0からの回帰 (GH 215) により、混在型のDataFrameオブジェクトにおける DataFrame.xs の速度が約5倍向上しました。
VBENCH 新しい DataFrame.align メソッドにより、異なるインデックスを持つDataFrameオブジェクト間の二項演算が10〜25%高速化されました。
VBENCH 入れ子の辞書からDataFrameへの変換を大幅に高速化しました (GH 212)
VBENCH 大規模な混在型DataFrameオブジェクトにおけるDataFrameの __repr__ および count を大幅に高速化しました。

貢献者#

このリリースには合計9名がパッチを貢献しました。「+」が付いている方は、今回初めてパッチを貢献された方です。

Aman Thakral +
Luca Beltrame +
Nick Pentreath +
スキッパー・シーボールド
Thomas Kluyver +
Wes McKinney
Yaroslav Halchenko +
lodagro +
unknown +