バージョン 0.5.0 (2011年10月24日)#

新機能#

  • 標準の結合オプションを持つ DataFrame.align メソッドを追加

  • read_csv および read_table メソッドに parse_dates オプションを追加し、インデックス列の日付をオプションで解析できるようにしました。

  • read_csv および read_tablenrows, chunksize, iterator 引数を追加。後者2つは、フラットファイルのチャンクを遅延的にイテレートできる新しい TextParser クラスを返します (GH 242)。

  • DataFrame.join で複数の列を結合する機能を追加 (GH 214)

  • 重複値をより簡単に識別するためのプライベート関数 _get_duplicatesIndex に追加しました (ENH5c)

  • DataFrameへの列属性アクセスを追加しました

  • DataFrame列のPythonタブ補完フックを追加しました。 (GH 233, GH 230)

  • オブジェクトを含むSeriesに対する Series.describe実装しました (GH 241)

  • キーで結合する際に、DataFrame.join に内部結合オプションを追加しました (GH 248)

  • __getitem__ にリストを渡すことでDataFrameの列を選択する機能を実装しました (GH 253)

  • Indexオブジェクトをそれぞれ交差/結合するための & と | を実装しました (GH 261)

  • pandas名前空間に pivot_table ユーティリティ関数を追加しました (GH 234)

  • Panel.rename_axis 関数を実装しました (GH 243)

  • DataFrameがコンソール出力でインデックスレベル名を表示するようになりました (GH 334)

  • Panel.take実装しました

  • 別のDataFrame浮動小数点文字列書式設定のために set_eng_float_format追加しました (ENH61)

  • 既存の列からDataFrameインデックスを作成するための便利な set_index 関数を追加しました

  • groupby 階層インデックスレベル名を実装しました (GH 223)

  • DataFrame.to_csv で異なる区切り文字のサポートを追加しました (GH 244)

パフォーマンスの向上#

  • VBENCH ファイル解析関数 read_csvread_table における主要なパフォーマンス改善

  • VBENCH タプルを非常に高速にndarrayに変換するCython関数を追加しました。多くのMultiIndex関連操作を高速化します。

  • VBENCH マージ/結合コードをすっきりしたクラスにリファクタリングし、float/オブジェクトケースで不要な計算を無効にすることで、約10%のパフォーマンス向上を実現しました (GH 211)

  • VBENCH 0.3.0からの回帰 (GH 215) により、混在型のDataFrameオブジェクトにおける DataFrame.xs の速度が約5倍向上しました。

  • VBENCH 新しい DataFrame.align メソッドにより、異なるインデックスを持つDataFrameオブジェクト間の二項演算が10〜25%高速化されました。

  • VBENCH 入れ子の辞書からDataFrameへの変換を大幅に高速化しました (GH 212)

  • VBENCH 大規模な混在型DataFrameオブジェクトにおけるDataFrameの __repr__ および count を大幅に高速化しました。

貢献者#

このリリースには合計9名がパッチを貢献しました。「+」が付いている方は、今回初めてパッチを貢献された方です。

  • Aman Thakral +

  • Luca Beltrame +

  • Nick Pentreath +

  • スキッパー・シーボールド

  • Thomas Kluyver +

  • Wes McKinney

  • Yaroslav Halchenko +

  • lodagro +

  • unknown +