バージョン 0.4.1~0.4.3(2011年9月25日~10月9日)#

新機能#

  • 2to3 を使用して Python 3 のサポートを追加 (GH 200)

  • Seriesname 属性を追加。現在 Series.__repr__ の一部として表示されます

  • Series.isnull`() および Series.notnull() (GH 209, GH 203)

  • 結合方法を選択して 2 つの Series を整列する Series.align メソッドを追加 (ENH56)

  • MultiIndexget_level_values メソッドを追加 (GH 188)

  • .ix インデックス作成属性を介して、混合型の DataFrame オブジェクトに値を設定 (GH 135)

  • 新しい DataFrame メソッド get_dtype_counts とプロパティ dtypes を追加 (ENHdc)

  • DataFrame.appendignore_index オプションを追加して DataFrame をスタック (ENH1b)

  • read_csvcsv.Sniffer を使用して区切り文字を検出しようとします (GH 146)

  • read_csv は複数の列を MultiIndex読み込むことができます。DataFrame の to_csv メソッドは対応する MultiIndex を書き出します (GH 151)

  • DataFrame.rename に新しい copy パラメーターがあり、DataFrame をその場で名前変更できます (ENHed)

  • 名前によるアンスタックを有効化 (GH 142)

  • レベルごとに sortlevel が動作するように有効化 (GH 141)

パフォーマンスの向上#

  • 異なるインデックスを持つ SparseSeries オブジェクトに対する二項演算を、ブロック数が多い場合に高速な整数ベース (密な) の位置合わせロジックを使用するように変更 (GH 205)

  • より高速な Cython データアライメント/マージルーチンを作成し、大幅な速度向上を実現

  • isnullnotnull のパフォーマンスを改善。これは v0.3.0 からのデグレードでした (GH 187)

  • DataFrame.join に関連するコードをリファクタリングし、各 DataFrame 引数の中間的な整列済みデータコピーを作成する必要がなくなりました。これにより大幅なパフォーマンス向上を実現しました (GH 176)

  • 汎用的な Index.intersectionIndex.union のパフォーマンスを大幅に改善

  • BlockManager.take を実装し、混合型の DataFrame オブジェクトで take のパフォーマンスが大幅に向上しました (GH 104)

  • Series.sort_index のパフォーマンスを改善

  • groupby のパフォーマンスを大幅に向上:グループを取得するためのスライシング操作を遅くしていた DataFrame 内部の不要な整合性チェックを削除

  • _ensure_index 関数を最適化し、Index オブジェクトの型チェックにおけるパフォーマンスを改善

  • Cython で高速な時系列マージ/結合メソッドを作成。後で DataFrame.join および関連関数に統合される予定

貢献者#

このリリースには合計2名がパッチを貢献しました。「+」の記号が付いている方は、今回初めてパッチを貢献された方です。

  • トーマス・クライヴァー +

  • Wes McKinney