バージョン 0.4.1~0.4.3(2011年9月25日~10月9日)#
新機能#
2to3 を使用して Python 3 のサポートを追加 (GH 200)
Series に
name属性を追加。現在Series.__repr__の一部として表示されますSeries.isnull`()およびSeries.notnull()(GH 209, GH 203).ixインデックス作成属性を介して、混合型のDataFrameオブジェクトに値を設定 (GH 135)新しい
DataFrameメソッドget_dtype_countsとプロパティdtypesを追加 (ENHdc)DataFrame.appendに ignore_index オプションを追加して DataFrame をスタック (ENH1b)read_csvは複数の列をMultiIndexに読み込むことができます。DataFrame のto_csvメソッドは対応するMultiIndexを書き出します (GH 151)DataFrame.renameに新しいcopyパラメーターがあり、DataFrame をその場で名前変更できます (ENHed)
パフォーマンスの向上#
異なるインデックスを持つ SparseSeries オブジェクトに対する二項演算を、ブロック数が多い場合に高速な整数ベース (密な) の位置合わせロジックを使用するように変更 (GH 205)
より高速な Cython データアライメント/マージルーチンを作成し、大幅な速度向上を実現
isnullとnotnullのパフォーマンスを改善。これは v0.3.0 からのデグレードでした (GH 187)DataFrame.joinに関連するコードをリファクタリングし、各DataFrame引数の中間的な整列済みデータコピーを作成する必要がなくなりました。これにより大幅なパフォーマンス向上を実現しました (GH 176)汎用的な
Index.intersectionとIndex.unionのパフォーマンスを大幅に改善BlockManager.takeを実装し、混合型のDataFrameオブジェクトでtakeのパフォーマンスが大幅に向上しました (GH 104)Series.sort_indexのパフォーマンスを改善groupby のパフォーマンスを大幅に向上:グループを取得するためのスライシング操作を遅くしていた DataFrame 内部の不要な整合性チェックを削除
_ensure_index関数を最適化し、Index オブジェクトの型チェックにおけるパフォーマンスを改善Cython で高速な時系列マージ/結合メソッドを作成。後で DataFrame.join および関連関数に統合される予定
貢献者#
このリリースには合計2名がパッチを貢献しました。「+」の記号が付いている方は、今回初めてパッチを貢献された方です。
トーマス・クライヴァー +
Wes McKinney