バージョン 0.5.0 (2011年10月24日)#
新機能#
標準の結合オプションを持つ
DataFrame.alignメソッドを追加read_csvおよびread_tableメソッドにparse_datesオプションを追加し、インデックス列の日付をオプションで解析できるようにしました。read_csvおよびread_tableにnrows,chunksize,iterator引数を追加。後者2つは、フラットファイルのチャンクを遅延的にイテレートできる新しいTextParserクラスを返します (GH 242)。重複値をより簡単に識別するためのプライベート関数
_get_duplicatesをIndexに追加しました (ENH5c)DataFrameへの列属性アクセスを追加しました。
DataFrameがコンソール出力でインデックスレベル名を表示するようになりました (GH 334)
Panel.takeを実装しました。別のDataFrame浮動小数点文字列書式設定のために
set_eng_float_formatを追加しました (ENH61)既存の列からDataFrameインデックスを作成するための便利な
set_index関数を追加しました。
パフォーマンスの向上#
VBENCH ファイル解析関数
read_csvとread_tableにおける主要なパフォーマンス改善VBENCH タプルを非常に高速にndarrayに変換するCython関数を追加しました。多くのMultiIndex関連操作を高速化します。
VBENCH マージ/結合コードをすっきりしたクラスにリファクタリングし、float/オブジェクトケースで不要な計算を無効にすることで、約10%のパフォーマンス向上を実現しました (GH 211)
VBENCH 0.3.0からの回帰 (GH 215) により、混在型のDataFrameオブジェクトにおける
DataFrame.xsの速度が約5倍向上しました。VBENCH 新しい
DataFrame.alignメソッドにより、異なるインデックスを持つDataFrameオブジェクト間の二項演算が10〜25%高速化されました。VBENCH 入れ子の辞書からDataFrameへの変換を大幅に高速化しました (GH 212)
VBENCH 大規模な混在型DataFrameオブジェクトにおけるDataFrameの
__repr__およびcountを大幅に高速化しました。
貢献者#
このリリースには合計9名がパッチを貢献しました。「+」が付いている方は、今回初めてパッチを貢献された方です。
Aman Thakral +
Luca Beltrame +
Nick Pentreath +
スキッパー・シーボールド
Thomas Kluyver +
Wes McKinney
Yaroslav Halchenko +
lodagro +
unknown +