バージョン 0.20.2 (2017年6月4日)#

これは0.20.xシリーズのマイナーなバグ修正リリースで、いくつかの小さなリグレッション修正、バグ修正、パフォーマンス改善が含まれています。すべてのユーザーにこのバージョンへのアップグレードをお勧めします。

機能強化#

PyTablesでサポートされている追加の圧縮タイプへのアクセスを解除しました: 'blosc:blosclz', 'blosc:lz4', 'blosc:lz4hc', 'blosc:snappy', 'blosc:zlib', 'blosc:zstd' (GH 14478)
Series が to_latex メソッドを提供します (GH 16180)
既存の GroupBy.cumcount() に並行して、グループ順序を返す新しいgroupbyメソッド GroupBy.ngroup() が追加されました (GH 11642); 詳細はこちらを参照してください。

パフォーマンス改善#

リストライクなものでインデックス付けする際のパフォーマンスリグレッションを修正しました (GH 16285)
MultiIndexのパフォーマンスリグレッションを修正しました (GH 16319, GH 16346)
スカラー引数を使用した .clip() のパフォーマンスを改善しました (GH 15400)
カテゴリカルグルーパーを使用したgroupbyのパフォーマンスを改善しました (GH 16413)
MultiIndex.remove_unused_levels() のパフォーマンスを改善しました (GH 16556)

バグ修正#

一部のWindows環境で、端末サイズの検出時に「tput: terminal attributes: No such device or address」という警告が表示されるのを抑制しました。この修正はPython 3のみに適用されます (GH 16496)
IO関数で pathlib.Path または py.path.local オブジェクトを使用する際のバグ (GH 16291)
2つの等しいMultiIndexに対する Index.symmetric_difference() で TypeError が発生するバグ (GH 13490)
overwrite=False と NaN values を指定した DataFrame.update() のバグ (GH 15593)
read_csv() に無効なエンジンを渡すと、UnboundLocalError ではなく、情報を示す ValueError が発生するようになりました。(GH 16511)
タプルの配列に対する unique() のバグ (GH 16519)
labels が設定されている場合に cut() でラベルの順序が不正になるバグ (GH 16459)
IPython 6.0のタブ補完が Categoricals で非推奨の警告を表示する互換性の問題を修正しました (GH 16409)

変換#

空のデータ入力がインタプリタのセグメンテーション違反を引き起こす to_numeric() のバグ (GH 16302)
比較演算子で DataFrame を Series にブロードキャストする際のnumpy警告を抑制しました (GH 16378, GH 16306)

インデックス付け#

単一レベルのインデックスで DataFrame.reset_index(level=) のバグ (GH 16263)
単調だが厳密には単調ではないインデックスで部分文字列インデックスを作成する際にスライス境界が誤って反転するバグ (GH 16515)
MultiIndex.remove_unused_levels() が元の MultiIndex と等しいものを返さないバグ。(GH 16556)

IO#

空白区切りのテキストファイルで comment が渡された場合の read_csv() のバグ (GH 16472)
read_csv() が、usecols に存在しない列があり、かつ長さが正しい場合に例外を発生させないバグ (GH 14671)
クリップボードルーチンを不必要にインポートさせてしまい、起動時にインポートエラーを引き起こす可能性のあるバグ (GH 16288)
空の DataFrame をHTMLレンダリングする際に IndexError を発生させるバグ (GH 15953)
Python 2.x のCエンジンでtarfileオブジェクト入力がエラーを発生させる read_csv() のバグ (GH 16530)
DataFrame.to_html() が index_names パラメータを無視するバグ (GH 16493)
pd.read_hdf() がインデックス名にnumpy文字列を返すバグ (GH 13492)
HDFStore.select_as_multiple() で start/stop 引数が尊重されないバグ (GH 16209)

プロット#

単一列とリストライクな color を指定した DataFrame.plot のバグ (GH 3486)
DatetimeIndex 内の NaT が Timestamp.min を生成する plot のバグ (GH 12405)
グループ化されていない箱ひげ図で figsize キーワードが尊重されない DataFrame.boxplot のバグ (GH 11959)

GroupBy/resample/rolling#

空の DataFrame で時間ベースのローリングウィンドウを作成する際のバグ (GH 15819)
オフセットウィンドウでの rolling.cov() のバグ (GH 16058)
整数で集約する際の .resample() と .groupby() のバグ (GH 16361)

スパース#

scipy.sparse.dok_matrix からの SparseDataFrame の構築のバグ (GH 16179)

再整形#

MultiIndex 列でレベルがソートされていない場合の DataFrame.stack のバグ (GH 16323)
i が一意の識別子ではない場合にエラーがスローされない pd.wide_to_long() のバグ (GH 16382)
タプルのリストを含む Series.isin(..) のバグ (GH 16394)
すべてのNaT列を含む混合dtypeの DataFrame の構築のバグ。(GH 16395)
呼び出し不可能な属性で集約する際の DataFrame.agg() と Series.agg() のバグ (GH 16405)

数値#

limit=None (デフォルト) が渡された場合に limit_direction が尊重されない .interpolate() のバグ (GH 16282)

カテゴリカル#

両方のカテゴリカルが順序付けされていない場合の、カテゴリの順序を考慮する比較演算を修正しました (GH 16014)

その他#

非一意インデックスを含む空のリストでの DataFrame.drop() のバグ (GH 16270)

貢献者#

このリリースには合計34名がパッチを貢献しました。名前の横に「+」がある方は初めてパッチを貢献された方です。