バージョン 0.19.2 (2016年12月24日)#

これは 0.19.x シリーズのマイナーなバグ修正リリースで、いくつかの小さなリグレッション修正、バグ修正、およびパフォーマンス改善が含まれています。すべてのユーザーにこのバージョンへのアップグレードをお勧めします。

主な機能は以下の通りです。

機能強化#

0.19.0 で追加された pd.merge_asof() はいくつかの改善を加えました。

  • pd.merge_asof()left_index/right_index および left_by/right_by 引数を獲得しました (GH 14253)

  • pd.merge_asof()by パラメーターで複数の列を受け入れることができ、パフォーマンス向上のために特殊な dtype を持ちます (GH 13936)

パフォーマンス改善#

  • PeriodIndex のパフォーマンス回帰 (GH 14822)

  • getitem を使用したインデックス作成でのパフォーマンス回帰 (GH 14930)

  • .replace() のパフォーマンスを改善しました (GH 12745)

  • datetime インデックスと辞書データによる Series 作成のパフォーマンスを改善しました (GH 14894)

バグ修正#

  • 一部のオフセットのピクルス化のための Python 3.6 との互換性 (GH 14685)

  • 一部のインデックス例外タイプのための Python 3.6 との互換性 (GH 14684, GH 14689)

  • テストスイートにおける非推奨警告のための Python 3.6 との互換性 (GH 14681)

  • Timestamp ピクルスのための Python 3.6 との互換性 (GH 14689)

  • dateutil==2.6.0 との互換性; テストスイートで報告されたセグメンテーション違反 (GH 14621)

  • Timestamp.replace での nanoseconds を kwarg として許可する (GH 14621)

  • 辞書として渡された na_values に対してエイリアシングが行われていた pd.read_csv のバグ (GH 14203)

  • 辞書のような na_values の列インデックスが尊重されていなかった pd.read_csv のバグ (GH 14203)

  • ヘッダーの数がファイル内の行数と等しい場合にファイルの読み込みが失敗する pd.read_csv のバグ (GH 14515)

  • Python エンジンを使用する pd.read_csv のバグ。複数文字の区切り文字が引用符で尊重されていない場合に、役に立たないエラーメッセージが発行されていた (GH 14582)

  • pd.read_sas および pandas.io.sas.sas7bdat.SAS7BDATReader のバグ (GH 14734, GH 13654) を修正。SAS ファイルをインクリメンタルに読み込む際に問題を引き起こしていました。

  • Python エンジンを使用する pd.read_csv のバグ。Python の CSV ライブラリで skipfooter が尊重されていなかった場合に、役に立たないエラーメッセージが発行されていた (GH 13879)

  • タイムゾーンを認識する datetime64 値が誤って丸められていた .fillna() のバグ (GH 14872)

  • 複数のレベルでグループ化するときに、レックスソートされていない MultiIndex の .groupby(..., sort=True) のバグ (GH 14776)

  • 負の値と単一のビンを持つ pd.cut のバグ (GH 14652)

  • downcast='unsigned' 引数で 0 が符号なしとして扱われていなかった pd.to_numeric のバグ (GH 14401)

  • 共有軸 (sharex=True または ax.twinx()) を使用した規則的および不規則な時系列のプロットのバグ (GH 13341, GH 14322)。

  • Python 3.6 で報告された、無効な日付時刻の解析で例外が伝播されないバグ (GH 14561)

  • ローカル TZ で DatetimeIndex をリサンプリングする際のバグ。DST 変更をカバーしており、AmbiguousTimeError を発生させていた (GH 14682)

  • RecursionErrorKeyError または IndexingError に変換するインデックス作成のバグ (GH 14554)

  • data_columns=True を使用して MultiIndex を書き込む際の HDFStore のバグ (GH 14435)

  • Series を書き込み、index の値を含む min_itemsize 引数を渡す際の HDFStore.append() のバグ (GH 11412)

  • table 形式の HDFStore に書き込み、indexmin_itemsize 値があり、追加を要求しない場合のバグ (GH 10381)

  • 空の Series に対して IndexError を発生させる Series.groupby.nunique() のバグ (GH 12553)

  • インデックスに重複する値がある場合の DataFrame.nlargest および DataFrame.nsmallest のバグ (GH 13412)

  • Linux 上の Python2 で、Unicode と区切り文字を使用したクリップボード関数のバグ (GH 13747)

  • Windows 10 および Python 3 上のクリップボード関数のバグ (GH 14362, GH 12807)

  • .to_clipboard() と Excel 互換性のバグ (GH 12529)

  • 整数列に対する DataFrame.combine_first() のバグ (GH 14687)。

  • 空のデータに対して dtype パラメータが尊重されていなかった pd.read_csv() のバグ (GH 14712)

  • C エンジンを使用して解析する際に、大きな入力に対して nrows パラメータが尊重されていなかった pd.read_csv() のバグ (GH 7626)

  • 許容差が指定された場合に、タイムゾーンを認識する DatetimeIndex を pd.merge_asof() が処理できなかったバグ (GH 14844)

  • doubles を書き込む際に、範囲外の値に対して to_stata および StataWriter で明示的なチェックを追加 (GH 14618)

  • KDE プロットを生成するために欠損値を削除せず、代わりに空のプロットを生成した .plot(kind='kde') のバグ。( GH 14821)

  • 引数として列のリストを指定して呼び出された場合、すべての列の dtype に関係なく、それらが object に強制変換される unstack() のバグ (GH 11847)

貢献者#

このリリースには合計33人がパッチを貢献しました。「+」が付いている人は初めてパッチを貢献しました。

  • Ajay Saxena +

  • Ben Kandel

  • Chris

  • Chris Ham +

  • Christopher C. Aycock

  • Daniel Himmelstein +

  • Dave Willmer +

  • Dr-Irv

  • Jeff Carey +

  • ジェフ・リーバック

  • Joe Jevnik

  • Joris Van den Bossche

  • Julian Santander +

  • カービー・シェデン

  • Keshav Ramaswamy

  • ケビン・シェパード

  • Luca Scarabello +

  • Matt Roeschke +

  • Matti Picus +

  • Maximilian Roos

  • Mykola Golubyev +

  • Nate Yoder +

  • Nicholas Ver Halen +

  • Pawel Kordek

  • ピエトロ・バティストン

  • Rodolfo Fernandez +

  • Tara Adiseshan +

  • Tom Augspurger

  • ヤロスラフ・ハルチェンコ

  • ジーエフヤング

  • hesham.shabana@hotmail.com +

  • sinhrks

  • wandersoncferreira +