What’s new in 2.2.1 (2024年2月22日)#

これらはpandas 2.2.1での変更点です。他のバージョンのpandasを含む完全な変更ログについては、リリースノートを参照してください。

機能強化#

  • pyarrow pip extraが追加され、ユーザーは pip install pandas[pyarrow] でpandasとpyarrowをpipでインストールできるようになりました (GH 54466)。

修正されたリグレッション#

  • read_csv() のメモリリークを修正しました (GH 57039)。

  • Series.combine_first() のパフォーマンス低下を修正しました (GH 55845)。

  • 最小タイムスタンプ付近でのオーバーフローを引き起こしていた不具合を修正しました (GH 57150)。

  • concat() で、軸が DatetimeIndex の場合に、結合しない軸が常にソートされるという長年の動作を変更していた不具合を修正しました (GH 57006)。

  • merge_ordered() で、fill_method="ffill"how="left" の場合に TypeError が発生していた不具合を修正しました (GH 57010)。

  • pandas.testing.assert_series_equal() で、Index のチェック時に check_exact=True がデフォルトになっていた不具合を修正しました (GH 57067)。

  • read_json() で、RangeIndex の代わりに Index が返されていた不具合を修正しました (GH 57429)。

  • wide_to_long() で、文字列列に対して AttributeError が発生していた不具合を修正しました (GH 57066)。

  • DataFrameGroupBy.idxmin(), DataFrameGroupBy.idxmax(), SeriesGroupBy.idxmin(), SeriesGroupBy.idxmax()skipna 引数を無視していた不具合を修正しました (GH 57040)。

  • DataFrameGroupBy.idxmin(), DataFrameGroupBy.idxmax(), SeriesGroupBy.idxmin(), SeriesGroupBy.idxmax() で、dtypeの最小値または最大値を含む値が誤った結果を生成する可能性があった不具合を修正しました (GH 57040)。

  • CategoricalIndex.difference() で、otherがNaN以外のヌル値を含んでいる場合に KeyError が発生していた不具合を修正しました (GH 57318)。

  • DataFrame.groupby() で、一部のケースで Series によってグループ化する際に ValueError が発生していた不具合を修正しました (GH 57276)。

  • DataFrame.loc() で、結果が10,000行を超える非ユニークなマスクトdtypeインデックスに対して IndexError が発生していた不具合を修正しました (GH 57027)。

  • DataFrame.loc() で、部分的な行インデクサーと複数の列で拡張する際に、不必要に「互換性のないdtype警告」を発していた不具合を修正しました (詳細は PDEP6 を参照) (GH 56503)。

  • DataFrame.map() で、NumPy nullableおよび ArrowDtypes に対して na_action="ignore" が尊重されていなかった不具合を修正しました (GH 57316)。

  • DataFrame.merge() で、特定の種類のサードパーティ拡張配列に対して ValueError が発生していた不具合を修正しました (GH 57316)。

  • DataFrame.query() で、オブジェクトdtypeのすべての NaT 列を持つ場合に不具合が発生していたのを修正しました (GH 57068)。

  • DataFrame.shift() で、axis=1 と空の DataFrame の場合に AssertionError が発生していた不具合を修正しました (GH 57301)。

  • DataFrame.sort_index() で、重複するインデックスに対して安定したソートが生成されなかった不具合を修正しました (GH 57151)。

  • DataFrame.to_dict() で、orient='list' とdatetimeまたはtimedelta型が整数を返していた不具合を修正しました (GH 54824)。

  • DataFrame.to_json() で、nullableな整数がfloatに変換されていた不具合を修正しました (GH 57224)。

  • DataFrame.to_sql() で、method="multi" が渡され、ダイアレクトタイプがOracleでない場合に不具合が発生していたのを修正しました (GH 57310)。

  • DataFrame.transpose() で、nullableな拡張dtypesを持つデータがF-連続性を持たず、使用時に例外を引き起こす可能性があった不具合を修正しました (GH 57315)。

  • DataFrame.update() で、ダウンキャスティングに関する誤った警告が発せられていた不具合を修正しました (GH 57124)。

  • DataFrameGroupBy.idxmin(), DataFrameGroupBy.idxmax(), SeriesGroupBy.idxmin(), SeriesGroupBy.idxmax()skipna 引数を無視していた不具合を修正しました (GH 57040)。

  • DataFrameGroupBy.idxmin(), DataFrameGroupBy.idxmax(), SeriesGroupBy.idxmin(), SeriesGroupBy.idxmax() で、dtypeの最小値または最大値を含む値が誤った結果を生成する可能性があった不具合を修正しました (GH 57040)。

  • ExtensionArray.to_numpy() で、非数値のマスクトdtypeに対してエラーが発生していた不具合を修正しました (GH 56991)。

  • Index.join() で、空のインデックスを混合dtype値を含む非空のインデックスに結合する際に TypeError が発生していた不具合を修正しました (GH 57048)。

  • Series.astype() で、欠損値を持つ整数から文字列dtypeに変換する際に小数点以下が導入されていた不具合を修正しました (GH 57418)。

  • Series.pct_change() で、空の Series に対して ValueError が発生していた不具合を修正しました (GH 57056)。

  • Series.to_numpy() で、dtypeがfloatとして与えられ、データにNaNが含まれている場合に不具合が発生していたのを修正しました (GH 57121)。

  • ミリ秒成分を持つ DateOffset オブジェクトを datetime64 IndexSeries、または DataFrame に加算または減算する際の不具合を修正しました (GH 57529)。

バグ修正#

その他#

PyArrowがインストールされていない状態でpandasがインポートされたときに発生していた DeprecationWarning が削除されました。この決定は、多くのユーザーにとって警告がノイズになりすぎたためであり、PyArrowを必須の依存関係とする決定について多くのフィードバックが収集されたためです。Pandasは現在、3.0でPyArrowをハード依存関係として追加すべきかどうかを検討中です。関心のあるユーザーはこちらで議論を追うことができます。

  • DataFrameGroupBy.first(), DataFrameGroupBy.last(), SeriesGroupBy.first(), および SeriesGroupBy.last() に引数 skipna が追加されました。skipna=False は以前は DataFrameGroupBy.nth() を介して利用できましたが、pandas 2.0.0 で動作が変更されました (GH 57019)。

  • Resampler.first(), Resampler.last() に引数 skipna が追加されました (GH 57019)。

貢献者#

このリリースには合計14名がパッチを貢献しました。名前に「+」が付いている人は初めてパッチを貢献しました。

  • アルバート・ビラノバ・デル・モラル

  • Luke Manley

  • Lumberbot (aka Jack)

  • Marco Edward Gorelli

  • Matthew Roeschke

  • Natalia Mokeeva

  • Pandas Development Team

  • Patrick Hoefler

  • Richard Shadrach

  • ロバート・シュミットケ +

  • サミュエル・チャイ +

  • Thomas Li

  • ウィリアム・エイド

  • dependabot[bot]