2.1.2の新機能 (2023年10月26日)#

これらはpandas 2.1.2での変更点です。他のバージョンのpandasを含む完全な変更ログについては、リリースノートを参照してください。

非推奨#

  • DataFrame.pct_change(), Series.pct_change(), DataFrameGroupBy.pct_change(), および SeriesGroupBy.pct_change()におけるfill_method=Noneの非推奨が元に戻されました。'backfill', 'bfill', 'pad', および 'ffill'の値は引き続き非推奨です (GH 53491)。

修正されたリグレッション#

  • DataFrame.join()において、結果に欠損値があり、dtypeがarrowバックの文字列である場合の回帰が修正されました (GH 55348)。

  • rolling()において、ナノ秒以外のインデックスまたはon列が誤った結果を生成する回帰が修正されました (GH 55026, GH 55106, GH 55299)。

  • DataFrame.resample()において、originがその境界外にある場合にoriginまで外挿する回帰が修正されました (GH 55064)。

  • DataFrame.sort_index()において、インデックスがスライスされたMultiIndexの場合に正しくソートされない回帰が修正されました (GH 55379)。

  • DataFrameGroupBy.agg()およびSeriesGroupBy.agg()において、compute.use_numbaオプションがTrueに設定されている場合、numbaエンジンでサポートされていないgroupbyメソッドがTypeErrorを発生させる回帰が修正されました (GH 55520)。

  • 通常、すべての列に個別にアクセスするメソッドを伴う幅広のDataFrameでのパフォーマンス回帰が修正されました (GH 55256, GH 55245)。

  • merge_asof()において、datetimeおよびtimedelta dtypesのbyに対してTypeErrorを発生させる回帰が修正されました (GH 55453)。

  • read_parquet()において、2GB以上の文字列データからなる文字列列を持つファイルを読み込み、"string" dtypeを使用する場合の回帰が修正されました (GH 55606)。

  • DataFrame.to_sql()において、detect_typesを使用した場合にsqliteのdatetime列を正しくラウンドトリップしない回帰が修正されました (GH 55554)。

  • 特定のDataFrameまたはSeriesサブクラスの構築における回帰が修正されました (GH 54922)。

バグ修正#

  • DataFrameGroupByの縮小において、infer_stringが設定されている場合にオブジェクトdtypeを保持しないバグが修正されました (GH 55620)。

  • SeriesGroupBy.value_counts()において、文字列列に対して誤ったdtypeを返すバグが修正されました (GH 55627)。

  • Categorical.equals()において、otherがarrowバックの文字列dtypeを持つ場合のバグが修正されました (GH 55364)。

  • DataFrame.__setitem__()において、infer_string=Trueでゼロ次元配列の文字列dtypeを推論しないバグが修正されました (GH 55366)。

  • DataFrame.idxmin()およびDataFrame.idxmax()において、arrow dtypesに対してエラーを発生させるバグが修正されました (GH 55368)。

  • DataFrame.interpolate()において、誤ったエラーメッセージを発生させるバグが修正されました (GH 55347)。

  • Index.insert()において、dtype="string[pyarrow_numpy]"IndexNoneを挿入するとエラーを発生させるバグが修正されました (GH 55365)。

  • Series.all()およびSeries.any()において、dtype="string[pyarrow_numpy]"の欠損値を正しく扱わないバグが修正されました (GH 55367)。

  • Series.floordiv()において、ArrowDtypeに関するバグが修正されました (GH 55561)。

  • Series.mode()において、arrowバックの文字列dtypeの値がソートされないバグが修正されました (GH 55621)。

  • Series.rank()において、string[pyarrow_numpy] dtypeに関するバグが修正されました (GH 55362)。

  • Series.str.extractall()において、ArrowDtype dtypeがオブジェクトに変換されるバグが修正されました (GH 53846)。

  • 互換性のないdtypeの項目を設定することに関するPDEP-6警告が、新しい条件付き列を作成する際に表示されていたバグが修正されました (GH 55025)。

  • 通常のプロットアクティビティ中にGH 53446によって導入されたPeriod[B]の警告が抑制されました (GH 55138)。

  • Seriesコンストラクタにおいて、NAが最初の値でありinfer_stringが設定されている場合に文字列dtypeを推論しないバグが修正されました (:issue:` 55655`)。

その他#

  • オプションの依存関係グループoutput_formattingの非動作インストールが修正されました。アンダースコア_をハイフン-に置き換えることで、壊れた依存関係の解決が修正されます。正しい使用方法はpip install pandas[output-formatting]です。

貢献者#

このリリースには合計20名がパッチを貢献しました。「+」が付いている方は今回初めてパッチを貢献しました。

  • Amanda Bizzinotto

  • Artur Barseghyan +

  • Hadi Abdi Khojasteh +

  • Joris Van den Bossche

  • Luke Manley

  • Lumberbot (aka Jack)

  • Marc Garcia

  • Marco Edward Gorelli

  • MarcoGorelli

  • Mateusz Sokół

  • Matthew Roeschke

  • Natalia Mokeeva

  • Pandas Development Team

  • Patrick Hoefler

  • Richard Shadrach

  • Thomas Li

  • Yao Xiao

  • dependabot[bot]

  • rohanjain101 +

  • torext +