2.0.1 の新機能 (2023 年 4 月 24 日)#
これらは pandas 2.0.1 の変更点です。pandas の他のバージョンを含む完全な変更ログについては、リリースノート を参照してください。
修正されたリグレッション#
辞書から構築する際のサブクラス化された Series のリグレッションを修正 (GH 52445)
カテゴリカルデータ、複数グループ化、
as_index=False、および集計のリストを使用してグループ化する場合に失敗するSeriesGroupBy.agg()のリグレッションを修正 (GH 52760)DataFrame.pivot()が入力オブジェクトのIndex名を変更するリグレッションを修正 (GH 52629)列のない DataFrame で
DataFrame.resample()が発生するリグレッションを修正 (GH 52484)DataFrame.sort_values()で、DataFrameが既にソートされており、ignore_index=Trueの場合にインデックスがリセットされないリグレッションを修正 (GH 52553)Generatorに対してTypeErrorを発生させるMultiIndex.isin()のリグレッションを修正 (GH 52568)拡張 dtype
Seriesで要素が 1 つの場合にRuntimeWarningを表示するSeries.describe()のリグレッションを修正 (GH 52515)DataFrameに新しい列を追加する際に、DataFrame.columnsがRangeIndexであり、新しいキーがハッシュ可能だがスカラーではなかった場合のリグレッションを修正 (GH 52652)
バグ修正#
int32の日数オーバーフローを引き起こすSeries.dt.daysのバグ (GH 52391)非ナノ秒の numpy datetime 配列が渡されたときに誤った単位を返す
arrays.DatetimeArrayコンストラクタのバグ (GH 52555)numpy
NaTを含むデータから構築された場合にオーバーフローする duration dtype を持つArrowExtensionArrayのバグ (GH 52843)Seriesと同じかそれ以上の分解能のfreqを渡すとZeroDivisionErrorが発生するSeries.dt.round()のバグ (GH 52761)ArrowDtypeを持つSeries.median()が近似中央値を返すバグ (GH 52679)api.interchange.from_dataframe()がカテゴリカル dtypes で不必要に発生していたバグ (GH 49889)api.interchange.from_dataframe()が大きな文字列 dtypes で不必要に発生していたバグ (GH 52795)pandas.testing.assert_series_equal()でcheck_dtype=Falseが異なる分解能の datetime または timedelta 型でまだ発生するバグ (GH 52449)read_csv()でdtype_backend="pyarrow"とparse_datesが設定されている場合に PyArrow datetime を NumPy にキャストし、処理でパフォーマンスのボトルネックを引き起こすバグ (GH 52546)to_datetime()およびto_timedelta()で、ArrowDtypeを持つ数値データを変換しようとした場合のバグ (GH 52425)errors='coerce'およびdtype_backend='pyarrow'をArrowDtypeデータと共に使用するto_numeric()のバグ (GH 52588)dtype が明示的に与えられた場合に尊重されない
ArrowDtype.__from_arrow__()のバグ (GH 52533)includeおよびexcludeでArrowDtypeが尊重されないDataFrame.describe()のバグ (GH 52570)DataFrame.max()および関連するものが、異なるTimestampの分解能を常にナノ秒にキャストするバグ (GH 52524)Series.describe()が数値データでpyarrow.float64型のArrowDtypeを返さないバグ (GH 52427)Series.dt.tz_localize()がArrowDtypeを持つタイムスタンプを誤ってローカライズするバグ (GH 52677)np.datetime64とnp.timedelta64のNaTスカラー間の算術演算で、単位が常にナノ秒の分解能を返すバグ (GH 52295)ArrowDtypeと numpy マスク型 (例:"boolean") 間の論理演算および比較演算のバグ (GH 52625)片側に
ArrowDtype、もう一方の側に NumPy dtype を持つmerge()でのマージ時のバグを修正 (GH 52406)null[pyarrow]dtype を持つSeries.to_numpy()でのセグメンテーション違反を修正 (GH 52443)
その他#
空の dict から作成された
DataFrameは、dtype がobjectのcolumnsを持っていました。現在はRangeIndexです (GH 52404)空の dict から作成された
Seriesは、dtype がobjectのindexを持っていました。現在はRangeIndexです (GH 52404)pyarrow.stringを持つArrowDtypeに対してSeries.str.split()およびSeries.str.rsplit()を実装 (GH 52401)pyarrow.stringを持つArrowDtypeに対してほとんどのstrアクセサメソッドを実装 (GH 52401)api.types.is_scalar()でFalseとなる非整数ハッシュ可能キーを提供すると、以前はInvalidIndexErrorが発生していましたが、Index.get_loc()の場合と同様に、RangeIndex.get_loc()ではKeyErrorが発生するようになりました (GH 52652)。
貢献者#
このリリースには合計20名がパッチを貢献しました。「+」が付いている方は今回初めてパッチを貢献しました。
Alex Malins +
Chris Carini +
Dea María Léon
Joris Van den Bossche
Luke Manley
Marc Garcia
Marco Edward Gorelli
MarcoGorelli
Matthew Roeschke
MeeseeksMachine
Natalia Mokeeva
Nirav +
Pandas Development Team
Patrick Hoefler
Richard Shadrach
ステファニー・モリン
テルジ・ピーターセン
Thomas +
Thomas Li
yonashub