2.1.0 の新機能 (2023 年 8 月 30 日)#

これらは pandas 2.1.0 の変更点です。他のバージョンの pandas を含む完全な変更履歴については、リリースノートを参照してください。

機能強化#

PyArrow は pandas 3.0 で必須の依存関係になります#

PyArrow は pandas 3.0 以降、pandas の必須の依存関係になります。この決定は PDEP 10 に基づいています。

これにより、pandas ユーザーに多大な利益をもたらすさらなる変更が可能になります。これには以下が含まれますが、これらに限定されません。

デフォルトで文字列を PyArrow のバックアップされた文字列として推論し、メモリフットプリントを大幅に削減し、パフォーマンスを大幅に向上させます。
デフォルトで Decimal、lists、bytes、structured data など、より複雑な dtype を PyArrow で推論します。
Apache Arrow に依存する他のライブラリとの相互運用性が向上します。

この決定に対するフィードバックはこちらで収集しています。

デフォルトで文字列に NumPy object dtype を使用しないようにします#

以前は、すべての文字列はデフォルトで NumPy object dtype を持つ列に格納されていました。このリリースでは、すべての文字列を dtype "string[pyarrow_numpy]" を持つ PyArrow のバックアップされた文字列として推論するオプション future.infer_string が導入されました。これは、比較操作で NumPy セマンティクスに従い、欠損値インジケーターとして np.nan を返す新しい文字列 dtype 実装です。このオプションを設定すると、dtype "string" も、オプション mode.string_storage の値に関係なく、ストレージが "pyarrow_numpy" に設定された StringDtype として推論されます。

このオプションは PyArrow がインストールされている場合にのみ機能します。PyArrow のバックアップされた文字列は、NumPy object と比較してメモリフットプリントが大幅に削減され、パフォーマンスが大幅に向上します (GH 54430)。

このオプションは、

pd.options.future.infer_string = True

で有効にできます。この動作は pandas 3.0 でデフォルトになります。

DataFrame の削減は拡張 dtype を保持します#

以前のバージョンの pandas では、DataFrame の削減 (DataFrame.sum() DataFrame.mean() など) の結果は、DataFrame が拡張 dtype であっても NumPy dtype を持っていました。pandas は、共通の dtype を持つ DataFrame 列に対する削減を行う際に、dtype を保持できるようになりました (GH 52788)。

以前の動作

In [1]: df = pd.DataFrame({"a": [1, 1, 2, 1], "b": [np.nan, 2.0, 3.0, 4.0]}, dtype="Int64")
In [2]: df.sum()
Out[2]:
a    5
b    9
dtype: int64
In [3]: df = df.astype("int64[pyarrow]")
In [4]: df.sum()
Out[4]:
a    5
b    9
dtype: int64

新しい動作

In [1]: df = pd.DataFrame({"a": [1, 1, 2, 1], "b": [np.nan, 2.0, 3.0, 4.0]}, dtype="Int64")

In [2]: df.sum()
Out[2]: 
a    5
b    9
dtype: Int64

In [3]: df = df.astype("int64[pyarrow]")

In [4]: df.sum()
Out[4]: 
a    5
b    9
dtype: int64[pyarrow]

以前は NumPy 整数 dtype であったのに対し、dtype がそれぞれマスクされた dtype と PyArrow dtype になったことに注目してください。

DataFrame の削減が拡張 dtype を保持できるようにするために、ExtensionArray._reduce() に新しいキーワードパラメータ keepdims が追加されました。keepdims=True を指定して ExtensionArray._reduce() を呼び出すと、削減軸に沿って長さ 1 の配列を返す必要があります。後方互換性を維持するために、このパラメータは必須ではありませんが、将来的には必須になります。シグネチャにこのパラメータが見つからない場合、DataFrame の削減は拡張 dtype を保持できません。また、このパラメータが見つからない場合、FutureWarning が発行され、mypy のような型チェッカーはシグネチャが ExtensionArray._reduce() と互換性がないと警告する可能性があります。

コピーオンライトの改善#

func が Series をインプレースで変更する場合、Series.transform() がコピーオンライトを尊重しない (GH 53747)
Index.values() の呼び出しは、読み取り専用の NumPy 配列を返すようになりました (GH 53704)
DataFrame に Series を設定すると、ディープコピーではなくレイジーコピーが作成されるようになりました (GH 53142)
DataFrame コンストラクタは、Index オブジェクトの辞書から DataFrame を構築し、copy=False を指定した場合、DataFrame の列にそれらの Index オブジェクトのレイジーコピーを使用するようになりました (GH 52947)
Series または DataFrame のシャローコピー (df.copy(deep=False)) は、データのシャローコピーだけでなく、行/列 Index オブジェクトのシャローコピーも返すようになりました。つまり、結果のインデックスはもはや同一ではありません (df.copy(deep=False).index is df.index はもはや True ではありません) (GH 53721)
DataFrame.head() および DataFrame.tail() はディープコピーを返すようになりました (GH 54011)
DataFrame.eval() にレイジーコピーメカニズムを追加しました (GH 53746)
一時的な列選択でインプレース操作を試みる (例: df["a"].fillna(100, inplace=True)) と、コピーオンライトが有効な場合は常に警告が発行されるようになりました。このモードでは、選択が一時的なコピーとして機能するため、このようなインプレース操作は機能しません。これは以下の場合に当てはまります。
- DataFrame.update / Series.update
- DataFrame.fillna / Series.fillna
- DataFrame.replace / Series.replace
- DataFrame.clip / Series.clip
- DataFrame.where / Series.where
- DataFrame.mask / Series.mask
- DataFrame.interpolate / Series.interpolate
- DataFrame.ffill / Series.ffill
- DataFrame.bfill / Series.bfill

新しい `DataFrame.map()` メソッドと ExtensionArray のサポート#

DataFrame.map() が追加され、DataFrame.applymap() は非推奨になりました。DataFrame.map() は DataFrame.applymap() と同じ機能を持っていますが、新しい名前は、これが Series.map() の DataFrame 版であることをよりよく伝えています (GH 52353)。

呼び出し可能オブジェクトが与えられた場合、Series.map() は Series のすべての要素に呼び出し可能オブジェクトを適用します。同様に、DataFrame.map() は DataFrame のすべての要素に呼び出し可能オブジェクトを適用し、Index.map() は Index のすべての要素に呼び出し可能オブジェクトを適用します。

多くの場合、呼び出し可能オブジェクトを配列の NaN ライクな値に適用することは望ましくなく、それを避けるために map メソッドを na_action="ignore"、つまり ser.map(func, na_action="ignore") で呼び出すことができます。しかし、多くの ExtensionArray および Index 型では na_action="ignore" が実装されておらず、nullable な数値型 (つまり、dtype が Int64 など) を除くすべての ExtensionArray サブクラスでは na_action="ignore" が正しく機能しませんでした。

na_action="ignore" はすべての配列型で機能するようになりました (GH 52219, GH 51645, GH 51809, GH 51936, GH 52033; GH 52096)。

以前の動作:

In [1]: ser = pd.Series(["a", "b", np.nan], dtype="category")
In [2]: ser.map(str.upper, na_action="ignore")
NotImplementedError
In [3]: df = pd.DataFrame(ser)
In [4]: df.applymap(str.upper, na_action="ignore")  # worked for DataFrame
     0
0    A
1    B
2  NaN
In [5]: idx = pd.Index(ser)
In [6]: idx.map(str.upper, na_action="ignore")
TypeError: CategoricalIndex.map() got an unexpected keyword argument 'na_action'

新しい動作:

In [5]: ser = pd.Series(["a", "b", np.nan], dtype="category")

In [6]: ser.map(str.upper, na_action="ignore")
Out[6]: 
0      A
1      B
2    NaN
dtype: category
Categories (2, object): ['A', 'B']

In [7]: df = pd.DataFrame(ser)

In [8]: df.map(str.upper, na_action="ignore")
Out[8]: 
     0
0    A
1    B
2  NaN

In [9]: idx = pd.Index(ser)

In [10]: idx.map(str.upper, na_action="ignore")
Out[10]: CategoricalIndex(['A', 'B', nan], categories=['A', 'B'], ordered=False, dtype='category')

また、Categorical.map() は暗黙的に na_action がデフォルトで "ignore" に設定されていたことに注意してください。これは非推奨となり、Categorical.map() のデフォルトは、他のすべての配列型と一貫して na_action=None に変更されます。

`DataFrame.stack()` の新しい実装#

pandas は DataFrame.stack() を再実装しました。新しい実装を使用するには、引数 future_stack=True を渡します。これは pandas 3.0 で唯一のオプションになります。

以前の実装には、主に2つの動作上の欠点がありました。

以前の実装では、結果に不必要な NA 値が導入されました。ユーザーは dropna=True (デフォルト) を渡すことで NA 値を自動的に削除できましたが、これを行うと、入力に存在した NA 値も結果から削除される可能性がありました。以下の例を参照してください。
sort=True (デフォルト) を使用した以前の実装では、結果のインデックスの一部がソートされたり、ソートされなかったりすることがありました。入力の列が MultiIndex でない場合、結果のインデックスはソートされませんでした。列が MultiIndex の場合、ほとんどの場合、列レベルのスタッキングに由来する結果のインデックスのレベルはソートされました。まれに、列の作成方法によっては、そのようなレベルが非標準の順序でソートされることがありました。

新しい実装 (future_stack=True) では、複数のレベルをスタックする際に不必要な NA 値を導入せず、決してソートされません。そのため、future_stack=True を使用する場合、引数 dropna と sort は使用されず、指定されていない状態を維持する必要があります。これらの引数は次のメジャーリリースで削除されます。

In [11]: columns = pd.MultiIndex.from_tuples([("B", "d"), ("A", "c")])

In [12]: df = pd.DataFrame([[0, 2], [1, 3]], index=["z", "y"], columns=columns)

In [13]: df
Out[13]: 
   B  A
   d  c
z  0  2
y  1  3

以前のバージョン (future_stack=False) では、dropna=True のデフォルトは不必要に導入された NA 値を削除しましたが、その過程で dtype を float64 に強制変換しました。新しいバージョンでは、NA は導入されないため、dtype の強制変換もありません。

In [14]: df.stack([0, 1], future_stack=False, dropna=True)
Out[14]: 
z  A  c    2.0
   B  d    0.0
y  A  c    3.0
   B  d    1.0
dtype: float64

In [15]: df.stack([0, 1], future_stack=True)
Out[15]: 
z  B  d    0
   A  c    2
y  B  d    1
   A  c    3
dtype: int64

入力に NA 値が含まれている場合、以前のバージョンは dropna=True でそれらも削除するか、dropna=False で新しい NA 値を導入しました。新しいバージョンは入力からのすべての値を保持します。

In [16]: df = pd.DataFrame([[0, 2], [np.nan, np.nan]], columns=columns)

In [17]: df
Out[17]: 
     B    A
     d    c
0  0.0  2.0
1  NaN  NaN

In [18]: df.stack([0, 1], future_stack=False, dropna=True)
Out[18]: 
0  A  c    2.0
   B  d    0.0
dtype: float64

In [19]: df.stack([0, 1], future_stack=False, dropna=False)
Out[19]: 
0  A  d    NaN
      c    2.0
   B  d    0.0
      c    NaN
1  A  d    NaN
      c    NaN
   B  d    NaN
      c    NaN
dtype: float64

In [20]: df.stack([0, 1], future_stack=True)
Out[20]: 
0  B  d    0.0
   A  c    2.0
1  B  d    NaN
   A  c    NaN
dtype: float64

その他の機能強化#

Series.ffill() および Series.bfill() は、IntervalDtype を持つオブジェクトでサポートされるようになりました (GH 54247)
read_parquet() に filters パラメータが追加され、両方の engines と互換性のあるデータのフィルタリングができるようになりました (GH 53212)
Categorical.map() および CategoricalIndex.map() に na_action パラメータが追加されました。Categorical.map() は暗黙的に na_action のデフォルト値として "ignore" を持っていました。これは正式に非推奨となり、将来的には None に変更されます。また、Series.map() はデフォルトで na_action=None であり、カテゴリカルデータを含む Series への呼び出しは、明示的に設定されていない限り na_action=None を使用するようになることに注意してください (GH 44279)
api.extensions.ExtensionArray に map() メソッドが追加されました (GH 51809)
DataFrame.applymap() は、基となる api.extensions.ExtensionArray インスタンスの map() メソッドを使用するようになりました (GH 52219)
MultiIndex.sort_values() が na_position をサポートするようになりました (GH 51612)
MultiIndex.sortlevel() と Index.sortlevel() に新しいキーワード na_position が追加されました (GH 51612)
arrays.DatetimeArray.map()、arrays.TimedeltaArray.map()、および arrays.PeriodArray.map() が na_action 引数を受け入れるようになりました (GH 51644)
arrays.SparseArray.map() が na_action をサポートするようになりました (GH 52096)。
pandas.read_html() が URL と一緒に使用されるときに storage_options キーワードをサポートするようになり、ユーザーは送信 HTTP リクエストにヘッダーを追加できるようになりました (GH 49944)
Index.diff() および Index.round() を追加しました (GH 19708)
Styler の escape 引数に "latex-math" オプションを追加しました。これにより、書式設定中に "\(" と "\)" の間のすべての文字がエスケープされません (GH 51903)
CategoricalDtype の repr 情報にカテゴリの dtype を追加しました (GH 52179)
read_excel() に engine_kwargs パラメータを追加しました (GH 52214)
型ヒントに役立つクラスが、新しいサブモジュール pandas.api.typing にパブリック API として追加されました (GH 48577)
Series.dt.is_month_start、Series.dt.is_month_end、Series.dt.is_year_start、Series.dt.is_year_end、Series.dt.is_quarter_start、Series.dt.is_quarter_end、Series.dt.days_in_month、Series.dt.unit、Series.dt.normalize、Series.dt.day_name()、Series.dt.month_name()、Series.dt.tz_convert() が pyarrow.timestamp を持つ ArrowDtype で実装されました (GH 52388, GH 51718)
DataFrameGroupBy.agg() および DataFrameGroupBy.transform() は、engine="numba" の場合、インデックスが MultiIndex でないときに複数のキーでグループ化できるようになりました (GH 53486)
SeriesGroupBy.agg() および DataFrameGroupBy.agg() は、engine="numba" の場合、複数の関数を渡すことをサポートするようになりました (GH 53486)
SeriesGroupBy.transform() および DataFrameGroupBy.transform() は、engine="numba" の場合、関数として文字列を渡すことをサポートするようになりました (GH 53579)
DataFrame.stack() に sort キーワードが追加され、結果の MultiIndex レベルがソートされるかどうかを決定できるようになりました (GH 15105)
DataFrame.unstack() に sort キーワードが追加され、結果の MultiIndex レベルがソートされるかどうかを決定できるようになりました (GH 15105)
Series.explode() は PyArrow をバックアップするリスト型をサポートするようになりました (GH 53602)
Series.str.join() は ArrowDtype(pa.string()) をサポートするようになりました (GH 53646)
Categorical.from_codes() に validate パラメータを追加しました (GH 50975)
Series.interpolate() および DataFrame.interpolate() で使用される ExtensionArray.interpolate() を追加しました (GH 53659)
DataFrame.to_excel() に engine_kwargs パラメータを追加しました (GH 53220)
DatetimeTZDtype の api.interchange.from_dataframe() を実装しました (GH 54239)
DatetimeTZDtype に __from_arrow__ を実装しました (GH 52201)
算術演算の場合に、カスタム型が DataFrame、Series、Index、または ExtensionArray よりも優先されるように __pandas_priority__ を実装しました。開発者ガイドを参照してください (GH 48347)
DataFrame.merge() を使用して互換性のない列がある場合のエラーメッセージを改善しました (GH 51861)
DataFrame.isetitem() を介して間違った列数で DataFrame を設定する場合のエラーメッセージを改善しました (GH 51701)
DataFrame.to_json() を互換性のない index および orient 引数で使用する場合のエラー処理を改善しました (GH 52143)
空のデータ (0 行)、インデックスなし、および間違った列数で DataFrame を作成する際のエラーメッセージを改善しました (GH 52084)
VariableOffsetWindowIndexer に無効な index または offset 引数を提供する場合のエラーメッセージを改善しました (GH 54379)
DataFrame.to_feather() が非デフォルトの Index と非文字列の列名を受け入れるようになりました (GH 51787)
Series.apply() および DataFrame.apply() に新しいパラメータ by_row を追加しました。False に設定すると、提供された呼び出し可能オブジェクトは常に Series または DataFrame 全体で動作します (GH 53400, GH 53601)。
DataFrame.shift() および Series.shift() は、期間のリストを提供することで複数の期間でシフトできるようになりました (GH 44424)
numba を使用した Groupby 集計 (例: DataFrameGroupBy.sum()) は、float64 にキャストする代わりに、入力の dtype を保持できるようになりました (GH 44952)
DataFrameGroupBy.agg() が失敗した場合のエラーメッセージを改善しました (GH 52930)
DataFrame.to_pickle() や read_csv() など、多くの read/to_* 関数が lzma.LZMAFile に圧縮引数を転送することをサポートするようになりました (GH 52979)
削減 Series.argmax()、Series.argmin()、Series.idxmax()、Series.idxmin()、Index.argmax()、Index.argmin()、DataFrame.idxmax()、DataFrame.idxmin() が object-dtype でサポートされるようになりました (GH 4279, GH 18021, GH 40685, GH 43697)
DataFrame.to_parquet() および read_parquet() は、それぞれ attrs を書き込みおよび読み込みするようになりました (GH 54346)
浮動小数点 dtype および timedelta64 dtypes を持つ Index.all() および Index.any() は、Series.all() および Series.any() の動作と一致するようになり、TypeError を発生させなくなりました (GH 54566)
Series.cummax()、Series.cummin() および Series.cumprod() は、PyArrow バージョン 13.0 以降の PyArrow dtypes でサポートされるようになりました (GH 52085)
DataFrame Consortium Standard のサポートを追加しました (GH 54383)
DataFrameGroupBy.quantile() および SeriesGroupBy.quantile() のパフォーマンスを改善しました (GH 51722)
PyArrow のバックアップされた整数 dtypes がビット演算をサポートするようになりました (GH 54495)

下位互換性のない API の変更#

Python の最小バージョンが引き上げられました#

pandas 2.1.0 は Python 3.9 以降をサポートしています。

依存関係の最小バージョン引き上げ#

一部の依存関係の最小サポートバージョンが更新されました。インストールされている場合、以下のバージョンが必要になります。

パッケージ	最小バージョン	必須	変更済み
numpy	1.22.4	X	X
mypy (開発)	1.4.1		X
beautifulsoup4	4.11.1		X
bottleneck	1.3.4		X
dataframe-api-compat	0.1.7		X
fastparquet	0.8.1		X
fsspec	2022.05.0		X
hypothesis	6.46.1		X
gcsfs	2022.05.0		X
jinja2	3.1.2		X
lxml	4.8.0		X
numba	0.55.2		X
numexpr	2.8.0		X
openpyxl	3.0.10		X
pandas-gbq	0.17.5		X
psycopg2	2.9.3		X
pyreadstat	1.1.5		X
pyqt5	5.15.6		X
pytables	3.7.0		X
pytest	7.3.2		X
python-snappy	0.6.1		X
pyxlsb	1.0.9		X
s3fs	2022.05.0		X
scipy	1.8.1		X
sqlalchemy	1.4.36		X
表計算	0.8.10		X
xarray	2022.03.0		X
xlsxwriter	3.0.3		X
zstandard	0.17.0		X

オプションライブラリについては、最新バージョンを使用することが一般的な推奨事項です。

詳細については、依存関係およびオプションの依存関係を参照してください。

その他の API の変更#

arrays.PandasArray は NumpyExtensionArray に名前が変更され、関連する dtype 名が PandasDtype から NumpyEADtype に変更されました。PandasArray のインポートは次のメジャーバージョンまで機能します (GH 53694)

非推奨#

setitem-like Series 操作でのサイレントアップキャストは非推奨になりました#

PDEP-6: https://pandas.dokyumento.jp/pdeps/0006-ban-upcasting.html

dtype をサイレントにアップキャストする Series (または DataFrame 列) の setitem-like 操作は非推奨となり、警告が表示されます。影響を受ける操作の例は次のとおりです。

ser.fillna('foo', inplace=True)
ser.where(ser.isna(), 'foo', inplace=True)
ser.iloc[indexer] = 'foo'
ser.loc[indexer] = 'foo'
df.iloc[indexer, 0] = 'foo'
df.loc[indexer, 'a'] = 'foo'
ser[indexer] = 'foo'

ここで、ser は Series、df は DataFrame、indexer はスライス、マスク、単一値、値のリストまたは配列、またはその他の許可されたインデクサーです。

将来のバージョンでは、これらはエラーを発生させるため、最初に共通の dtype にキャストする必要があります。

以前の動作:

In [1]: ser = pd.Series([1, 2, 3])

In [2]: ser
Out[2]:
0    1
1    2
2    3
dtype: int64

In [3]: ser[0] = 'not an int64'

In [4]: ser
Out[4]:
0    not an int64
1               2
2               3
dtype: object

新しい動作:

In [1]: ser = pd.Series([1, 2, 3])

In [2]: ser
Out[2]:
0    1
1    2
2    3
dtype: int64

In [3]: ser[0] = 'not an int64'
FutureWarning:
  Setting an item of incompatible dtype is deprecated and will raise an error in a future version of pandas.
  Value 'not an int64' has dtype incompatible with int64, please explicitly cast to a compatible dtype first.

In [4]: ser
Out[4]:
0    not an int64
1               2
2               3
dtype: object

現在の動作を維持するには、上記の場合、最初に ser を object dtype にキャストすることができます。

In [21]: ser = pd.Series([1, 2, 3])

In [22]: ser = ser.astype('object')

In [23]: ser[0] = 'not an int64'

In [24]: ser
Out[24]: 
0    not an int64
1               2
2               3
dtype: object

使用例に応じて、別の dtype にキャストする方が適切な場合があります。以下の例では、float64 にキャストしています。

In [25]: ser = pd.Series([1, 2, 3])

In [26]: ser = ser.astype('float64')

In [27]: ser[0] = 1.1

In [28]: ser
Out[28]: 
0    1.1
1    2.0
2    3.0
dtype: float64

詳細については、https://pandas.dokyumento.jp/pdeps/0006-ban-upcasting.html を参照してください。

混合タイムゾーンを持つ日付時刻の解析は非推奨になりました#

ユーザーが to_datetime() に utc=True を渡さない限り、混合タイムゾーンを持つ日付時刻の解析は非推奨となり、警告が表示されます (GH 50887)

以前の動作:

In [7]: data = ["2020-01-01 00:00:00+06:00", "2020-01-01 00:00:00+01:00"]

In [8]:  pd.to_datetime(data, utc=False)
Out[8]:
Index([2020-01-01 00:00:00+06:00, 2020-01-01 00:00:00+01:00], dtype='object')

新しい動作:

In [9]: pd.to_datetime(data, utc=False)
FutureWarning:
  In a future version of pandas, parsing datetimes with mixed time zones will raise
  a warning unless `utc=True`. Please specify `utc=True` to opt in to the new behaviour
  and silence this warning. To create a `Series` with mixed offsets and `object` dtype,
  please use `apply` and `datetime.datetime.strptime`.
Index([2020-01-01 00:00:00+06:00, 2020-01-01 00:00:00+01:00], dtype='object')

この警告を抑制し、将来のバージョンの pandas でのエラーを回避するには、utc=True を指定してください。

In [29]: data = ["2020-01-01 00:00:00+06:00", "2020-01-01 00:00:00+01:00"]

In [30]: pd.to_datetime(data, utc=True)
Out[30]: DatetimeIndex(['2019-12-31 18:00:00+00:00', '2019-12-31 23:00:00+00:00'], dtype='datetime64[ns, UTC]', freq=None)

混合オフセットと object dtype を持つ Series を作成するには、apply と datetime.datetime.strptime を使用してください。

In [31]: import datetime as dt

In [32]: data = ["2020-01-01 00:00:00+06:00", "2020-01-01 00:00:00+01:00"]

In [33]: pd.Series(data).apply(lambda x: dt.datetime.strptime(x, '%Y-%m-%d %H:%M:%S%z'))
Out[33]: 
0    2020-01-01 00:00:00+06:00
1    2020-01-01 00:00:00+01:00
dtype: object

その他の非推奨事項#

DataFrameGroupBy.dtypes は非推奨になりました。代わりに基となるオブジェクトの dtypes を確認してください (GH 51045)
DataFrame._data および Series._data は非推奨になりました。代わりにパブリック API を使用してください (GH 33333)
concat() の動作で、連結されるオブジェクトのいずれかの長さが 0 の場合が非推奨になりました。過去には、結果の dtype を決定する際に空のオブジェクトの dtypes は無視されていましたが、将来のバージョンでは無視されません (GH 39122)
Categorical.to_list() は非推奨になりました。代わりに obj.tolist() を使用してください (GH 51254)
DataFrameGroupBy.all() および DataFrameGroupBy.any() を datetime64 または PeriodDtype 値で使用する場合が非推奨になりました。Series および DataFrame の非推奨事項と一致します (GH 34479)
DataFrame.ewm()、DataFrame.rolling()、DataFrame.expanding() での axis=1 は非推奨になりました。代わりにメソッドを呼び出す前に転置してください (GH 51778)
DataFrame.groupby() および Grouper コンストラクタでの axis=1 は非推奨になりました。代わりに frame.T.groupby(...) を実行してください (GH 51203)
Series.align() および DataFrame.align() での broadcast_axis キーワードは非推奨になりました。left = DataFrame({col: left for col in right.columns}, index=right.index) で align を呼び出す前にアップキャストしてください (GH 51856)
Index.fillna() での downcast キーワードは非推奨になりました (GH 53956)
DataFrame.pct_change()、Series.pct_change()、DataFrameGroupBy.pct_change()、および SeriesGroupBy.pct_change() での fill_method および limit キーワードは非推奨になりました。pct_change を呼び出す前に、例えば DataFrame.ffill() または DataFrame.bfill() を明示的に呼び出してください (GH 53491)
DataFrame.align() および Series.align() での method、limit、および fill_axis キーワードは非推奨になりました。代わりに、アラインメント結果に対して DataFrame.fillna() または Series.fillna() を明示的に呼び出してください (GH 51856)
Rolling.quantile() および Expanding.quantile() での quantile キーワードは非推奨になりました。代わりに q に変更されました (GH 52550)
DataFrame.take() でのスライスの受け入れは非推奨になりました。代わりに obj[slicer] を呼び出すか、整数のシーケンスを渡してください (GH 51539)
すべて NA エントリまたは任意の NA と skipna=False を持つ DataFrame.idxmax()、DataFrame.idxmin()、Series.idxmax()、Series.idxmin() の動作は非推奨になりました。将来のバージョンでは、これらは ValueError を発生させます (GH 51276)
Index のサブクラス化の明示的なサポートは非推奨になりました (GH 45289)
Series.agg() に与えられた関数が、Series の各要素に対して操作を試み、要素ごとの操作が失敗した場合にのみ Series 全体で操作する動作は非推奨になりました。将来は、Series.agg() に与えられた関数は常に Series 全体でのみ動作します。現在の動作を維持するには、代わりに Series.transform() を使用してください (GH 53325)
DataFrame.agg() に与えられた関数のリストの関数が、DataFrame の各要素に対して操作を試み、要素ごとの操作が失敗した場合にのみ DataFrame の列で操作する動作は非推奨になりました。現在の動作を維持するには、代わりに DataFrame.transform() を使用してください (GH 53325)
DataFrame.from_records() に DataFrame を渡すことは非推奨になりました。代わりに DataFrame.set_index() または DataFrame.drop() を使用してください (GH 51353)
文字列を日付時刻に解析する際に、認識されないタイムゾーンをサイレントに削除する動作は非推奨になりました (GH 18702)
DataFrame.ewm()、Series.ewm()、DataFrame.rolling()、Series.rolling()、DataFrame.expanding()、Series.expanding() での axis キーワードは非推奨になりました (GH 51778)
DataFrame.resample()、Series.resample() での axis キーワードは非推奨になりました (GH 51778)
Series.interpolate()、DataFrame.interpolate()、Series.fillna()、DataFrame.fillna()、Series.ffill()、DataFrame.ffill()、Series.bfill()、DataFrame.bfill() での downcast キーワードは非推奨になりました (GH 40988)
len(keys) != len(objs) の両方で concat() を使用する動作は非推奨になりました。将来のバージョンでは、2つのシーケンスの短い方に切り捨てられるのではなく、エラーが発生します (GH 43485)
NA 値が存在する場合の Series.argsort() の動作は非推奨になりました。将来のバージョンでは、-1 を与えるのではなく、最後にソートされます (GH 54219)
DataFrame.groupby() および Series.groupby() での observed=False のデフォルトは非推奨になりました。これは将来のバージョンで True になります (GH 43999)
SeriesGroupBy.aggregate() 集計で各グループに group.name をピン留めする動作は非推奨になりました。操作で groupby キーを利用する必要がある場合は、代わりに groupby オブジェクトを反復処理してください (GH 41090)
DataFrameGroupBy.idxmax()、DataFrameGroupBy.idxmin()、DataFrameGroupBy.fillna()、DataFrameGroupBy.take()、DataFrameGroupBy.skew()、DataFrameGroupBy.rank()、DataFrameGroupBy.cumprod()、DataFrameGroupBy.cumsum()、DataFrameGroupBy.cummax()、DataFrameGroupBy.cummin()、DataFrameGroupBy.pct_change()、DataFrameGroupBy.diff()、DataFrameGroupBy.shift()、および DataFrameGroupBy.corrwith() での axis キーワードは非推奨になりました。axis=1 の場合は、代わりに基となる DataFrame で操作してください (GH 50405, GH 51046)
as_index=False を持つ DataFrameGroupBy が、DataFrame の列でないグループ化を結果に含めない動作は非推奨になりました (GH 49519)
is_categorical_dtype() は非推奨になりました。代わりに isinstance(obj.dtype, pd.CategoricalDtype) を使用してください (GH 52527)
非推奨の is_datetime64tz_dtype() は、代わりに isinstance(dtype, pd.DatetimeTZDtype) を使用して確認してください (GH 52607)
非推奨の is_int64_dtype() は、代わりに dtype == np.dtype(np.int64) を使用して確認してください (GH 52564)
非推奨の is_interval_dtype() は、代わりに isinstance(dtype, pd.IntervalDtype) を使用して確認してください (GH 52607)
非推奨の is_period_dtype() は、代わりに isinstance(dtype, pd.PeriodDtype) を使用して確認してください (GH 52642)
非推奨の is_sparse() は、代わりに isinstance(dtype, pd.SparseDtype) を使用して確認してください (GH 52642)
非推奨の Styler.applymap_index()。代わりに新しい Styler.map_index() メソッドを使用してください (GH 52708)
非推奨の Styler.applymap()。代わりに新しい Styler.map() メソッドを使用してください (GH 52708)
非推奨の DataFrame.applymap()。代わりに新しい DataFrame.map() メソッドを使用してください (GH 52353)
非推奨の DataFrame.swapaxes() と Series.swapaxes() は、代わりに DataFrame.transpose() または Series.transpose() を使用してください (GH 51946)
PeriodArray コンストラクタの freq パラメータは非推奨です。代わりに dtype を渡してください (GH 52462)
take() で非標準の入力を許可することは非推奨です。代わりに numpy.ndarray、ExtensionArray、Index、または Series のいずれかを渡してください (GH 52981)
isin()、value_counts()、unique()、factorize() で非標準のシーケンスを許可することは非推奨です。呼び出す前に numpy.ndarray、Index、ExtensionArray、または Series のいずれかに変換してください (GH 52986)
DataFrame のリダクション sum、prod、std、var、sem で axis=None を使用する動作は非推奨です。将来のバージョンでは、これは axis=0 のように動作するのではなく、両軸で操作してスカラーを返します。これは np.sum(df) などの NumPy 関数にも影響することに注意してください (GH 21597)
concat() の動作で、DataFrame がすべてNAの列を持つ場合に、将来のバージョンでは結果のdtypeを決定する際にこれらの列は破棄されなくなります (GH 40893)
Series.dt.to_pydatetime() の動作は非推奨です。将来のバージョンでは、これは datetime の ndarray ではなく、Python の datetime オブジェクトを含む Series を返します。これは他の Series.dt プロパティの動作と一致します (GH 20306)
pandas オブジェクトと dtype のないシーケンス (例: list、tuple) の間の論理演算 (|、&、^) は非推奨です。代わりに操作を行う前にシーケンスを Series または NumPy 配列でラップしてください (GH 51521)
Series.apply() のパラメータ convert_type は非推奨です (GH 52140)
SeriesGroupBy.agg() に辞書を渡すことは非推奨です。代わりに集計のリストを渡してください (GH 50684)
Categorical コンストラクタの fastpath キーワードは非推奨です。代わりに Categorical.from_codes() を使用してください (GH 20110)
オブジェクト dtype のブールオブジェクトの Index に対して is_bool_dtype() が True を返す動作は非推奨です (GH 52680)
メソッド Series.bool() および DataFrame.bool() は非推奨です (GH 51749)
DatetimeIndex コンストラクタの未使用の closed および normalize キーワードは非推奨です (GH 52628)
TimedeltaIndex コンストラクタの未使用の closed キーワードは非推奨です (GH 52628)
インデックスが異なる2つの非ブール Series 間の論理演算で、常に結果がブールdtypeに強制される動作は非推奨です。将来のバージョンでは、これは入力の戻り値を維持します (GH 52500、GH 52538)
BDay freq を持つ Period および PeriodDtype は非推奨です。代わりに BDay freq を持つ DatetimeIndex を使用してください (GH 53446)
非推奨の value_counts() は、代わりに pd.Series(obj).value_counts() を使用してください (GH 47862)
非推奨の Series.first() および DataFrame.first() は、代わりにマスクを作成し .loc を使用してフィルタリングしてください (GH 45908)
オブジェクト dtype の Series.interpolate() および DataFrame.interpolate() は非推奨です (GH 53631)
非推奨の Series.last() および DataFrame.last() は、代わりにマスクを作成し .loc を使用してフィルタリングしてください (GH 53692)
SparseDtype で任意の fill_value を許可することは非推奨です。将来のバージョンでは、fill_value は dtype.subtype と互換性がある必要があります。つまり、そのサブタイプで保持できるスカラーであるか、整数またはブールサブタイプの場合は NaN である必要があります (GH 23124)
DataFrameGroupBy.quantile() および SeriesGroupBy.quantile() でブールdtypeを許可することは非推奨です。Series.quantile() および DataFrame.quantile() の動作と整合性があります (GH 51424)
testing.assert_series_equal() および testing.assert_frame_equal() でNAに似た値 (例: NaN と None を同等と見なす) を考慮する動作は非推奨です (GH 52081)
read_excel() へのバイト入力は非推奨です。ファイルパスを読み込むには、文字列またはパスのようなオブジェクトを使用してください (GH 53767)
スカラーデータからの SparseArray の構築は非推奨です。代わりにシーケンスを渡してください (GH 53039)
DataFrame.replace() および Series.replace() で、value が指定されておらず、to_replace が辞書のようなものでない場合に、フォールバックして埋める動作は非推奨です (GH 33302)
read_json() へのリテラル JSON 入力は非推奨です。代わりにリテラル JSON 文字列入力を io.StringIO でラップしてください (GH 53409)
read_xml() へのリテラル文字列入力は非推奨です。代わりにリテラル文字列/バイト入力を io.StringIO / io.BytesIO でラップしてください (GH 53767)
read_html() へのリテラル文字列/バイト入力は非推奨です。代わりにリテラル文字列/バイト入力を io.StringIO / io.BytesIO でラップしてください (GH 53767)
オプション mode.use_inf_as_na は非推奨です。代わりに NaN に変換してから使用してください (GH 51684)
DataFrameGroupBy.get_group() のパラメータ obj は非推奨です (GH 53545)
Series.__getitem__() および Series.__setitem__() を使用した Series への位置インデックス付けは非推奨です。将来のバージョンでは、ser[item] は item を位置ではなくラベルとして*常に*解釈します (GH 50617)
.agg、.apply、.transform での組み込み関数と NumPy 関数の置換は非推奨です。代わりに、対応する文字列エイリアス (例: sum または np.sum の "sum") を使用してください (GH 53425)
to_timedelta() で単位を示す文字列 T、t、L、l は非推奨です (GH 52536)
.ExtensionArray.fillna の "method" および "limit" キーワードは非推奨です。代わりに _pad_or_backfill を実装してください (GH 53621)
DataFrame.replace() および Series.replace() の method および limit キーワードは非推奨です (GH 33302)
Series.fillna()、DataFrame.fillna()、SeriesGroupBy.fillna()、DataFrameGroupBy.fillna()、および Resampler.fillna() の method および limit キーワードは非推奨です。代わりに obj.bfill() または obj.ffill() を使用してください (GH 53394)
浮動小数点 dtype インデックスを持つオブジェクトに対する整数スライスでの Series.__getitem__()、Series.__setitem__()、DataFrame.__getitem__()、DataFrame.__setitem__() の動作は非推奨です。将来のバージョンでは、これは *位置* インデックス付けとして扱われます (GH 49612)
pandas.array() でサポートされていない datetime64 および timedelta64 解像度の使用は非推奨です。サポートされている解像度は、「s」、「ms」、「us」、「ns」解像度です (GH 53058)
Series.interpolate() および DataFrame.interpolate() の値 "pad"、"ffill"、"bfill"、"backfill" は非推奨です。代わりに obj.ffill() または obj.bfill() を使用してください (GH 53581)
Index.argmax()、Index.argmin()、Series.argmax()、Series.argmin() の動作で、すべてNAかつ skipna=True の場合、または任意のNAかつ skipna=False の場合に -1 を返すのは非推奨です。将来のバージョンでは ValueError が発生します (GH 33941、GH 33942)
DataFrame.to_sql() で name と con 以外の非キーワード引数を許可することは非推奨です (GH 54229)
DataFrame.shift()、Series.shift()、および DataFrameGroupBy.shift() に freq と fill_value の両方を渡した場合に、fill_value が暗黙的に無視される動作は非推奨です。将来のバージョンでは ValueError が発生します (GH 53832)

パフォーマンス改善#

同種の np.float64 または np.float32 dtype を持つ concat() のパフォーマンスが向上しました (GH 52685)
文字列を含まないオブジェクト列に対する factorize() のパフォーマンスが向上しました (GH 51921)
リモート URI ファイルパスを読み込む際の read_orc() のパフォーマンスが向上しました (GH 51609)
engine="pyarrow" でリモートファイルを読み込む際の read_parquet() および DataFrame.to_parquet() のパフォーマンスが向上しました (GH 51609)
use_nullable_dtypes=True を使用した場合の文字列列に対する read_parquet() のパフォーマンスが向上しました (GH 47345)
DataFrame.clip() および Series.clip() のパフォーマンスが向上しました (GH 51472)
items が与えられた場合の DataFrame.filter() のパフォーマンスが向上しました (GH 52941)
拡張配列 dtype に対する DataFrame.first_valid_index() および DataFrame.last_valid_index() のパフォーマンスが向上しました (GH 51549)
cond が拡張 dtype に対応している場合の DataFrame.where() のパフォーマンスが向上しました (GH 51574)
verify_integrity=True の場合の MultiIndex.set_levels() および MultiIndex.set_codes() のパフォーマンスが向上しました (GH 51873)
ascending がリストである場合の MultiIndex.sortlevel() のパフォーマンスが向上しました (GH 51612)
Series.combine_first() のパフォーマンスが向上しました (GH 51777)
配列がnullを含まない場合の fillna() のパフォーマンスが向上しました (GH 51635)
配列がゼロのnullまたはすべてのnullである場合の isna() のパフォーマンスが向上しました (GH 51630)
文字列を boolean[pyarrow] dtype にパースする際のパフォーマンスが向上しました (GH 51730)
他のインデックスからスライスされた Index を検索する際のパフォーマンスが向上しました (GH 51738)
concat() のパフォーマンスが向上しました (GH 52291、GH 52290)
Period のデフォルトフォーマッタ (period_format) は大幅に (約2倍) 高速化されました。これにより、str(Period)、repr(Period)、Period.strftime(fmt=None)() のパフォーマンスが向上し、.PeriodArray.strftime(fmt=None)、.PeriodIndex.strftime(fmt=None)、.PeriodIndex.format(fmt=None) も改善されました。デフォルトの date_format を持つ PeriodArray または PeriodIndex を含む to_csv 操作も大幅に高速化されました (GH 51459)
arrays.IntegerArrays.dtype と arrays.FloatingArray.dtype へのアクセスパフォーマンスが向上しました (GH 52998)
engine="numba" を使用した DataFrameGroupBy/SeriesGroupBy 集計 (例: DataFrameGroupBy.sum()) のパフォーマンスが向上しました (GH 53731)
axis=1 と拡張 dtype を持つ DataFrame リダクションのパフォーマンスが向上しました (GH 54341)
axis=None と拡張 dtype を持つ DataFrame リダクションのパフォーマンスが向上しました (GH 54308)
インデックス/列の値がすでにソートされている場合の MultiIndex および複数列操作 (例: DataFrame.sort_values()、DataFrame.groupby()、Series.unstack()) のパフォーマンスが向上しました (GH 53806)
Series リダクションのパフォーマンスが向上しました (GH 52341)
axis=1 でオブジェクトのインデックスが異なる場合の concat() のパフォーマンスが向上しました (GH 52541)
連結軸が MultiIndex である場合の concat() のパフォーマンスが向上しました (GH 53574)
PyArrow バックアップの文字列に対する merge() のパフォーマンスが向上しました (GH 54443)
engine="c" を使用した read_csv() のパフォーマンスが向上しました (GH 52632)
ArrowExtensionArray.to_numpy() のパフォーマンスが向上しました (GH 52525)
DataFrameGroupBy.groups() のパフォーマンスが向上しました (GH 53088)
dtype が拡張 dtype である場合の DataFrame.astype() のパフォーマンスが向上しました (GH 54299)
入力が単一の整数で、DataFrame が拡張 dtype でバックアップされている場合の DataFrame.iloc() のパフォーマンスが向上しました (GH 54508)
拡張 dtype の DataFrame.isin() のパフォーマンスが向上しました (GH 53514)
行と列を選択する場合の DataFrame.loc() のパフォーマンスが向上しました (GH 53014)
単一の PyArrow dtype を持つ DataFrame を転置する際の DataFrame.transpose() のパフォーマンスが向上しました (GH 54224)
単一のマスクされた dtype (例: Int64) を持つ DataFrame を転置する際の DataFrame.transpose() のパフォーマンスが向上しました (GH 52836)
PyArrow 文字列およびバイナリ dtype に対する Series.add() のパフォーマンスが向上しました (GH 53150)
拡張 dtype に対する Series.corr() および Series.cov() のパフォーマンスが向上しました (GH 52502)
ArrowDtype に対する Series.drop_duplicates() のパフォーマンスが向上しました (GH 54667)。
PyArrow dtype を使用した Series.ffill()、Series.bfill()、DataFrame.ffill()、DataFrame.bfill() のパフォーマンスが向上しました (GH 53950)
PyArrow バックアップの文字列に対する Series.str.get_dummies() のパフォーマンスが向上しました (GH 53655)
PyArrow バックアップの文字列に対する Series.str.get() のパフォーマンスが向上しました (GH 53152)
PyArrow バックアップの文字列に対して expand=True を使用した場合の Series.str.split() のパフォーマンスが向上しました (GH 53585)
dtype が NumPy 浮動小数点 dtype で na_value が np.nan である場合の Series.to_numpy() のパフォーマンスが向上しました (GH 52430)
PyArrow のタイムスタンプまたは期間 dtype から NumPy に変換する際の astype() のパフォーマンスが向上しました (GH 53326)
さまざまな MultiIndex セットおよびインデックス操作のパフォーマンスが向上しました (GH 53955)
不要な検証を回避することで、arrays.IntegerArray および arrays.FloatingArray での様々な再整形操作のパフォーマンスが向上しました (GH 53013)
PyArrow タイムスタンプおよび期間 dtype を使用したインデックス作成のパフォーマンスが向上しました (GH 53368)
配列を RangeIndex.take()、DataFrame.loc()、または DataFrame.iloc() に渡す場合、および DataFrame が RangeIndex を使用している場合のパフォーマンスが向上しました (GH 53387)

バグ修正#

カテゴリカル#

CategoricalIndex.remove_categories() で、順序付けられたカテゴリが維持されないバグを修正しました (GH 53935)。
読み取り専用の null 値マスクを持つ nullable 配列に対して dtype="category" を使用した Series.astype() のバグを修正しました (GH 53658)
Series.map() のバグで、シリーズが Categorical を保持している場合に na_action パラメータの値が使用されない問題を修正しました (GH 22527)。

日付時刻ライク#

na_action="ignore" を使用した DatetimeIndex.map() が期待通りに動作するようになりました (GH 51644)
DatetimeIndex.slice_indexer() は、スライス境界のいずれかがインデックスにない非単調インデックスに対して KeyError を発生させるようになりました。この動作は以前非推奨でしたが、一貫して処理されていませんでした (GH 53983)
DateOffset オブジェクトを定数で乗算したときに一貫性のない動作をする DateOffset のバグを修正しました (GH 47953)
freq が nanoseconds を持つ DateOffset であった場合の date_range() のバグを修正しました (GH 46877)
to_datetime() が PyArrow タイムスタンプの arrays.ArrowExtensionArray を含む Series または DataFrame を NumPy datetime に変換する際のバグを修正しました (GH 52545)
DatetimeArray.map() および DatetimeIndex.map() のバグで、指定された呼び出し可能オブジェクトが要素ごとではなく配列全体で動作する問題を修正しました (GH 51977)
PyArrow バックアップの日付のような dtype に対して DataFrame.to_sql() が ValueError を発生させるバグを修正しました (GH 53854)
Timestamp.date()、Timestamp.isocalendar()、Timestamp.timetuple()、および Timestamp.toordinal() が、Python 標準ライブラリの datetime モジュールでサポートされている範囲外の入力に対して誤った結果を返すバグを修正しました (GH 53668)
Timestamp.round() のバグで、実装境界に近い値が OutOfBoundsDatetime を発生させる代わりに誤った結果を返す問題を修正しました (GH 51494)
datetime または timedelta スカラーから Series または DataFrame を構築する際に、入力から推論するのではなく常にナノ秒解像度を推論するバグを修正しました (GH 52212)
日付なしの時間を表す文字列から Timestamp を構築する際に、誤った単位を推論するバグを修正しました (GH 54097)
ts_input=pd.NA で Timestamp を構築する際に TypeError が発生するバグを修正しました (GH 45481)
曜日があるが日がない datetime 文字列 (例: "2023 Sept Thu") をパースする際に、誤って ValueError ではなく AttributeError が発生するバグを修正しました (GH 52659)
dtype がタイムゾーン対応の datetime でナノ秒以外の解像度を持つ場合に、Series の repr で OutOfBoundsDatetime が発生するバグを修正しました (GH 54623)

Timedelta#

TimedeltaIndex の除算または乗算で、.freq が None ではなく「0 Days」になるバグを修正しました (GH 51575)
NumPy timedelta64 オブジェクトを持つ Timedelta が適切に ValueError を発生させないバグを修正しました (GH 52806)
to_timedelta() が pyarrow.duration の ArrowDtype を含む Series または DataFrame を NumPy timedelta64 に変換する際のバグを修正しました (GH 54298)
Timedelta.__hash__() のバグで、特定の大きな秒解像度の値で OutOfBoundsTimedelta が発生する問題を修正しました (GH 54037)
Timedelta.round() のバグで、実装境界に近い値が OutOfBoundsTimedelta を発生させる代わりに誤った結果を返す問題を修正しました (GH 51494)
na_action="ignore" を使用した TimedeltaIndex.map() のバグを修正しました (GH 51644)
arrays.TimedeltaArray.map() および TimedeltaIndex.map() のバグで、指定された呼び出し可能オブジェクトが要素ごとではなく配列全体で動作する問題を修正しました (GH 51977)

タイムゾーン#

タイムゾーン対応のタイムスタンプの Series に対して infer_freq() が TypeError を発生させるバグを修正しました (GH 52456)
DatetimeTZDtype.base() が常にナノ秒解像度の NumPy dtype を返すバグを修正しました (GH 52705)

数値#

RangeIndex が数値から減算されたときに step を誤って設定するバグを修正しました (GH 53255)
マスクされた dtype に対して Series.corr() および Series.cov() が AttributeError を発生させるバグを修正しました (GH 51422)
Series.kurt() および Series.skew() を、すべてゼロの NumPy データに対して呼び出すと、NumPy 型ではなく Python 型が返されるバグ (GH 53482)
Series.mean()、DataFrame.mean() で、数値に変換できる文字列 (例: "2") を含む object-dtype 値が不正な数値結果を返すバグ。これらの関数は TypeError を発生するようになりました (GH 36703, GH 44008)
DataFrame.corrwith() が PyArrow バックエンドの dtypes に対して NotImplementedError を発生するバグ (GH 52314)
DataFrame.size() および Series.size() が Python int ではなく 64 ビット整数を返すバグ (GH 52897)
DateFrame.dot() が ArrowDtype データに対して object dtype を返すバグ (GH 53979)
Series.any(), Series.all(), DataFrame.any(), DataFrame.all() で、bool_only のデフォルト値が False ではなく None に設定されていたバグ。この変更はユーザーに影響を与えないはずです (GH 53258)
マスクされた dtype に対して Series.corr() および Series.cov() が AttributeError を発生させるバグを修正しました (GH 51422)
Series.median() および DataFrame.median() で、数値に変換できる文字列 (例: "2") を含む object-dtype 値が不正な数値結果を返すバグ。これらの関数は TypeError を発生するようになりました (GH 34671)
Series.sum() が dtype uint64 を int64 に変換するバグ (GH 53401)

変換#

DataFrame.style.to_latex() および DataFrame.style.to_html() で、DataFrame が浮動小数点倍精度で表現できる桁数よりも多い桁数を持つ整数を含んでいる場合に発生するバグ (GH 52272)
array() で、単位が "s"、"us"、または "ms" の datetime64 または timedelta64 dtype が指定された場合、DatetimeArray または TimedeltaArray ではなく NumpyExtensionArray が返されるバグ (GH 52859)
array() で、空のリストと dtype が指定されなかった場合、FloatingArray ではなく NumpyExtensionArray が返されるバグ (GH 54371)
ArrowDtype.numpy_dtype() が、ナノ秒単位ではない pyarrow.timestamp および pyarrow.duration 型に対してナノ秒単位を返すバグ (GH 51800)
DataFrame.__repr__() が、列の dtype が np.record の場合に TypeError を誤って発生するバグ (GH 48526)
DataFrame.info() が use_numba が設定されている場合に ValueError を発生するバグ (GH 51922)
DataFrame.insert() が loc が np.int64 の場合に TypeError を発生するバグ (GH 53193)
HDFStore.select() が、大きな整数を格納して取得する際に精度を失うバグ (GH 54186)
Series.astype() が object_ をサポートしないバグ (GH 54251)

文字列#

Series.str() が反復されたときに TypeError を発生しなかったバグ (GH 54173)
文字列 dtype の列を持つ DataFrame` の repr のバグ (GH 54797)

Interval#

IntervalIndex.get_indexer() および IntervalIndex.get_indexer_nonunique() が target が読み取り専用配列の場合に発生するバグ (GH 53703)
IntervalDtype で、オブジェクトが削除されたときに生き残る可能性があったバグ (GH 54184)
interval_range() で、float 型の step が浮動小数点アーティファクトから不正な間隔を生成するバグ (GH 54477)

インデックス付け#

DataFrame.__setitem__() が、重複する列に DataFrame を設定する際に dtype を失うバグ (GH 53143)
DataFrame.__setitem__() でブールマスクを使用し、DataFrame.putmask() で混合された非数値 dtype と NaN 以外の値を使用すると、誤って TypeError が発生するバグ (GH 53291)
DataFrame.iloc() で、唯一の要素として nan を使用した場合のバグ (GH 52234)
Series.loc() が、定義済みインデックスの object dtype の Series に Series を割り当てる際に、Series を np.dnarray にキャストするバグ (GH 48933)

欠損値#

DataFrame.interpolate() が、method が "pad", "ffill", "bfill", または "backfill" の場合にデータを埋められないバグ (GH 53898)
DataFrame.interpolate() が、DataFrame が空の場合に inplace を無視するバグ (GH 53199)
Series.idxmin(), Series.idxmax(), DataFrame.idxmin(), DataFrame.idxmax() で、NaT を含む DatetimeIndex インデックスを使用した場合に、誤って NaT ではなく NaN が返されるバグ (GH 43587)
Series.interpolate() および DataFrame.interpolate() が、無効な downcast キーワード ( None または "infer" のみ可能) に対してエラーを発生しないバグ (GH 53103)
Series.interpolate() および DataFrame.interpolate() で、複雑な dtype の場合に NaN エントリを埋められないバグ (GH 53635)

MultiIndex#

MultiIndex.set_levels() が Categorical の dtypes を保持しないバグ (GH 52125)
長い要素を持つ MultiIndex を表示する際のバグ (GH 52960)

I/O#

DataFrame.to_orc() が、デフォルト以外の Index が与えられた場合に ValueError を発生するようになりました (GH 51828)
DataFrame.to_sql() が、SQLAlchemy を使用して接続する際に name パラメータが空の場合に ValueError を発生するようになりました (GH 52675)
json_normalize() がメタデータフィールドのリスト型を解析できなかったバグ (GH 37782)
read_csv() で、parse_dates がリストまたは辞書に設定され、engine="pyarrow" が使用された場合にエラーが発生するバグ (GH 47961)
read_csv() で、engine="pyarrow" と index_col を指定して dtype を指定した場合にエラーが発生するバグ (GH 53229)
read_hdf() が IndexError が発生した後、ストアを適切に閉じないバグ (GH 52781)
read_html() で、スタイル要素が DataFrame に読み込まれるバグ (GH 52197)
read_html() で、display:none スタイルを含む要素とともに末尾のテキストが削除されるバグ (GH 51629)
read_sql_table() がビューを読み込む際に例外を発生するバグ (GH 52969)
read_sql() で、同じ列名を持つ複数のタイムゾーン対応列を読み込む場合のバグ (GH 44421)
read_xml() が文字列データの空白を削除するバグ (GH 53811)
DataFrame.to_html() で、マルチインデックス列の場合に colspace が誤って適用されるバグ (GH 53885)
DataFrame.to_html() で、複雑な dtype を持つ空の DataFrame の変換が ValueError を発生するバグ (GH 54167)
DataFrame.to_json() で、ナノ秒以外の精度を持つ DateTimeArray/DateTimeIndex が正しくシリアライズできないバグ (GH 53686)
空の Stata dta ファイルを書き込み、読み込む際に dtype 情報が失われるバグ (GH 46240)
bz2 が必須要件として扱われていたバグ (GH 53857)

期間#

PeriodDtype コンストラクタが、引数が渡されなかった場合や None が渡された場合に TypeError を発生しないバグ (GH 27388)
PeriodDtype コンストラクタが、異なる DateOffset freq 入力に対して同じ normalize を誤って返すバグ (GH 24121)
PeriodDtype コンストラクタが、無効な型が渡された場合に TypeError ではなく ValueError を発生するバグ (GH 51790)
PeriodDtype で、オブジェクトが削除されたときに生き残る可能性があったバグ (GH 54184)
read_csv() で、engine="pyarrow" の場合に空文字列を null 値として処理しないバグ (GH 52087)
read_csv() で、engine="pyarrow" の場合に、すべての列が null の場合に float64 dtype の列ではなく object dtype の列を返すバグ (GH 52087)
Period.now() が freq パラメータをキーワード引数として受け入れないバグ (GH 53369)
PeriodIndex.map() で na_action="ignore" を使用した場合のバグ (GH 51644)
arrays.PeriodArray.map() および PeriodIndex.map() で、指定された呼び出し可能オブジェクトが要素ごとではなく配列ごとに動作するバグ (GH 51977)
CustomBusinessDay freq を持つ Period または PeriodDtype の構築を誤って許可していたバグ。代わりに BusinessDay を使用してください (GH 52534)

プロット#

Series.plot() で color=None が指定された場合のバグ (GH 51953)
DataFrame.plot.scatter() で c="b" が指定された場合の UserWarning を修正しました (GH 53908)

Groupby/resample/rolling#

DataFrameGroupBy.idxmin(), SeriesGroupBy.idxmin(), DataFrameGroupBy.idxmax(), SeriesGroupBy.idxmax() が、空の DataFrameGroupBy または SeriesGroupBy で使用された場合に誤った dtype を返すバグ (GH 51423)
DataFrame.groupby.rank() で、na_option="bottom" または na_option="top" を渡した場合にヌル許容データ型に対して発生するバグ (GH 54206)
DataFrame.resample() および Series.resample() で、TimedeltaIndex でリサンプリングする際に、非固定の freq を誤って許可するバグ (GH 51896)
DataFrame.resample() および Series.resample() で、空のデータをリサンプリングする際にタイムゾーンを失うバグ (GH 53664)
DataFrame.resample() および Series.resample() で、軸の範囲外の値の場合に origin がリサンプリングに影響を与えないバグ (GH 53662)
重み付き移動集計で min_periods=0 を指定した場合のバグ (GH 51449)
DataFrame.groupby() および Series.groupby() で、グループ化された Series または DataFrame のインデックスが DatetimeIndex, TimedeltaIndex または PeriodIndex であり、groupby メソッドの最初の引数に関数が与えられた場合に、その関数がインデックスの各要素ではなくインデックス全体に対して動作するバグ (GH 51979)
DataFrameGroupBy.agg() でリストを使用した場合に as_index=False が尊重されないバグ (GH 52849)
DataFrameGroupBy.apply() で、入力 DataFrame が groupby 後に DataFrame としてサブセット化され ( [['a']] であり ['a'] ではない)、与えられた呼び出し可能オブジェクトがすべて同じようにインデックス付けされていない Series を返した場合にエラーが発生するバグ (GH 52444)
DataFrameGroupBy.apply() で、複数の列を選択し、np.ndarray 結果を返す関数を指定した場合に TypeError が発生するバグ (GH 18930)
DataFrameGroupBy.groups() および SeriesGroupBy.groups() で、日付時刻キーと別のキーを組み合わせて使用すると、グループキーの数が誤って生成されるバグ (GH 51158)
DataFrameGroupBy.quantile() および SeriesGroupBy.quantile() が、sort=False の場合に結果インデックスを暗黙的にソートする可能性があるバグ (GH 53009)
SeriesGroupBy.size() で、ArrowDtype またはマスクされた dtypes (例: Int64) を持つデータの場合に dtype が np.int64 になるバグ (GH 53831)
DataFrame.groupby() で、グループ化オブジェクトに対する列選択が、単一要素からなるリストでグループ化した場合に名前をタプルとして返さないバグ (GH 53500)
DataFrameGroupBy.var() および SeriesGroupBy.var() が、datetime64, timedelta64 または PeriodDtype 値で呼び出された場合に TypeError を発生しないバグ (GH 52128, GH 53045)
DataFrameGroupBy.resample() で、kind="period" の場合に AttributeError が発生するバグ (GH 24103)
Resampler.ohlc() で、空のオブジェクトが空の DataFrame ではなく Series を返すバグ (GH 42902)
SeriesGroupBy.count() および DataFrameGroupBy.count() で、ArrowDtype またはマスクされた dtypes (例: Int64) を持つデータの場合に dtype が np.int64 になるバグ (GH 53831)
SeriesGroupBy.nth() および DataFrameGroupBy.nth() で、dropna="any" または dropna="all" を使用して列選択を実行した後で列がサブセット化されないバグ (GH 53518)
SeriesGroupBy.nth() および DataFrameGroupBy.nth() で、dropna="any" または dropna="all" を使用して列選択を実行した後に、行がドロップされるバグ (GH 53518)
SeriesGroupBy.sum() および DataFrameGroupBy.sum() が np.inf + np.inf および (-np.inf) + (-np.inf) をそれぞれ np.inf および -np.inf ではなく np.nan に合計するバグ (GH 53606)
Series.groupby() で、グループ化された Series が DatetimeIndex インデックスを持ち、名前が月の Series が by 引数に与えられた場合にエラーが発生するバグ (GH 48509)

再整形#

concat() が、1つの列が pa.null() dtype を持つ場合に object dtype に強制変換するバグ (GH 53702)
crosstab() で、dropna=False の場合に結果に np.nan が保持されないバグ (GH 10772)
melt() で、variable 列が拡張 dtypes を失うバグ (GH 54297)
merge_asof() が拡張 dtypes に対して KeyError を発生するバグ (GH 52904)
merge_asof() が、読み取り専用 ndarray でバックアップされたデータに対して ValueError を発生するバグ (GH 53513)
merge_asof() で、left_index=True または right_index=True と、一致しないインデックス dtype を使用した場合に、MergeError を発生する代わりに一部のケースで誤った結果を返すバグ (GH 53870)
merge() で、整数 ExtensionDtype と浮動小数点 NumPy dtype でマージする際に TypeError が発生するバグ (GH 46178)
DataFrame.agg() および Series.agg() で、一意でない列に対して dict-like 引数が渡された場合に不正な型を返すバグ (GH 51099)
DataFrame.combine_first() が other が空の場合に他の列を無視するバグ (GH 53792)
DataFrame.idxmin() および DataFrame.idxmax() で、空のフレームの場合に軸の dtype が失われるバグ (GH 53265)
DataFrame.merge() で、単一レベルの MultiIndex を持つ場合に正しくマージされないバグ (GH 52331)
DataFrame.stack() が、列が MultiIndex であり、フレームが混合された dtypes を含む場合に拡張 dtypes を失うバグ (GH 45740)
DataFrame.stack() が列を辞書順にソートするバグ (GH 53786)
DataFrame.transpose() がオブジェクト列の dtype を推測するバグ (GH 51546)
Series.combine_first() が int64 dtype を float64 に変換し、非常に大きな整数で精度を失うバグ (GH 51764)
空の DataFrame オブジェクトを結合する際に、結合されたインデックスが結合されたインデックス型ではなく RangeIndex になるバグ (GH 52777)

スパース#

SparseDtype コンストラクタが、そのサブタイプ (NumPy dtype である必要がある) に互換性のない dtype が与えられた場合に TypeError を発生しないバグ (GH 53160)
arrays.SparseArray.map() が、fill 値を sparse 値に含めることを許可していたバグ (GH 52095)

ExtensionArray#

ArrowStringArray コンストラクタが、文字列の辞書型で ValueError を発生するバグ (GH 54074)
DataFrame コンストラクタが、dict で与えられた場合に拡張 dtype を持つ Series をコピーしないバグ (GH 53744)
ArrowExtensionArray が、pandas のナノ秒以外の時間オブジェクトを非ゼロ値からゼロ値に変換するバグ (GH 53171)
Series.quantile() で、PyArrow の時間型に対して ArrowInvalid を発生するバグ (GH 52678)
Series.rank() で、Float64 dtype の小さな値に対して誤った順序を返すバグ (GH 52471)
Series.unique() で、NA 値を持つブール型 ArrowDtype に対して発生するバグ (GH 54667)
__iter__() および __getitem__() が、ナノ秒以外の dtype に対して python の datetime および timedelta オブジェクトを返すバグ (GH 53326)
factorize() が、複数のチャンクを持つ pyarrow.dictionary 型 pyarrow.chunked_array に対して不正なユニーク値を返すバグ (GH 54844)
ExtensionArray サブクラスを dtype キーワードに渡す場合のバグ。これはインスタンスを渡すことを推奨するために UserWarning を発生するようになりました (GH 31356, GH 54592)
DataFrame の repr が、列に pyarrow.ExtensionDtype を持つ ArrowDtype がある場合に機能しないバグ (GH 54063)
マスクされた ExtensionDtypes (例: Float64Dtype, BooleanDtype) の __from_arrow__ メソッドが、pyarrow.null() 型の PyArrow 配列を受け入れないバグ (GH 52223)

Styler#

Styler._copy() が、Styler のサブクラスでオーバーライドされたメソッドを呼び出すバグ (GH 52728)

メタデータ#

DataFrame.max(), DataFrame.min(), DataFrame.prod(), DataFrame.mean(), Series.mode(), DataFrame.median(), DataFrame.sem(), DataFrame.skew(), DataFrame.kurt() でのメタデータ伝播を修正しました (GH 28283)
DataFrame.squeeze() および DataFrame.describe() でのメタデータ伝播を修正しました (GH 28283)
DataFrame.std() でのメタデータ伝播を修正しました (GH 28283)

その他#

FloatingArray.__contains__ で、NaN 値が存在する場合に NaN アイテムが誤って False を返すバグ (GH 52840)
DataFrame および Series で、NaN 値が存在する場合に複雑な dtype のデータに対してエラーが発生するバグ (GH 53627)
DatetimeIndex で、時間が深夜で、日ベースではない freq を持つインデックスの repr が時間を表示しないバグ (GH 53470)
testing.assert_frame_equal() および testing.assert_series_equal() が、2つの異なるセットに対してアサーションエラーを発生するようになりました (GH 51727)
testing.assert_frame_equal() が、インデックスタイプをチェックしないように要求された場合でもカテゴリ dtype をチェックするバグ (GH 52126)
api.interchange.from_dataframe() が allow_copy 引数を尊重しないバグ (GH 54322)
api.interchange.from_dataframe() が、null 値を含む非pandas tz-aware データから交換する際に発生するバグ (GH 54287)
api.interchange.from_dataframe() で、空の DataFrame オブジェクトを変換する際のバグ (GH 53155)
from_dummies() で、結果の Index が元の Index と一致しないバグ (GH 54300)
from_dummies() で、結果のデータが列の dtype ではなく常に object dtype になるバグ (GH 54300)
DataFrameGroupBy.first(), DataFrameGroupBy.last(), SeriesGroupBy.first(), および SeriesGroupBy.last() で、空のグループが対応する ExtensionArray NA 値ではなく np.nan を返すバグ (GH 39098)
DataFrame.pivot_table() で、int の平均を int にキャストし直すバグ (GH 16676)
DataFrame.reindex() で、ExtensionDtype で推測されるべき fill_value が誤って object dtype を推測するバグ (GH 52586)
DataFrame.shift() で、単一の ExtensionDtype 列を持つ DataFrame に対して axis=1 を使用した場合に不正な結果を返すバグ (GH 53832)
keyが渡された際のIndex.sort_values()のバグ (GH 52764)
method=”asfreq”が指定されたときに正しくエラーを発生させないSeries.align()、DataFrame.align()、Series.reindex()、DataFrame.reindex()、Series.interpolate()、DataFrame.interpolate()のバグ (GH 53620)
無効なaxisが渡されたときにエラーを発生させないSeries.argsort()のバグ (GH 54257)
空のシリーズに関数を渡した際に、返されるシリーズのdtypeがobjectになっていたSeries.map()のバグ。現在は元のdtypeを保持するようになった (GH 52384)
deep=Trueの場合に、オブジェクトのSeriesでエラーを発生させ、GC補正を考慮しないため返される値が正しくないSeries.memory_usage()のバグ (GH 51858)
period_range()で、freqが引数として渡されなかった場合のデフォルトの挙動が誤っていた (GH 53687)
pandas._libs.jsonの誤った__name__属性を修正 (GH 52898)

貢献者#

このリリースには合計266人がパッチを寄稿しました。名前の横に「+」が付いている人は、初めてパッチを寄稿しました。

AG +
Aarni Koskela
Adrian D’Alessandro +
Adrien RUAULT +
Ahmad +
Aidos Kanapyanov +
Alex Malins
Alexander Seiler +
Ali Asgar +
Allison Kwan
Amanda Bizzinotto +
Andres Algaba +
Angela Seo +
Anirudh Hegde +
Antony Evmorfopoulos +
Anushka Bishnoi
ArnaudChanoine +
Artem Vorobyev +
Arya Sarkar +
Ashwin Srinath
Austin Au-Yeung +
Austin Burnett +
Bear +
Ben Mangold +
Bernardo Gameiro +
Boyd Kane +
Brayan Alexander Muñoz B +
Brock
Chetan0402 +
Chris Carini
ChristofKaufmann
Clark-W +
Conrad Mcgee Stocks
Corrie Bartelheimer +
Coulton Theuer +
D067751 +
ダニエル・アイザック
Daniele Nicolodi +
David Samuel +
David Seifert +
Dea Leon +
Dea María Léon
Deepyaman Datta
Denis Sapozhnikov +
Dharani Akurathi +
DimiGrammatikakis +
Dirk Ulbricht +
Dmitry Shemetov +
Dominik Berger
Efkan S. Goktepe +
Ege Özgüroğlu
Eli Schwartz
Erdi +
Fabrizio Primerano +
Facundo Batista +
ファンチェン・リー
Felipe Maion +
Francis +
Future Programmer +
Gabriel Kabbe +
Gaétan Ramet +
Gianluca Ficarelli
Godwill Agbehonou +
Guillaume Lemaitre
Guo Ci
Gustavo Vargas +
Hamidreza Sanaee +
HappyHorse +
Harald Husum +
Hugo van Kemenade
Ido Ronen +
アーブ・ラスティッグ
JHM ダービーシャー
JHM ダービーシャー (iMac)
JJ +
Jarrod Millman
Jay +
ジェフ・リーバック
Jessica Greene +
Jiawei Zhang +
Jinli Xiao +
Joanna Ge +
Jona Sassenhagen +
ヨナス・ハーグ
Joris Van den Bossche
Joshua Shew +
Julian Badillo
Julian Ortiz +
Julien Palard +
Justin Tyson +
Justus Magin
Kabiir Krishna +
Kang Su Min
Ketu Patel +
Kevin +
Kevin Anderson
Kevin Jan Anker
Kevin Klein +
ケビン・シェパード
Kostya Farber
LM +
Lars Lien Ankile +
Lawrence Mitchell
Liwei Cai +
Loic Diridollou
Luciana Solorzano +
Luke Manley
Lumberbot (aka Jack)
Marat Kopytjuk +
Marc Garcia
Marco Edward Gorelli
MarcoGorelli
Maria Telenczuk +
MarvinGravert +
Mateusz Sokół +
Matt Richards
Matthew Barber +
Matthew Roeschke
Matus Valo +
Mia Reimer +
Michael Terry +
Michael Tiemann +
Milad Maani Jou +
Miles Cranmer +
MirijaH +
Miyuu +
Natalia Mokeeva
Nathan Goldbaum +
Nicklaus Roach +
Nicolas Camenisch +
Nikolay Boev +
Nirav
Nishu Choudhary
ノア・タミール
Noy Hanan +
Numan +
Numan Ijaz +
Omar Elbaz +
Pandas Development Team
パーフェイト・ガサナ
Parthi
Patrick Hoefler
Patrick Schleiter +
Pawel Kranzberg +
Philip
Philip Meier +
Pranav Saibhushan Ravuri
PrathumP +
Rahul Siloniya +
Rajasvi Vinayak +
Rajat Subhra Mukherjee +
Ralf Gommers
RaphSku
Rebecca Chen +
Renato Cotrim Maciel +
Reza (Milad) Maanijou +
Richard Shadrach
Rithik Reddy +
Robert Luce +
Ronalido +
Rylie Wei +
SOUMYADIP MAL +
Sanjith Chockan +
Sayed Qaiser Ali +
Scott Harp +
Se +
Shashwat Agrawal
Simar Bassi +
Simon Brugman +
Simon Hawkins
Simon Høxbro Hansen
Snorf Yang +
Sortofamudkip +
Stefan Krawczyk
ステファニー・モリン
Stefanie Senger
Stelios Petrakis +
スティン・ヴァン・ホーイ
スヴェン
Sylvain MARIE
シルヴァン・マリー
テルジ・ピーターセン
ティエリー・モワザン
Thomas
トーマス・A・キャスウェル
トーマス・グレンジャー
Thomas Li
Thomas Vranken +
Tianye Song +
Tim Hoffmann
Tim Loderhose +
Tim Swast
Timon Jurschitsch +
Tolker-KU +
Tomas Pavlik +
Toroi +
トルステン・ヴェルトワイン
Travis Gibbs +
Umberto Fasci +
Valerii +
VanMyHu +
Victor Momodu +
Vijay Vaidyanathan +
VomV +
ウィリアム・アンドレア
ウィリアム・エイド
Wolf Behrenhoff +
Xiao Yuan
Yao Xiao
Yasin Tatar
Yaxin Li +
Yi Wei +
Yulia +
Yusharth Singh +
Zach Breger +
Zhengbo Wang
abokey1 +
ahmad2901 +
assafam +
auderson
august-tengland +
bunardsheng +
cmmck +
cnguyen-03 +
coco +
dependabot[bot]
giplessis +
github-actions[bot]
gmaiwald +
gmollard +
jbrockmendel
kathleenhang
kevx82 +
lia2710 +
liang3zy22 +
ltartaro +
lusolorz +
m-ganko +
mKlepsch +
mattkeanny +
mrastgoo +
nabdoni +
omar-elbaz +
paulreece +
penelopeysm +
potap75 +
pre-commit-ci[bot] +
raanasn +
raj-thapa +
ramvikrams +
レベッカ-パーマー
reddyrg1 +
rmhowe425 +
segatrade +
shteken +
sweisss +
taytzehao
tntmatthews +
tpaxman +
tzehaoo +
v-mcoutinho +
wcgonzal +
yonashub
yusharth +
Ádám Lippai
Štěpán Műller +

2.1.0 の新機能 (2023 年 8 月 30 日)#

機能強化#

PyArrow は pandas 3.0 で必須の依存関係になります#

デフォルトで文字列に NumPy object dtype を使用しないようにします#

DataFrame の削減は拡張 dtype を保持します#

コピーオンライトの改善#

新しい DataFrame.map() メソッドと ExtensionArray のサポート#

DataFrame.stack() の新しい実装#

その他の機能強化#

下位互換性のない API の変更#

Python の最小バージョンが引き上げられました#

依存関係の最小バージョン引き上げ#

その他の API の変更#

非推奨#

setitem-like Series 操作でのサイレントアップキャストは非推奨になりました#

混合タイムゾーンを持つ日付時刻の解析は非推奨になりました#

その他の非推奨事項#

パフォーマンス改善#

バグ修正#

カテゴリカル#

日付時刻ライク#

Timedelta#

タイムゾーン#

数値#

変換#

文字列#

Interval#

インデックス付け#

欠損値#

MultiIndex#

I/O#

期間#

プロット#

Groupby/resample/rolling#

再整形#

スパース#

ExtensionArray#

Styler#

メタデータ#

その他#

貢献者#

新しい `DataFrame.map()` メソッドと ExtensionArray のサポート#

`DataFrame.stack()` の新しい実装#