1.0.2 の新機能 (2020年3月12日)#

これらは pandas 1.0.2 での変更点です。pandas の他のバージョンを含む完全な変更履歴については、リリースノートを参照してください。

修正されたリグレッション#

グループ化

I/O

  • read_csv() で、特定のファイルライクオブジェクトで encoding オプションが認識されていなかった回帰を修正しました (GH 31819)

  • columns キーワード引数が渡された場合の DataFrame.to_excel() での回帰を修正しました (GH 31677)

  • ExcelFile で、関数に渡されたストリームがデストラクタによって閉じられていた回帰を修正しました。 (GH 31467)

  • MultiIndex 列を持つ py27 pickle を読み込む際に read_pickle()UnicodeDecodeError を発生させていた回帰を修正しました (GH 31988)。

再インデックス/アライメント

その他

  • DatetimeIndex または TimedeltaIndex で結合する際に、単純なケースで freq を保持する回帰を修正しました (GH 32166)

  • datetime64 dtype で整数 fill_value を渡した場合の Series.shift() での回帰を修正しました (GH 32591)

  • bool 型と欠損値を持つ object-dtype Index の repr での回帰を修正しました (GH 32146)

ヌル許容ブール配列でのインデックス作成#

以前は NA を含むヌル許容ブール配列でのインデックス作成は ValueError を発生させていましたが、現在は NAFalse として扱われるため許可されています。 (GH 31503)

In [1]: s = pd.Series([1, 2, 3, 4])

In [2]: mask = pd.array([True, True, False, None], dtype="boolean")

In [3]: s
Out[3]: 
0    1
1    2
2    3
3    4
Length: 4, dtype: int64

In [4]: mask
Out[4]: 
<BooleanArray>
[True, True, False, <NA>]
Length: 4, dtype: boolean

pandas 1.0.0-1.0.1

>>> s[mask]
Traceback (most recent call last):
...
ValueError: cannot mask with array containing NA / NaN values

pandas 1.0.2

In [5]: s[mask]
Out[5]: 
0    1
1    2
Length: 2, dtype: int64

バグ修正#

日付時刻ライク

  • タイムゾーンなしおよびタイムゾーン対応の datetime64 dtype で Series.astype() がコピーされなかったバグを修正しました (GH 32490)

  • pd.NA を渡した場合に to_datetime() が発生していたバグを修正しました (GH 32213)

  • 範囲外の Timedelta になる2つの Timestamp を減算する際の改善されたエラーメッセージを修正しました (GH 31774)

カテゴリ

  • ヌル許容整数コードが渡された場合に Categorical.from_codes() が不適切に ValueError を発生させていたバグを修正しました。 (GH 31779)

  • pd.NA を含む numpy 配列が与えられた場合に Categorical() コンストラクタが TypeError を発生させていたバグを修正しました。 (GH 31927)

  • list-liketo_replaceSeries.replace() を呼び出す際に Categorical が無視またはクラッシュしていたバグを修正しました (GH 31720)

I/O

  • DataFrame.to_json()pd.NA を使用すると、空のオブジェクトの代わりに null 値が正しく出力されるようになりました (GH 31615)

  • メタパスの値が反復可能でない場合の pandas.json_normalize() でのバグを修正しました (GH 31507)

  • pandas.NA のピクル化を修正しました。以前は新しいオブジェクトが返され、NA がシングルトンであることに依存する計算が壊れていました (GH 31847)

  • ヌル許容符号なし整数 dtype を使用した parquet のラウンドトリップでのバグを修正しました (GH 31896)。

実験的な dtype

文字列

  • Series.str.repeat()pd.NA を使用すると、ベクトル入力でエラーを発生させる代わりに null 値が正しく出力されるようになりました (GH 31632)

ローリング

  • 減少する時間インデックス上での可変ウィンドウ (時間期間で定義) を持つローリング操作を修正しました (GH 32385)。

貢献者#

このリリースには合計25名がパッチを貢献しました。「+」が付いている人は初めてパッチを貢献しました。

  • Anna Daglis +

  • ダニエル・サクストン

  • アーブ・ラスティッグ

  • Jan Škoda

  • Joris Van den Bossche

  • ジャスティン・ジェン

  • Kaiqi Dong

  • ケンドール・マッセ

  • マルコ・ゴレリ

  • Matthew Roeschke

  • MeeseeksMachine

  • MomIsBestFriend

  • Pandas Development Team

  • Pedro Reys +

  • Prakhar Pandey

  • Robert de Vries +

  • Rushabh Vasani

  • Simon Hawkins

  • スティン・ヴァン・ホーイ

  • テルジ・ピーターセン

  • Tom Augspurger

  • ウィリアム・エイド

  • alimcmaster1

  • ジーエフヤング

  • jbrockmendel