1.0.2 の新機能 (2020年3月12日)#
これらは pandas 1.0.2 での変更点です。pandas の他のバージョンを含む完全な変更履歴については、リリースノートを参照してください。
修正されたリグレッション#
グループ化
DataFrameGroupBy.agg()およびSeriesGroupBy.agg()で、MultiIndex列とカスタム関数を持つフレームで失敗していた回帰を修正しました (GH 31777)groupby(..).rolling(..).apply()(RollingGroupby) で、rawパラメータが無視されていた回帰を修正しました (GH 31754)タイムオフセットを使用した場合の
rolling(..).corr()での回帰を修正しました (GH 31789)NaN値が存在する場合に元の値を変更していたgroupby(..).nunique()での回帰を修正しました (GH 31950)DataFrame.groupbyで内部操作からValueErrorが発生していた回帰を修正しました (GH 31802)DataFrameGroupBy.agg()およびSeriesGroupBy.agg()で、空の入力に対してユーザー指定の関数が余分に呼び出されていた回帰を修正しました (GH 31760)
I/O
read_csv()で、特定のファイルライクオブジェクトでencodingオプションが認識されていなかった回帰を修正しました (GH 31819)columnsキーワード引数が渡された場合のDataFrame.to_excel()での回帰を修正しました (GH 31677)ExcelFileで、関数に渡されたストリームがデストラクタによって閉じられていた回帰を修正しました。 (GH 31467)MultiIndex列を持つ py27 pickle を読み込む際にread_pickle()がUnicodeDecodeErrorを発生させていた回帰を修正しました (GH 31988)。
再インデックス/アライメント
otherがDataFrameでmethodがNoneでない場合のSeries.align()での回帰を修正しました (GH 31785)(タイムゾーン対応)インデックスと
method=nearestで再インデックスする際のDataFrame.reindex()およびSeries.reindex()での回帰を修正しました (GH 26683)DataFrameサブクラスでDataFrame.reindex_like()がAssertionErrorを発生させていた回帰を修正しました (GH 31925)
その他
DatetimeIndexまたはTimedeltaIndexで結合する際に、単純なケースでfreqを保持する回帰を修正しました (GH 32166)datetime64dtype で整数fill_valueを渡した場合のSeries.shift()での回帰を修正しました (GH 32591)bool 型と欠損値を持つ object-dtype
Indexの repr での回帰を修正しました (GH 32146)
ヌル許容ブール配列でのインデックス作成#
以前は NA を含むヌル許容ブール配列でのインデックス作成は ValueError を発生させていましたが、現在は NA が False として扱われるため許可されています。 (GH 31503)
In [1]: s = pd.Series([1, 2, 3, 4])
In [2]: mask = pd.array([True, True, False, None], dtype="boolean")
In [3]: s
Out[3]:
0 1
1 2
2 3
3 4
Length: 4, dtype: int64
In [4]: mask
Out[4]:
<BooleanArray>
[True, True, False, <NA>]
Length: 4, dtype: boolean
pandas 1.0.0-1.0.1
>>> s[mask]
Traceback (most recent call last):
...
ValueError: cannot mask with array containing NA / NaN values
pandas 1.0.2
In [5]: s[mask]
Out[5]:
0 1
1 2
Length: 2, dtype: int64
バグ修正#
日付時刻ライク
タイムゾーンなしおよびタイムゾーン対応の
datetime64dtype でSeries.astype()がコピーされなかったバグを修正しました (GH 32490)pd.NAを渡した場合にto_datetime()が発生していたバグを修正しました (GH 32213)範囲外の
Timedeltaになる2つのTimestampを減算する際の改善されたエラーメッセージを修正しました (GH 31774)
カテゴリ
ヌル許容整数コードが渡された場合に
Categorical.from_codes()が不適切にValueErrorを発生させていたバグを修正しました。 (GH 31779)pd.NAを含む numpy 配列が与えられた場合にCategorical()コンストラクタがTypeErrorを発生させていたバグを修正しました。 (GH 31927)list-likeなto_replaceでSeries.replace()を呼び出す際にCategoricalが無視またはクラッシュしていたバグを修正しました (GH 31720)
I/O
DataFrame.to_json()でpd.NAを使用すると、空のオブジェクトの代わりに null 値が正しく出力されるようになりました (GH 31615)メタパスの値が反復可能でない場合の
pandas.json_normalize()でのバグを修正しました (GH 31507)pandas.NAのピクル化を修正しました。以前は新しいオブジェクトが返され、NAがシングルトンであることに依存する計算が壊れていました (GH 31847)ヌル許容符号なし整数 dtype を使用した parquet のラウンドトリップでのバグを修正しました (GH 31896)。
実験的な dtype
すでに
"string"dtype を使用していた列のDataFrame.convert_dtypes()でのバグを修正しました (GH 31731)。整数と文字列が混在するシリーズの
DataFrame.convert_dtypes()でのバグを修正しました (GH 32117)BooleanDtype列がInt64に変換されていたDataFrame.convert_dtypes()でのバグを修正しました (GH 32287)文字列 dtype を持つスライスインデクサを使用して値を設定する際のバグを修正しました (GH 31772)
オブジェクト dtype の列に
pd.NAを含むグループがあった場合にDataFrameGroupBy.first()、SeriesGroupBy.first()、DataFrameGroupBy.last()、およびSeriesGroupBy.last()がTypeErrorを発生させていたバグを修正しました (GH 32123)DataFrameGroupBy.mean()、DataFrameGroupBy.median()、DataFrameGroupBy.var()、およびDataFrameGroupBy.std()がInt64dtype 列でTypeErrorを発生させていたバグを修正しました (GH 32219)
文字列
Series.str.repeat()でpd.NAを使用すると、ベクトル入力でエラーを発生させる代わりに null 値が正しく出力されるようになりました (GH 31632)
ローリング
減少する時間インデックス上での可変ウィンドウ (時間期間で定義) を持つローリング操作を修正しました (GH 32385)。
貢献者#
このリリースには合計25名がパッチを貢献しました。「+」が付いている人は初めてパッチを貢献しました。
Anna Daglis +
ダニエル・サクストン
アーブ・ラスティッグ
Jan Škoda
Joris Van den Bossche
ジャスティン・ジェン
Kaiqi Dong
ケンドール・マッセ
マルコ・ゴレリ
Matthew Roeschke
MeeseeksMachine
MomIsBestFriend
Pandas Development Team
Pedro Reys +
Prakhar Pandey
Robert de Vries +
Rushabh Vasani
Simon Hawkins
スティン・ヴァン・ホーイ
テルジ・ピーターセン
Tom Augspurger
ウィリアム・エイド
alimcmaster1
ジーエフヤング
jbrockmendel