バージョン 0.9.0 (2012年10月7日)#

これは 0.8.1 からのメジャーリリースで、多数のバグ修正に加え、いくつかの新機能と機能強化が含まれています。新機能には、Series.str のベクトル化されたユニコードエンコード/デコード、DataFrame の to_latex メソッド、ブール値のより柔軟な解析、および Yahoo! Finance からオプションデータをダウンロードする機能が含まれます。

新機能#

  • Series.str のベクトル化された文字列処理メソッドに、ユニコード処理のための encodedecode を追加しました (GH 1706)

  • DataFrame.to_latex メソッドを追加しました (GH 1735)

  • すべての rolling_* 演算の便利な拡張ウィンドウに相当するものを追加しました (GH 1785)

  • Yahoo! Finance からオプションデータを取得するための Options クラスを pandas.io.data に追加しました (GH 1748, GH 1739)

  • ブール値 (Yes, No, TRUE, FALSE など) のより柔軟な解析 (GH 1691, GH 1295)

  • Series.reset_indexlevel パラメータを追加しました

  • TimeSeries.between_time が真夜中をまたぐ時刻を選択できるようになりました (GH 1871)

  • Series コンストラクタがジェネレータを入力として扱えるようになりました (GH 1679)

  • DataFrame.dropna が複数の軸 (タプル/リスト) を入力として受け取れるようになりました (GH 924)

  • ExcelFile.parseskip_footer パラメータを有効にしました (GH 1843)

APIの変更点#

  • header=None で、read_csv のような関数に列名が渡されない場合のデフォルトの列名が、より Python 的で属性アクセスに適した形に変更されました

In [1]: import io

In [2]: data = """
   ...: 0,0,1
   ...: 1,1,0
   ...: 0,1,0
   ...: """
   ...: 

In [3]: df = pd.read_csv(io.StringIO(data), header=None)

In [4]: df
Out[4]: 
   0  1  2
0  0  0  1
1  1  1  0
2  0  1  0

[3 rows x 3 columns]
  • 別の Series から Series を作成し、インデックスを渡すと、Series を ndarray として扱うのではなく、内部で再インデックス化が行われるようになりました。以前は「偶然に」機能していた Series(df[col1], index=df[col2]) のような技術的に不適切な使用法は、場合によってはすべての NA Series につながります。明確に言うと、

In [5]: s1 = pd.Series([1, 2, 3])

In [6]: s1
Out[6]: 
0    1
1    2
2    3
Length: 3, dtype: int64

In [7]: s2 = pd.Series(s1, index=["foo", "bar", "baz"])

In [8]: s2
Out[8]: 
foo   NaN
bar   NaN
baz   NaN
Length: 3, dtype: float64
  • 非推奨の day_of_year API が PeriodIndex から削除されました。dayofyear を使用してください (GH 1723)

  • インポート時に NumPy の suppress printoption を True に変更しない

  • DataFrames の内部 HDF5 データ配置が転置されました。古いファイルは HDFStore で引き続き読み取り可能です (GH 1834, GH 1824)

  • 古い不要なものが削除されました: pandas.stats.misc.quantileTS

  • Period repr に ISO8601 形式を使用するようになりました: 月次、日次、その他 (GH 1776)

  • 空の DataFrame 列がオブジェクト dtype として作成されるようになりました。これにより、データの有無によって列の dtype が変わる (例: SQL クエリに結果があるかないか) コードで発生していた TypeError のクラスを防ぐことができます (GH 1783)

  • ix を使用して DataFrame/Panel の一部を設定する場合、入力 Series/DataFrame が整列されるようになりました (GH 1630)

  • GroupByfirst および last メソッドが、数値以外の列を削除しなくなりました (GH 1809)

  • テキストパーサーでカスタム NA 値を指定する際の不整合が解決されました。na_values の型が辞書の場合、keep_default_na が明示的に false に設定されていない限り、デフォルトの NA を上書きしなくなりました (GH 1657)

  • DataFrame.dot がデータアライメントを行わなくなり、Series とも連携できるようになりました (GH 1915)

完全なリストについては、GitHub の完全なリリースノートまたはイシュートラッカーを参照してください。

貢献者#

このリリースには合計24人がパッチを貢献しました。名前の横に「+」がある人は、初めてパッチを貢献した人です。

  • Chang She

  • Christopher Whelan +

  • Dan Miller +

  • Daniel Shapiro +

  • Dieter Vandenbussche

  • Doug Coleman +

  • John-Colvin +

  • Johnny +

  • Joshua Leahy +

  • Lars Buitinck +

  • Mark O’Leary +

  • Martin Blais

  • MinRK +

  • Paul Ivanov +

  • スキッパー・シーボールド

  • Spencer Lyon +

  • Taavi Burns +

  • Wes McKinney

  • Wouter Overmeire

  • ヤロスラフ・ハルチェンコ

  • lenolib +

  • tshauck +

  • y-p +

  • Øystein S. Haaland +