目次

前のトピックへ

26.5. hotshot — ハイパフォーマンス・ロギング・プロファイラ

次のトピックへ

26.7. trace — Python ステートメント実行のトレースと追跡

このページ

26.6. timeit — 小さなコード断片の実行時間計測

バージョン 2.3 で追加.

このモジュールは Python の小さなコード断片の時間を簡単に計測する手段を提供します。インターフェースはコマンドラインとメソッドとして呼び出し可能なものの両方を備えています。また、このモジュールは実行時間の計測にあたり陥りがちな落し穴に対する様々な対策が取られています。詳しくは、 O’Reilly の Python Cookbook、”Algorithms” の章にある Tim Peters が書いた解説を参照してください。

このモジュールには次のパブリック・クラスが定義されています。

class timeit.Timer([stmt='pass'[, setup='pass'[, timer=<timer function>]]])

小さなコード断片の実行時間計測をおこなうためのクラスです。

コンストラクタは引数として、時間計測の対象となる文、セットアップに使用する追加の文、タイマ関数を受け取ります。文のデフォルト値は両方とも 'pass' で、タイマ関数はプラットフォーム依存(モジュールの doc string を参照)です。 stmtsetup は複数行の文字列リテラルを含まない限り、改行や ; で区切られた複数の文を入れることができます。

最初の文の実行時間を計測には timeit() メソッドを使用します。また timeit() を複数回呼び出し、その結果のリストを返す repeat() メソッドも用意されています。

バージョン 2.6 で変更: stmtsetup 引数は、引数なしで呼び出し可能なオブジェクトを受け取れるようになりました。 呼び出し可能オブジェクトを利用すると、 timeit() メソッドから実行されるときに、 タイマーの中で指定されたオブジェクトの呼び出しを行ないます。 この場合、関数呼び出しが増えるために、オーバーヘッドが少し増えることに注意してください。

Timer.print_exc([file=None])

計測対象コードのトレースバックを出力するためのヘルパー。

利用例:

t = Timer(...)       # try/except の外側で
try:
    t.timeit(...)    # または t.repeat(...)
except:
    t.print_exc()

標準のトレースバックより優れた点は、コンパイルしたテンプレートのソース行が表示されることです。オプションの引数 file にはトレースバックの出力先を指定します。デフォルトは sys.stderr になっています。

Timer.repeat([repeat=3[, number=1000000]])

timeit() を複数回呼び出します。

このメソッドは timeit() を複数回呼び出し、その結果をリストで返すユーティリティ関数です。最初の引数には timeit() を呼び出す回数を指定します。2番目の引数は timeit() へ引数として渡す 数値 です。

ノート

結果のベクトルから平均値や標準偏差を計算して出力させたいと思うかもしれませんが、それはあまり意味がありません。多くの場合、最も低い値がそのマシンが与えられたコード断片を実行する場合の下限値です。結果のうち高めの値は、Python のスピードが一定しないために生じたものではなく、時刻取得の際他のプロセスと衝突がおこったため、正確さが損なわれた結果生じたものです。したがって、結果のうち min() だけが見るべき値となります。この点を押さえた上で、統計的な分析よりも常識的な判断で結果を見るようにしてください。

Timer.timeit([number=1000000])

メイン文の実行時間を number 回取得します。このメソッドはセットアップ文を1回だけ実行し、メイン文を指定回数実行するのにかかった秒数を浮動小数で返します。引数はループを何回実行するかの指定で、デフォルト値は 100万回です。メイン文、セットアップ文、タイマ関数はコンストラクタで指定されたものを使用します。

ノート

デフォルトでは、 timeit() は時間計測中、一時的にガーベッジコレクション(garbage collection)を切ります。このアプローチの利点は、個別の測定結果を比較しやすくなることです。不利な点は、GC が測定している関数のパフォーマンスの重要な一部かもしれないということです。そうした場合、 setup 文字列の最初の文で GC を再度有効にすることができます。例えば

timeit.Timer('for i in xrange(10): oct(i)', 'gc.enable()').timeit()

Python 2.6 から、このモジュールに2つの便利関数が追加されました。

timeit.repeat(stmt[, setup[, timer[, repeat=3[, number=1000000]]]])

指定された stmt, setup, timer を使って Timer インスタンスを作成し、指定された repeat, number を使ってその repeat() メソッドを実行します。

バージョン 2.6 で追加.

timeit.timeit(stmt[, setup[, timer[, number=1000000]]])

指定された stmt, setup, timer を使って Timer インスタンスを作成し、指定された number を使ってその timeit() メソッドを実行します。

バージョン 2.6 で追加.

26.6.1. コマンドライン・インターフェース

コマンドラインからプログラムとして呼び出す場合は、次の書式を使います。

python -m timeit [-n N] [-r N] [-s S] [-t] [-c] [-h] [statement ...]

以下のオプションが使用できます。

-n N, --number=N

‘statement’ を何回実行するか

-r N, --repeat=N

タイマを何回リピートするか(デフォルトは 3)

-s S, --setup=S

最初に1回だけ実行する文 (デフォルトは pass)

-t, --time

time.time() を使用する (Windows を除くすべてのプラットフォームのデフォルト)

-c, --clock

time.clock() を使用する(Windows のデフォルト)

-v, --verbose

時間計測の結果をそのまま詳細な数値でくり返し表示する

-h, --help

簡単な使い方を表示して終了する

文は複数行指定することもできます。その場合、各行は独立した文として引数に指定されたものとして処理します。クォートと行頭のスペースを使って、インデントした文を使うことも可能です。この複数行のオプションは -s においても同じ形式で指定可能です。

オプション -n でループの回数が指定されていない場合、10回から始めて、所要時間が 0.2 秒になるまで回数を増やすことで適切なループ回数が自動計算されるようになっています。

デフォルトのタイマ関数はプラットフォーム依存です。Windows の場合、 time.clock() はマイクロ秒の精度がありますが、 time.time() は 1/60 秒の精度しかありません。一方 Unixの場合、 time.clock() でも 1/100 秒の精度があり、 time.time() はもっと正確です。いずれのプラットフォームにおいても、デフォルトのタイマ関数は CPU 時間ではなく通常の時間を返します。つまり、同じコンピュータ上で別のプロセスが動いている場合、タイミングの衝突する可能性があるということです。正確な時間を割り出すために最善の方法は、時間の取得を数回くり返しその中の最短の時間を採用することです。 -r オプションはこれをおこなうもので、デフォルトのくり返し回数は3回になっています。多くの場合はデフォルトのままで充分でしょう。 Unixの場合 time.clock() を使って CPU 時間で測定することもできます。

ノート

pass 文の実行による基本的なオーバーヘッドが存在することに注意してください。ここにあるコードはこの事実を隠そうとはしておらず、注意を払う必要があります。基本的なオーバーヘッドは引数なしでプログラムを起動することにより計測できます。

基本的なオーバヘッドは Python のバージョンによって異なります。 Python 2.3 とそれ以前の Python の公平な比較をおこなう場合、古い方の Python は -O オプションで起動し SET_LINENO 命令の実行時間が含まれないようにする必要があります。

26.6.2. 使用例

以下に2つの使用例を記載します (ひとつはコマンドライン・インターフェースによるもの、もうひとつはモジュール・インターフェースによるものです)。内容はオブジェクトの属性の有無を調べるのに hasattr() を使った場合と try / except を使った場合の比較です。

% timeit.py 'try:' '  str.__nonzero__' 'except AttributeError:' '  pass'
100000 loops, best of 3: 15.7 usec per loop
% timeit.py 'if hasattr(str, "__nonzero__"): pass'
100000 loops, best of 3: 4.26 usec per loop
% timeit.py 'try:' '  int.__nonzero__' 'except AttributeError:' '  pass'
1000000 loops, best of 3: 1.43 usec per loop
% timeit.py 'if hasattr(int, "__nonzero__"): pass'
100000 loops, best of 3: 2.23 usec per loop
>>> import timeit
>>> s = """\
... try:
...     str.__nonzero__
... except AttributeError:
...     pass
... """
>>> t = timeit.Timer(stmt=s)
>>> print "%.2f usec/pass" % (1000000 * t.timeit(number=100000)/100000)
17.09 usec/pass
>>> s = """\
... if hasattr(str, '__nonzero__'): pass
... """
>>> t = timeit.Timer(stmt=s)
>>> print "%.2f usec/pass" % (1000000 * t.timeit(number=100000)/100000)
4.85 usec/pass
>>> s = """\
... try:
...     int.__nonzero__
... except AttributeError:
...     pass
... """
>>> t = timeit.Timer(stmt=s)
>>> print "%.2f usec/pass" % (1000000 * t.timeit(number=100000)/100000)
1.97 usec/pass
>>> s = """\
... if hasattr(int, '__nonzero__'): pass
... """
>>> t = timeit.Timer(stmt=s)
>>> print "%.2f usec/pass" % (1000000 * t.timeit(number=100000)/100000)
3.15 usec/pass

定義した関数に timeit モジュールがアクセスできるようにするために、 import 文の入った setup 引数を渡すことができます:

def test():
    "Stupid test function"
    L = []
    for i in range(100):
        L.append(i)

if __name__=='__main__':
    from timeit import Timer
    t = Timer("test()", "from __main__ import test")
    print t.timeit()