クロージャ

クロージャ(クロージャー、英語: closure)、関数閉包プログラミング言語における関数オブジェクトの一種。いくつかの言語ではラムダ式や無名関数にて利用可能な機能・概念である。引数以外の変数を実行時の環境ではなく、自身が定義された環境(静的スコープ)において解決することを特徴とする。関数とそれを評価する環境のペアであるともいえる。この概念は少なくとも1960年代のSECDマシンまで遡ることができる。まれに、関数ではなくとも、環境に紐付けられたデータ構造のことをクロージャと呼ぶ場合もある。クロージャをサポートする言語によるプログラミングでは、単に関数の中に関数を定義することができるだけでなく、その際に、外側の関数(エンクロージャ)で宣言された変数を暗黙的に内側の関数に取り込んで操作することができる。主な利点としてはグローバル変数の削減やコールバック関数記述の簡素化が挙げられる。

典型的にはクロージャは、エンクロージャの内側の関数リテラルや、ネストした関数定義によって必要になる。プログラミング言語により、そのような内側の関数内に出現する自由変数(内側の関数の仮引数でもなく、内側の関数自身のローカル変数でもない変数)の扱いは異なるが、自由変数をレキシカルに(字句的に)参照するのがクロージャである[1]。エンクロージャが実行された際、クロージャが形成される。クロージャは内部の関数のコードとエンクロージャのスコープ内の必要なすべての変数への参照からなる。

クロージャはプログラム内で環境を共有するための仕組みである。レキシカル変数はグローバルな名前空間を占有しないという点でグローバル変数とは異なっている。またオブジェクト指向プログラミングにおけるオブジェクトのインスタンス変数とは、オブジェクトのインスタンスではなく関数の呼び出しに束縛されているという点で異なる。

クロージャは関数型言語では遅延評価カプセル化のために、また高階関数の引数として広く用いられる。

例: クロージャを使ったカウンタの例を Scheme で示す。

(define (new-counter)
  (let ((count 0))
    (lambda ()
      (set! count (+ count 1))
      count)))

(define c (new-counter))
(display (c)) ; 1
(display (c)) ; 2
(display (c)) ; 3

関数 new-counter の中でクロージャが使用されている。c に代入された無名関数は new-counter 内のローカル変数 count を参照している。c を呼び出すたびに count はインクリメントされていく。

クロージャの用途

クロージャには多くの用途がある。

  • ライブラリの設計者は、関数(コールバック関数)を引数として受け取る関数(高階関数)を定義することで、利用者が挙動をカスタマイズできる汎用的なライブラリ関数を提供することができる。その際、クロージャを高階関数の引数として渡すことで、記述の簡素化や高階関数の外側の状態の参照が可能となる。例えばコレクションソートを行う関数は、比較関数を引数に渡すことで、利用者が定義した基準でソートできるようになるが、クロージャを使うことでさらに自由度の高い比較処理を簡潔に記述することができるようになる。
  • クロージャは遅延評価される(呼び出されるまで何も実行しない)ので、制御構造の定義に用いることができる。例として、Smalltalk の分岐 (if-then-else) や繰り返し (while、for) を含むすべての標準制御構造は、クロージャを引数にとるメソッドを持つオブジェクトを利用することで定義されている。同様な方法で利用者は自作の制御構造を簡単に定義できる。
  • 遅延評価される引数のように、その値を求めるためのものは揃っているが、まだ値自体は計算されていない、というものを記憶しておくために、追加の引数を持たないクロージャのようなデータ構造を使う。これをサンク(thinkの過去形)という。ALGOL 60の名前渡しの実装において考案された。

クロージャを持つプログラミング言語

本来のラムダ計算静的スコープだが、1960年のLISP Iは動的スコープという不具合を抱えていて[2]、その後の1960年代のLISPはスコープ解決に色々と問題を抱えていた[3]。1975年にSchemeは完全な静的スコープのクロージャを持つ最初の言語として登場した[4][5]。1984年のCommon Lispはそれを取り入れた。実質的にすべての関数型言語(ScalaHaskellOCamlなど)とSmalltalkに由来するオブジェクト指向言語は何らかの形でクロージャを持っている。

クラスを使用するオブジェクト指向言語では、完全なクロージャになるにはメソッドの中でクラス定義できることが必要だが、メソッドあるいは関数の中でラムダ式/無名関数が使え、その中から外のローカル変数を読み書きできれば、一般的にはそのプログラミング言語はクロージャを使えるとみなされる。よって、クロージャを持つ言語には、C#(3.0以降)、C++C++11以降)、ECMAScriptJavaScriptを含む)、GroovyJava(8以降)、PerlPythonRubyPHP(5.3以降)、LuaSquirrelなどがある。

セマンティクス[要曖昧さ回避]はそれぞれ大きく異なっているが、多くの現代的な汎用のプログラミング言語は静的スコープとクロージャのいくつかのバリエーションを持っている。

セマンティクスの違い

言語ごとにスコープのセマンティクスが異なるように、クロージャの定義も異なっている。汎用的な定義では、クロージャが捕捉する「環境」とは、あるスコープのすべての変数の束縛の集合である。しかし、この変数の束縛というものの意味も言語ごとに異なっている。命令型言語では、変数は値を格納するためのメモリ中の位置と束縛される。この束縛は変化せず、束縛された位置にある値が変化する。クロージャは束縛を捕捉しているので、そのような言語での変数への操作は、それがクロージャからであってもなくとも、同一のメモリ領域に対して実行される。例として、ECMAScriptを取り上げると

var f, g;
function foo()
{
  var x = 0;
  f = function() { x += 1; return x; };
  g = function() { x -= 1; return x; };
  x = 1;
  console.log(f()); // "2"
}
foo();
console.log(g()); // "1"
console.log(f()); // "2"

関数 foo と2つのクロージャがローカル変数 x に束縛された同一のメモリ領域を使用していることに注意。

一方、多くの関数型言語、例えばMLは変数を直接、値に束縛する。この場合、一度束縛された変数の値を変える方法はないので、クロージャ間で状態を共有する必要はない。単に同じ値を使うだけである。

さらに、Haskellなど、遅延評価を行う関数型言語では、変数は将来の計算結果に束縛される。例を挙げる。

foo x y = let r = x / y
          in (\z -> z + r)
f = foo 1 0
main = do putStr (show (f 123))

r は計算 (x / y) に束縛されており、この場合は0による除算である。しかしながら、クロージャが参照しているのはその値ではなく計算であるので、エラーはクロージャが実行され、実際にその束縛を使おうと試みたときに現れる。

さらなる違いは静的スコープである制御構文C言語風の言語における returnbreakcontinue などにおいて現れる。ECMAScriptなどの言語では、これらはクロージャ毎に束縛され、構文上の束縛を隠蔽する。つまり、クロージャ内からの return はクロージャを呼び出したコードに制御を渡す。しかしSmalltalkでは、このような動作はトップレベルでしか起こらず、クロージャに捕捉される。例を示して、この違いを明らかにする。

"Smalltalk"
foo
  | xs |
  xs := #(1 2 3 4).
  xs do: [:x | ^x].
  ^0
bar
  Transcript show: (self foo) "prints 1"
// ECMAScript
function foo() {
  var xs = new Array(1, 2, 3, 4);
  xs.forEach(function(x) { return x; });
  return 0;
}
print(foo()); // prints 0

Smalltalkにおける ^ はECMAScriptにおける return にあたるものだと頭に入れれば、一目見た限りではどちらのコードも同じことをするように見える。違いは、ECMAScriptの例では return はクロージャを抜けるが関数 foo は抜けず、Smalltalkの例では ^ はクロージャだけではなくメソッド foo をも抜ける、という点である。後者の特徴はより高い表現力をもたらす。Smalltalkの do: は通常のメソッドであり、自然に制御構文が定義できている。一方、ECMAScriptでは return の意味が変わってしまうので、同じ目的には foreach という新しい構文を導入しなければならない。

しかし、スコープを越えて生存する継続には問題もある。

foo
  ^[ x: | ^x ]
bar
  | f |
  f := self foo.
  f value: 123 "error!"

上の例でメソッド foo が返すブロックが実行されたとき、foo から値を返そうとする。しかし、foo の呼び出しは既に完了しているので、この操作はエラーとなる。

Ruby

Rubyなどの言語では、プログラマが return の振る舞いを選ぶことができる。

def foo
  f = Proc.new { return "return from foo from inside proc" }
  f.call # control leaves foo here
  return "return from foo"
end
  
def bar
  f = lambda { return "return from lambda" }
  f.call # control does not leave bar here
  return "return from bar"
end
  
puts foo # prints "return from foo from inside proc"
puts bar # prints "return from bar"

この例の Proc.newlambda はどちらもクロージャを作るための方法である。しかし、それぞれが作ったクロージャの return の振る舞いに関しては、異なるセマンティクスを持っている。

Common Lisp

Common Lispでは、変数束縛を確立するlet、脱出点を確立するblock、Go Toのタグ(ラベル)を確立するtagbodyの三つの要素を基盤とし、これらの三つの組み合わせによって基本的な構文体系が構築されているが、それぞれの構文で確立された要素は、スコープとエクステント(存続期間)という概念によって整理されている。

これら、三つの構文の、変数名、ブロック名、ラベル名は、レキシカルスコープであり、クロージャに閉じ込めることができるが、変数束縛以外は、スコープ外(エクステント外)からアクセスすることはできない。Common Lispでは、これをレキシカルスコープかつ動的エクステントと表現する(変数はレキシカルスコープかつ無限エクステント)

blockにより確立された脱出点からは、return-fromによって抜け出す。また、tagbodyによって確立されたタグは、goにより参照される。

(let ((m 3))
  (defun a (x)
    ;; 関数定義は暗黙にblock名として関数名を設定する
    (* 3 
       (block b
         (* 100
            (funcall
             (lambda (y)
               (block nil
                 (tagbody
                  (cond
                   ((= 0 (mod y m)) (return-from a y))       ;mの倍数にはaから値をそのまま返す(m=3)
                   ((oddp y)        (return-from b (* 2 y))) ;奇数には二倍してbから脱出
                   (T (go exit))) ;どちらでもなければexitへgo toする
                  ;;return-from nilの略記としてreturnが利用可能
                  exit (return y)))) ;lambda直下のblock nilから脱出
             x))))))

(a 1)
;--> 6
(a 2)
;--> 600
(let ((m 6)) 
 ;;aの内部で参照するmは定義時のm
 (a 3))
;--> 3

C++

C++11規格以降でラムダ式が使えるようになった。なお、以下のようにローカル変数のキャプチャの方法を制御することができる。詳細はC++11を参照。

#include <iostream>
#include <vector>
#include <string>
#include <algorithm>

void foo(std::string s) {
    int n = 0;
    // すべての自由変数をコピーキャプチャ。
    auto func1 = [=]() { std::cout << n << ", " << s << std::endl; };
    n = 1;
    s = "";
    func1();
    // すべての自由変数を参照キャプチャ。
    auto func2 = [&]() { n = -1; s = "hoge"; };
    func2();
    std::cout << n << ", " << s << std::endl;
}

bool findName(const std::vector<std::string>& v, const std::string& name) {
    // 名前を指定して自由変数を参照キャプチャ。
    auto it = std::find_if(v.begin(), v.end(), [&name](const std::string& s) { return s == name; });
    return it != v.end();
}

クロージャに類似した言語機能

C

C言語では、コールバックをサポートするライブラリ関数の中に、以下のように関数へのポインタと付随する任意のデータを指すためのポインタ(例えば汎用ポインタであるvoid*など)という2つの値を受け取るものがある。

typedef int CallbackFunctionType(void* userData);
extern int callUserFunction(CallbackFunctionType* callbackFunction, void* userData);

ライブラリ関数callUserFunctionがコールバック関数callbackFunctionを実行するたび、実行コンテキストとしてデータポインタuserDataを使用する。これによってコールバックは状態を管理することができ、登録した任意の情報を参照できる。このイディオムはクロージャと機能面で似ているが、構文面では似ていない。

C++

C++では、operator() をオーバーロードしたクラス(あるいは構造体)により、関数オブジェクトを定義できる。これは関数型言語における関数にいくらか似た振る舞いをみせる。C++の関数オブジェクトは非静的メンバー変数により状態を持つこともできる。しかし、一般的なクロージャのように自動的に(暗黙的に)ローカル変数を捕捉(キャプチャ)するようなことはしない。

また、ローカルクラス、すなわち関数内でクラスを定義することも可能だが、C++11よりも前の規格(C++03以前)ではテンプレート型引数として渡すことができなかったり、暗黙的に参照できる外のローカル変数は static 変数のみであり、自由変数のキャプチャを模倣するためには関数オブジェクトの非静的メンバー変数として明示的に保存しておく必要があったりするなど、後述する Java の無名クラス以上に制約条件が多い。C++11以降のラムダ式は、内部的にはコンパイラによる関数オブジェクトの自動生成により実現されている。したがって、自由変数をキャプチャする際には、関数オブジェクトであってもラムダ式であっても、変数寿命に配慮する必要がある。

Eiffel

Eiffelにはクロージャを定義するためのinline agent(インラインエージェント)がある。インラインエージェントはルーチンを表すオブジェクトで、次のように利用する。

OK_button.click_event.subscribe(
    agent(x, y: INTEGER) do
        country := map.country_at_coordinates(x, y)
        country.display
    end
)

subscribe の実引数はインラインエージェントで、2つの引数を持つ手続きである。ユーザがこのボタンをクリックして、click_event タイプのイベントが起こると、マウスの座標を引数としてこの手続きが実行される。

Eiffelのインラインエージェントの大きな限界は、外側のスコープのローカル変数を参照できないという点である。

Java 7 以前

Java 7 以前では、メソッド内部に「ローカルクラス」あるいは「匿名クラス」[6]を定義することで似たようなことができる。ローカルクラス/匿名クラスからは、そのメソッドの final (リードオンリー)なローカル変数を、ローカルクラス/匿名クラスのフィールドと名前が衝突しない限り、参照できる。

class CalculationWindow extends JFrame {
    private JButton saveButton;
    ...

    public final void calculateInSeparateThread(final URI uri) {
        // "new Runnable() { ... }" で匿名クラスを記述する
        Runnable runner = new Runnable() {
            void run() {
                // 匿名クラスの外にあるfinalなローカル変数へアクセスする
                calculate(uri);
                // 内包するクラスのprivateフィールドにもアクセスできる
                // SwingのスレッドからGraphicsコンポーネントを更新する
                SwingUtilities.invokeLater(new Runnable() {
                     public void run() {
                         saveButton.setEnabled(true);
                     }
                });                   
            }
        };
        new Thread(runner).start();
    }
}

要素が1つの配列を final な参照で保持すれば、クロージャで1つのローカル変数を参照する機能をエミュレートできる。内部クラスはその参照の値そのものを変えることはできないが、参照されている配列の要素の値は変えることができるからである。このテクニックはJavaに限ったものではなく、Pythonなど似た制限を持つ言語でも有効である。

Javaに完全なクロージャを追加するという言語拡張が検討されていた[7]。様々な問題により、クロージャを導入せずに、関数型インタフェース[8]を実装するための簡便な表記法(ラムダ式)が Java 8 にて導入された。

実装

クロージャは典型的には関数コードへのポインタ及び関数の作成時の環境の表現(例えば、使用可能な変数とその値の集合など)を含む特別なデータ構造によって実装される。

ある言語処理系の実行時のメモリモデルがすべてのローカル変数を線形なスタックに確保するものであれば、クロージャを完璧に実装するのは容易ではない。それは、以下のような理由による。

  1. クロージャをつくった関数(エンクロージャ)の呼び出し元に復帰した際に、クロージャが参照するスタック上のローカル変数(レキシカル変数)が解放されてしまう。しかしクロージャにはレキシカル変数がエンクロージャの終了後も存続することが必要である。したがってレキシカル変数は必要がなくなるまで存続するように確保されなければならない。
  2. クロージャが実行された時に、レキシカル変数のスタック上の位置を知ることは困難である。

第1の問題を解決するために、クロージャを実装するプログラミング言語は大抵、ガベージコレクションを備えている。この場合、クロージャへの参照が全て無効になった時に、レキシカル変数はガベージコレクタに渡される。

第2の問題を解決するためには、デリゲートのように、関数の参照と実行環境の参照をセットで扱える必要がある。しかし、これではC言語のようなネイティブコードの関数の呼び出しとの互換性がなくなる。そのため、実行時にスタックやヒープに、エンクロージャのスタックポインタを埋め込んだ、実際の関数を起動するだけの小さな関数(トランポリン関数)を動的に生成することでも実装できる。しかし、セキュリティの観点から近代的なOSでは標準でスタックやヒープ上のコードの実行を禁止しているのが一般的であり、この制限を一時的・部分的に解除することをサポートしている環境でなければ実現できない。

現代的なScheme処理系は、クロージャに使用される可能性のあるローカル変数は動的に確保し、そうでないものはスタックに確保するなどの最適化を行うものが多い。

やや異なる解法として、Rustではクロージャ内部から外部の変数を使用する場合、参照渡しの他に変数の所有権をクロージャ外部から内部へ渡すことも可能であり、プログラマがクロージャの定義時にどちらを使用するかを選択できる。[9] 後者はデリゲートに似ているが、変数への参照ではなく実体そのものをクロージャが所有するので、これをクロージャのスタック上に確保することができる。これにより、ガベージコレクションを含めクロージャ内部へ渡した変数のための特別な後始末が不要となり、第1および第2の問題をまとめて解決する。一方、クロージャへ渡した変数はその定義以降クロージャ外部では消滅し、予めコピーを作らない限り、参照を含めクロージャ定義以降にて使用するとコンパイルエラーとなる。この解法は、メモリ上での変数の移動が容易である[10]というRustの特徴を利用したものである。

脚注

  1. ^ クロージャ - JavaScript | MDN
  2. ^ From LISP 1 to LISP 1.5”. www-formal.stanford.edu. 7 April 2024閲覧。
  3. ^ Baker, Henry G. (July 1978). “Shallow binding in Lisp 1.5”. Commun. ACM (New York, NY, USA: Association for Computing Machinery) 21 (7): 565–569. doi:10.1145/359545.359566. ISSN 0001-0782. https://doi.org/10.1145/359545.359566. 
  4. ^ Sussman, Gerald Jay; Steele, Guy Lewis (1975). Scheme: An Interpreter for Extended Lambda Calculus (PDF) (Report). Massachusetts Institute of Technology.
  5. ^ Sussman, Gerald Jay; Steele Jr, Guy L (1998). “Scheme: A interpreter for extended lambda calculus”. Higher-Order and Symbolic Computation (Springer) 11 (4): 405–439. doi:10.1023/A:1010035624696. https://www.researchgate.net/publication/227098423_Scheme_A_Interpreter_for_Extended_Lambda_Calculus. 
  6. ^ : anonymous class。「無名クラス」とも。オラクル日本語版サイトの表記に準拠し、匿名クラスとした。
  7. ^ Closures (Lambda Expressions) for the Java Programming Language
  8. ^ : functional interface。抽象メソッドを1つだけもつインタフェース。SAM (Single Abstract Method) typeと呼ばれることもある。
  9. ^ Closures: Anonymous Functions that Capture Their Environment, Capturing References or Moving Ownership”. The Rust Programming Language. 24 December 2023閲覧。
  10. ^ Module std::pin”. The Rust Standard Library. 24 December 2023閲覧。 “By default, all types in Rust are movable. Rust allows passing all types by-value, ...”

参考文献

関連項目

外部リンク