ja %E3%82%A2%E3%82%BB%E3%83%B3%E3%83%96%E3%83%AA%E8%A8%80%E8%AA%9E

■カテゴリ / ■テンプレート

アセンブリ言語（アセンブリげんご、英: assembly language、アセンブリ）はビット列命令に対応した文字列命令を利用する低水準プログラミング言語の総称である^[1]。

アセンブラ（英: Assembler）またはアセンブラ言語（英: Assembler Language）とも呼ばれる^{[注 1]}^[2]。

概要

プロセッサは機械語プログラムを直接読み取り実行する。しかし人間にとってビット列は直観的に理解しづらいため、機械語コーディングは容易でない。これを解決するために、ビット列に対応する文字列命令（ニーモニック）を利用するプログラミング言語の総称がアセンブリ言語である^[1]。

アセンブリ言語を用いることで、機械語相当の低水準なコードをより直観的に記述できる。高度なアセンブリ言語ではアセンブラに対する命令（疑似命令）やマクロを用いて、より抽象的な記述が可能である^{[注 2]}。パイプライン処理などを最適化するために命令順序を入れ替えたり、ラベルの位置関係によってアドレッシングモードを最適化するアセンブラもあり、必ずしもソーステキストの記述とアセンブルの結果が直接対応するとは限らない。

アセンブリ言語は機械語と強く結びついているため、各プロセッサ向けに仕様の異なる様々な（具体的な）アセンブリ言語が存在する（「アセンブリ言語」は総称である）。同じ命令セットに対しても複数のアセンブリ言語が存在しうる（例: GNUアセンブラのgasのインテルプロセッサ用）。

アセンブリ言語の基本文法として、1つの命令は1つのニーモニックと0個以上のオペランドからなる。プログラム全体はニーモニック/オペランド列、ディレクティブや擬似命令と呼ばれるメタな文、コメント、データで構成されている。通常の文はオペコードのニーモニックで始まり、パラメータ（データ、引数）のリストがそれに続く^[3]。多くのアセンブリ言語はオペランドのアドレスや定数をラベル・シンボルで記述できハードコーディングを避けられる。

基本文法

アセンブラの開発者によって用語の使い方に大きな差異があり、文の分類などが異なる。例えば、マシンのニーモニックや拡張ニーモニック以外は全て擬似命令と呼ぶ場合もある。典型的なアセンブリ言語は、プログラムの操作の定義に使われる命令文をニーモニック、データセクション、アセンブリディレクティブの3種類に分類する。

ニーモニック

ニーモニック（英: mnemonic）は処理内容に応じて各機械語命令に与えられた文字列・命令語である^[4]。機械語のオペコードに相当する。

ビット列である機械語はその処理が直観的にわからないため、機械語コーディングは容易でない。人間がより容易に機械語と同等なコードを書くため、ビット列を意味ある文字列で表現するニーモニックが発明された^[4]。例えばX64機械語 0x05 は「整数の加算」を意味するのでニーモニック ADD を対応させる。個々の機械語命令には少なくとも1つのニーモニックが対応する。

拡張ニーモニックは命令の特殊な用途をサポートするのに使われることが多く、本来の命令の名称からはその用途が連想できないときに使うことが多い。例えば、多くのCPUは明示的にNOP命令を用意していないが、その用途に使える命令は存在する。8086ではxchg ax,axという命令がnopとして使えるので、アセンブリ言語でnopを記述すると xchg ax,ax という命令に変換される。逆アセンブラにもこのあたりを認識し、xchg ax,axをnopに変換するものがある。同様にIBMのSystem/360とSystem/370のアセンブラでは、拡張ニーモニックNOPとNOPRを使用し、それぞれBCとBCRのマスク0の命令に変換する。SPARCアーキテクチャでは、拡張ニーモニックをsynthetic instructionsと呼んでいる^[5]。

命令は一般に「オペコード」と0以上の「オペランド」で構成される。多くの命令は1つまたは2つの値を参照する。オペランドには即値（命令内に置かれる値）、レジスタ（暗黙のうちに使用される場合もある）、記憶装置内のデータの位置を示すアドレスなどがある。「拡張ニーモニック」はオペコードと特定オペランドの組合せを表すのに使われることが多い。例えば、System/360では、BC命令にマスク15を組み合わせたものがB、BC命令にマスク0を組み合わせたものがNOPという拡張ニーモニックで表される。オペランドの順序（例: ソースとディスティネーションの前後）は言語に依る。

オペランド

オペランド（英: operand、被演算子）は命令の対象・引数である。1つの命令では、ニーモニックに続き0個以上のオペランドが記述される。オペランドにはソースとデスティネーションの二種類があり、データとして読み取られるのがソースで、オペコードで示された命令の実行結果が格納されるのがデスティネーションである。ソースには定数・レジスタ・メモリのいずれか、デスティネーションにはレジスタ・メモリのいずれかを指定する。

データセクション

データと変数を保持するデータ要素を定義するのに使われる命令文がある。データの型、長さ、境界（アライメント）を定義する。また、そのデータがプログラム外部（別ファイルでアセンブルされたプログラム）からも利用可能なのか、それともデータセクションを定義したプログラム内でのみ使用可能なのかも定義できる。一部のアセンブラはこれを擬似命令に分類している。

アセンブリディレクティブ

→「ディレクティブ」も参照

アセンブリディレクティブは、擬似命令とも呼ばれ、アセンブラがアセンブリ実施中に実行すべき命令となっている^[6]。プログラマが入力するパラメータによって、異なった形でアセンブルが行われるよう指示することができる。また、プログラムの見た目を操作して、可読性と保守性を向上させるのにも使われる。例えば、記憶装置の領域を予約し、その初期内容を指定するディレクティブなどがある。ディレクティブの名称はドットで始まることが多く、それによって通常のニーモニックと区別している。

擬似オペコード(pseudo-opcode)と言った場合、オブジェクトコードを実際に生成するディレクティブのみを指すこともある^[7]。

ラベル/シンボル

シンボリックアセンブラでは、任意の名前（ラベルまたはシンボル）とメモリ位置を対応付けることができる。通常、定数や変数に名前をつけることができ、命令文ではそれらの位置を名前で参照できる。実行コードではサブルーチンのエントリポイントと名前を関連付け、サブルーチンを名前で呼び出すことができる。サブルーチン内では、分岐命令の分岐先をラベルで示すことができる。一部のアセンブラは「ローカルシンボル」をサポートしており、通常のシンボルとは語彙的に区別する（例えば、"10$"を分岐先に使用する、など）。

一部のアセンブラは柔軟なシンボル管理を提供しており、複数の名前空間を管理したり、データ構造内のオフセットを自動的に計算したり、リテラル値やアセンブラが実施した単純な計算結果を参照するラベルを割り当てたりすることができる。ラベルは定数や変数をリロケータブルなアドレスで初期化するのにも使える。

例

x86/IA-32プロセッサにおいて8ビット即値をレジスタに入れる命令を例にとる。

この命令のバイナリコードは 10110 で、その後に3ビットのレジスタを指定する識別子が続く。AL レジスタの識別子は 000 なので、次に示す機械語は AL レジスタに 01100001 というデータをロードする^[8]。

10110000 01100001

このバイナリコードを人間が読みやすいように十六進法で表現すると次のようになる。

B0 61

ここで、B0は「ALに後続の値をコピーする」ことを意味し、61は01100001を十六進法で表したもの（十進法では97）である。インテルのアセンブリ言語では、この種の命令に MOV というニーモニックを割り当てており、セミコロン以下に説明的コメントを添えたアセンブリ言語での表現は次のようになる。

MOV AL, 61h       ; Load AL with 97 decimal (61 hex)

この場合、定数61Hがソース、レジスタALがデスティネーションに該当し、命令が実行されると、定数61Hが、レジスタALに単純に格納される。これが人間にとってはさらに読みやすく覚えやすい。

前述のインテルの MOV のようにデータの転送の多くを同一の命令あるいはニーモニックとする場合もあれば、データのコピー/移動の方向などによって別々の命令あるいはニーモニックとする場合もある（「メモリからレジスタへの移動」を L、「レジスタからメモリへの移動」を ST、「レジスタからレジスタへの移動」を LR、「即値をメモリへ移動」を MVI など）。（この段落では命令セットの設計の話とアセンブリ言語の話を一緒にしている）

インテルのオペコード 10110000(B0)は8ビットの値を AL レジスタにコピーするが、10110001(B1)はCLレジスタにコピーし、10110010(B2)は DL レジスタにコピーする。これらをアセンブリ言語で表現すると次のようになる^[8]。

MOV AL, 1h        ; Load AL with immediate value 1
MOV CL, 2h        ; Load CL with immediate value 2
MOV DL, 3h        ; Load DL with immediate value 3

MOVの構文には次の例のようにさらに複雑なものもある^[9]。

MOV EAX, [EBX]	  ; Move the 4 bytes in memory at the address contained in EBX into EAX
MOV [ESI+EAX], CL ; Move the contents of CL into the byte at address ESI+EAX

MOVというニーモニックを使った文は、その内容によってアセンブラが88-8E、A0-A3、B0-B8、C6、C7のいずれかのオペコードに変換するので、プログラマはオペコードを知る必要がないし、オペコードを覚える必要もない^[8]。

高級言語との違い

アセンブリ言語は低水準プログラミング言語であり、C言語などの高級言語より抽象度が低い。すなわち言語機能（構文や型）が少ない。次の表は「基本的なアセンブリ言語」と高級言語の間にある言語機能差である。

表. アセンブリ言語と高級言語
	アセンブラ	高級言語
レジスタ	✔	-
ジャンプ命令	✔	△^[10]
制御構造	-	✔
構造体	-	✔
関数	-	✔
コメント	✔	✔

この差はあくまで言語機能の差である。「高級言語でのみ可能、アセンブリ言語では不可」という意味ではない。例えばアセンブリ言語に関数構文は存在しないが関数に相当するパターンが存在する（関数プロローグ・エピローグ（英語版））。より正確な言い方をすれば、アセンブラで頻出するパターンを1つの機能として言語仕様に組み込んで抽象度を上げていった言語が高級言語である。

高水準文法

より抽象化され少ないコード量でアセンブラを書くために様々な高水準文法がアセンブリ言語に導入されてきた。現在では高水準化のメインストリームは高級言語に移った一方^[11]、目的に応じてアセンブリ言語を選択するユーザー向けに高機能なアセンブリ言語の開発も続いている^[12]。

マクロ

→「マクロ (コンピュータ用語)」も参照

アセンブリ言語においてもマクロが利用される。一般的なマクロと同様、高度なアセンブラマクロでは制御構文導入・引数展開・ユーザー定義マクロ適用などが可能である。文字列であるオペコード・ニーモニックはマクロの対象となるため、これを利用して疑似ニーモニックによる記述も可能になる。

例えば、一部のZ80用アセンブラでは、ld hl,bc というマクロ命令を ld l,c と ld h,b という2命令に展開する^[13]。メインフレームの時代には、マクロは特定顧客の大規模ソフトウェアシステムのカスタマイズや、メーカーのオペレーティングシステムを顧客の要望に合わせた特注版にするのに使われていた。IBMの VM/CMS、リアルタイムトランザクション処理用アドオン、CICS、ACP（英語版）/TPF^[14]などで使われてきた。

制御構造

構造化プログラミングの要素を取り入れたアセンブラもある。最初期には "Concept-14 macro set" がSystem/360のマクロアセンブラにIF/ELSE/ENDIFなどの制御構造を導入した^[15]^[16]。また8080/Z80プロセッサ向けの A-natural ではブロック構造や命令実行順序の制御が採用された。

また構造化プログラミングとは若干異なるが、キャリーラボはBASIC風の文法のアセンブリ言語 BASE を開発した。Z80用のBASE-80とMC6809用のBASE-09がある。BASEの表記例は下記の通り（BASE-09）。

S[A,B,X,U
A=$80
A=A+$C0
S]A,B,X,U,PC

上記の記述は下記のアセンブラ表記に対応する。

PSHS A,B,X,U
LDA #$80
ADDA #$C0
PULS A,B,X,U,PC

アセンブラ

アセンブル（英: assemble）はアセンブリ言語で書かれたプログラムから機械語で書かれたオブジェクトコードへの変換である。具体的には、ニーモニックをオペコードに変換しシンボル名をメモリ位置や他の実体に変換する^[6]。

アセンブルは比較的単純な規則からなるため、人の手でも実行できる（ハンドアセンブル）。単純な作業を効率良くミス無く行うのはプログラムの得意分野であり、そのようなソフトウェアが開発された。このアセンブリをおこなうプログラムをアセンブラ（英: assembler）という。初期にはアセンブリプログラムとも呼ばれた^[17]。

シンボル名による参照の利用はアセンブラの重要な機能であり、面倒な計算やプログラム修正に伴うアドレスの更新の手間を省くことができる。また、オブジェクトコードを生成する際、ローダ用情報も併せて生成するアセンブラもある^[18]。マクロを含むアセンブリ言語に対応している場合、処理系にはm4のような汎用プロセッサあるいはプロセッサ内蔵アセンブラ（マクロアセンブラ）が利用される^[19]。ポリモーフィズム、継承^[8]などをもつ高水準アセンブリ言語に対応したアセンブラは高水準アセンブラ（英語版）と呼ばれる^[20]。

動作プラットフォーム以外のターゲットプラットフォームを選択できるアセンブラはクロスアセンブラとも呼ばれる（参考: クロスコンパイラ）。メタアセンブラは、アセンブリ言語の文法や意味論を記述したものを入力とし、その言語のためのアセンブラを出力するプログラムである^[21]。

逆方向の変換、すなわちオブジェクトコードのアセンブリ言語化をおこなうプログラムを逆アセンブラという。

分類

アセンブラは様々な観点から分類できる。パス回数（アセンブル時のソースファイル走査回数）の観点ではワンパスアセンブラとマルチパスアセンブラに分類できる。

ワンパスアセンブラ: ソースコードを1回だけパスするアセンブラ。定義される前にシンボルが使われているとオブジェクトコードの最後に "errata" を置く必要があり、リンカまたはローダが未定義シンボルが使われていた位置にあるプレースホルダーを書き換える。あるいは、未定義なシンボルを使用するとエラーになる。
マルチパスアセンブラ: 最初のパスで全シンボルとその値の表を作成し、その表を使ってその後のパスでコードを生成する。

どちらの場合も、アセンブラは最初のパスで各命令のサイズを確定させる必要があり、それによって後に出現するシンボルのアドレスを計算する。命令のサイズは後から定義されるオペランドの型や距離に依存することがあるため、アセンブラは最初のパスでは悲観的な見積もりをし、必要に応じてその後のパスまたは errata にて1つ以上のNOP命令（何もしない命令）を挿入してすき間を埋める必要がある。最適化を行うアセンブラでは、最初の悲観的コードをその後のパスで稠密なコードに書き換えてアドレスの再計算を行うことがある。

もともとワンパスアセンブラは高速であるためよく使われていた。マルチパス動作をするには、磁気テープを巻き戻したりパンチカードのデッキをセットし直して読み込む必要があったためである。現代のコンピュータではマルチパスであってもそのような遅延は生じない。マルチパスアセンブラは errata がないため、リンク処理（アセンブラが直接実行コードを生成する場合はローダの処理）が高速化される^[22]。

主なアセンブラ

IBM High Level Assembler (HLASM) - IBM系メインフレーム用のアセンブラ。
PDP-8のアセンブリ言語 - PAL-III (Program Assembly Language III)
CAP-X - CASL 以前に情報処理技術者試験で使われていたアセンブリ言語
CASL - 情報処理技術者試験（基本情報技術者試験）用に作られたアセンブリ言語。同時に定義されているペーパーマシンCOMET用
as - UNIX用のアセンブラ
GNUアセンブラ (gas) - GNUプロジェクトが開発する、x86、680x0、SPARC、VAXなどの各種CPU用のアセンブラ
Microsoft Macro Assembler (MASM) - インテルのx86 CPU用にマイクロソフトが開発したアセンブラ
Netwide Assembler (nasm) - MASMと互換性の高いx86 CPU用アセンブラ
Turbo Assembler (TASM) - ボーランドが開発していた、MASMと互換性の高いx86 CPU用アセンブラ
MIXAL - ドナルド・クヌースが考案したペーパーマシンMIX用。また後継ペーパーマシンMMIX用のMMIXALも存在する
A-natural - Whitesmiths Ltd. が開発、8080/Z80プロセッサ向け。ストリーム指向。Cコンパイラが中間コードとしており人間が直接使うものではなかったが、その構文にはファンも存在した

Unix系システムでは、アセンブラを as と呼ぶのが一般的だが、実体はそれぞれのOSで異なる。GNUアセンブラを使っているものが多い。

同じ系統のプロセッサであっても、複数のアセンブリ言語の方言が存在する。アセンブラによっては他の方言のアセンブリ言語も使用可能な場合がある。例えば、TASMはMASM用コードを入力として受け付け可能だが、逆は不可能である。FASM（英語版）とNASMは文法がほぼ同じだが、サポートしているマクロが異なるため、相互の翻訳は困難である。いずれも基本機能は同じだが、追加機能に差異がある^[23]。

歴史

アセンブリ言語は、ごく単純なものまで含めれば、プログラム内蔵方式のコンピュータの最初期の1940年代から存在している。世界で最初に実用的に稼働したノイマン型電子計算機とされるEDSAC (1949) の initial orders（現代の用語ではブートローダーに相当するもの）は、テープにパンチされた十進によるアドレスを、内部表現の二進に変換するなどの機能を持っていた（命令については、「1文字のニーモニック」に見えるかもしれないが、それは実際には同機の機械語そのものである）^[24]。ナサニエル・ロチェスターは1954年に IBM 701 用アセンブラを書いている。1955年、Stan Poley が IBM 650 用言語アセンブリSOAP (Symbolic Optimal Assembly Program) を開発した^[25]。

コンピュータの歴史の初期には、このような、プログラムによって機械語プログラムを生成することを自動プログラミングと呼んだ。

ドナルド・ギリースは、まだ発明されていなかったアセンブラを開発中に、フォン・ノイマンから開発を即座に止めるように言われた、という1950年代初期ならではの逸話がある。当時は、人間が手作業でもできるような瑣末な仕事をコンピュータにさせるような時代が来るとは考えられておらず、単に時間の無駄だとノイマンは考えたのである。

歴史的には多数のプログラム（OSやアプリケーション）がアセンブリ言語だけで書かれてきた。ALGOLの方言であるESPOLで書かれた Burroughs MCP (1961) が登場するまで、オペレーティングシステムはアセンブリ言語で書くのが普通だった。IBMのメインフレーム用ソフトウェアの多くはアセンブリ言語で書かれていた。COBOL、FORTRAN、PL/I などが取って代わっていったが、1990年代になってもアセンブリ言語のコードベースを保守し続けていた大企業も少なくない。

初期のマイクロコンピュータでも同様に広く用いられた。これは、リソースの制約が厳しく、メモリやディスプレイのアーキテクチャが特殊だったからである。また、マイクロコンピュータ向けの高水準言語のコンパイラがなかったという面も重要である。また、初期のマイクロコンピュータのユーザは趣味としての使用が主であり、何でも自前で作るという精神もそれに影響していたと見られる。

1980年代から1990年代にかけて、ホームコンピュータ（ZX Spectrum、コモドール64、Amiga、Atari ST など）でもアセンブリ言語がよく使われていた。というのもそれらのBASICは性能が低く、ハードウェアの全機能を利用できないことが多かったためである。例えば、Amigaにはフリーウェアのアセンブリ言語統合開発環境 ASM-One assembler があり、Microsoft Visual Studio に匹敵する機能を備えていた。

Don French が開発した VIC-20 用アセンブラは 1,639 バイトという小ささで、世界一小さいアセンブラと言われている。アドレスをシンボルで表現でき、各種アドレス計算（四則演算、AND、OR、冪乗など）が可能だった^[26]。

1980年代のビジネスソフトでは、例えば表計算ソフト Lotus 1-2-3 などはアセンブリ言語で書かれていた。日本では松などが該当^[27]する。

1990年代に入っても、コンシューマーゲームの多くはアセンブリ言語でプログラムが書かれていた。しかしゲーム内容が複雑化し、プログラムの規模が増大するにつれて、アセンブラでは開発が困難となり、高水準言語による開発が主流となっていった。例えばプレイステーションではGCCが公式のSDKに含まれていて、標準の開発言語はC言語であった^[28]^[29]。この時代のゲーム機は3次元コンピュータグラフィックスの積極的な導入が始まっており、ハードウェア性能も向上したことから、C言語による開発も十分可能となったが、コンパイラの最適化能力が未成熟だったこともあいまって、ハードウェア性能を最大限引き出すにはアセンブリ言語を駆使した手動最適化や細かなチューニングが必要となることも多かった。セガサターンの最高性能を引き出してプレイステーションに対抗するには、アセンブリ言語を使うしかなかったと述べていた業界関係者もいた^[30]。ただし一方で、ファミコン時代すでにメタルスレイダーグローリーやスーパーファミコンのMOTHER 2・シムシティ^[31]、プレイステーションのクラッシュ・バンディクーで^[32]、開発の一部にLISPが使われていたという話もあり、当時のコンシューマーゲームの分野ではアセンブリ言語やC言語が全てだったというわけではない。

2000年代初頭、マイクロソフトは原始的なプログラマブルシェーダーに対応したDirectX (Direct3D) 8.0をリリースした。このDirect3D 8.0におけるシェーダープログラムは、グラフィックスハードウェアに依存しない中間言語（バイトコード）を出力することのできるアセンブリ言語（シェーダーアセンブラ）を使用して記述するものだった。2001年には世界で初めてプログラマブルシェーダーに対応したコンシューマーゲーム機として初代Xboxが登場したが、このXboxに搭載されていたグラフィックスAPIもDirect3D 8.x相当のカスタマイズ版^[33]であり、CPU上で実行するホストプログラム（ゲームアプリケーション本体のコード）はC++を使って記述する一方、GPU上で実行するシェーダープログラムの記述にはアセンブラを使用していた。のちにHLSLやCg (C for Graphics) といった高水準シェーディング言語が開発され、HLSLに対応したDirect3D 9.0以降はシェーダープログラムも高水準言語を利用して記述するようになった。Direct3D 10のシェーダーモデル4.0以降は、シェーダーアセンブラではなくHLSLの使用が必須となっている^[34]。

現在の最適化コンパイラは人手で書かれたアセンブリ言語のコードと同等の性能を発揮すると言われている^[35]（例外もある^[36]^[37]^[38]）。最近^[いつ?]のプロセッサやメモリサブシステムは複雑化してきたため、コンパイラでもアセンブリ言語でも効果的な最適化がますます困難になってきている^[39]^[40]。さらにプロセッサが高性能化し律速が入出力やページングへ移ることで、コーディングが性能向上に貢献するケースは以前より少なくなっている。

一方C++やC#のような、Cよりもさらに高水準の言語が主流になってからも、コンパイラが出力したアセンブリコードを解析して最適化やチューニングの余地を探るといった手法は一般的に行なわれている^[41]。

利用

低水準言語であるアセンブラはC言語などの高級言語と異なる領域で利用される。

目的

アセンブラを用いる目的として以下が挙げられる。

高速: レジスタ利用やループ展開の最適化
省フットプリント: ランタイムや標準ライブラリの排除
リアルタイム（時間的正確性）: GCスパイク、ページフォルト、プリエンプションの排除
ハードウェア操作
高級言語非対応命令の利用
挙動理解

事例

アセンブリ言語が用いられる事例として以下が挙げられる。

組み込みシステム: 省フットプリントでのハードウェア操作が目的
- 電話機のファームウェア
- 自動車の燃料・点火システム
- センサー
デバイスドライバや割り込みハンドラ、ブートコード、BIOS、POST
- ハードウェアないしはファームウェアの呼び出し規約をアセンブリ言語によりカーネルやドライバにて使用している高級言語の規約へ変換することにより、主要な機能を高級言語で実装することができる。
暗号化: 高級言語非対応命令の使用が目的
- ビット単位ローテート命令
数値計算: 高速化が目的
- コンピュータゲーム
- ライブラリ: 例 - BLAS, 離散コサイン変換（x264のSIMDアセンブリ版^[42]）
リアルタイムシステム: リアルタイム性が目的
- フライ・バイ・ワイヤシステム: 航空航法システムの一種。テレメトリを厳密な制限時間内に解釈して対応する必要
- 医療装置
暗号アルゴリズムは常に厳密に同じ時間で実行することで、タイミング攻撃を防ぐ。
高度なセキュリティが要求され、環境を完全に制御する必要がある場合。
監視・トレース・デバッグのための命令セットシミュレータで、追加のオーバーヘッドを最小に保ちたい場合。
リバースエンジニアリング: 挙動理解が目的
- デバッグ: 例 - コンパイラ最適化の確認
- ソフトウェア改造: 例 - 商用コンピュータゲームの改造
- ハッキング: 例 - コピープロテクト解除
- 学習: コンピュータの理解
自己書き換えコード
コードサイズの上限に制限がある環境
- ブートセクタに格納するブートローダ。例として、MBRでは最大446バイト。
- トラップ処理やシグナルハンドラ起動などのために、カーネルがプロセスのアドレス空間へ見せるコード。vDSOを用い、プロセスからはシェアードオブジェクトを読み込んだように見せる実装が多い。
  - 見せるコードの範囲を正確に把握する必要があるため、コードのエントリだけでなく終了部にもラベルを与える。アセンブリ言語では容易だが、高級言語では一般に不要な機能なのでサポートされていない。
  - 元来はユーザモード用のスタック上にカーネルからコードをコピーして実行していた。欠点として、スタックはユーザモードでの書き込みが禁止できず、スタック上でのコード実行がセキュリティホールとしてしばしば利用されたことから、実装方法の変更が進められている。
オブジェクトファイルに依存した機能
- コンパイラが通常は使用しないセクション等にシンボルを定義することができる。例として、Linuxカーネルではモジュールへ公開するシンボルをマクロEXPORT_SYMBOL（ないしはその派生）^[43]へ与える。このマクロは、インラインアセンブリを用いてオブジェクトファイルのセクション.export_symbolへシンボルの情報を追加し、モジュールローダがシンボル解決にて使用できるようにする。マクロの内容はCPUアーキテクチャには依存せず、その定義もCPUアーキテクチャに依存しないヘッダファイル（include/linux/export.h）^{[注 3]}にあるが、C言語を含め高級言語のみでの実装が難しく、アセンブリが適している。^{[注 4]}

なお一方で、最近^[いつ?]のコンピュータの命令セットはその多くはどれも似ている。したがって、どれか1つのアセンブリ言語を学ぶだけで、基本概念、どんなときにアセンブリ言語を使用するのが適しているか、高水準言語から効率的な実行コードを生成する方法をある程度は学習できる^[44]。

高水準言語との連携

高水準言語の処理系の呼出規約（言語処理系ではなくOSやハードウェアベンダ側で共通化している場合もある）に従うことで、高水準言語と相互にコードを呼び出すことができる。後述のインラインアセンブラなどにより同一のモジュールに埋め込むこともできれば、別モジュールとしてリンケージエディタでリンクすることもある。
多くのコンパイラは、機械語を直接生成するのではなく、アセンブリ言語のコードを生成し、それをアセンブラに通している。人間によるデバッグや最適化などに便利である（機械による最適化には、内部表現を使ったほうが便利なので、あまり意味がない）。その意味ではアセンブリ言語は、目に見えない形ではあるが最も利用頻度の高いプログラミング言語といえるという主張もあるが、その意味では機械語が絶対的に最も利用頻度の高いプログラミング言語である。
インラインアセンブラのある言語ないし処理系では、ソース中にアセンブリ言語による記述を含めることができる。例えばLinuxカーネルではその利用が多い。アセンブリ言語と同様の利点が得られるかわりに、やはりアセンブリ言語と同様にプログラミング言語を使う利点（移植性など）が失われる。

脚注

[脚注の使い方]

注釈

^ IBMはSystem/360から2011年現在まで一貫してアセンブラ言語 (Assembler Language)と呼んでいる。例：IBM High Level Assembler
^ MIPSのアセンブラの一部など、（分岐命令のターゲットアドレスの先頭にある機械語命令を対象として）その分岐命令の遅延スロットへの移動を（副作用がない場合に）アセンブラ疑似命令 (.set bopt) の指示に応じて行うものもある。OPTASM（SLR社）という最適化アセンブラもあった。
^ 厳密にはCPUのビット幅に依存するが、マクロ定義はこれを条件付きコンパイルによりカバーしている。
^ GCC等、C言語への拡張によりシンボルへのセクション指定が可能なコンパイラはあるが、コンパイラへの強い依存性が生じる。アセンブリ言語であれば、およそセクションをサポートしたオブジェクトファイルが出力できるならばセクションの指定は何らかの手段で実装可能となる。

出典

^ ^a ^b "ニモニックによって表したプログラムをアセンブリ言語(assembly language)プログラムと呼ぶ。" 伊藤. 機械語とアセンブリ言語. 埼玉大学, 電気電子物理工学実験III. 2022-12-25閲覧.
^ Stroustrup, Bjarne, The C++ Programming Language, Addison-Wesley, 1986, ISBN 0-201-12078-X: "C++ was primarily designed so that the author and his friends would not have to program in assembler, C, or various modern high-level languages." - assembler を assembly language の意味で使っている例
^ Intel Architecture Software Developer’s Manual, Volume 2: Instruction Set Reference. INTEL CORPORATION. (1999) 2010年11月18日閲覧。
^ ^a ^b "各命令に、人間にとって意味があり、その命令が行う処理を類推できる文字列を対応付ける。この文字列をニモニック(mnemonic)と呼ぶ。" 伊藤. 機械語とアセンブリ言語. 埼玉大学, 電気電子物理工学実験III. 2022-12-25閲覧.
^ “The SPARC Architecture Manual, Version 8”. SPARC, International (1992年). 2011年12月10日時点のオリジナルよりアーカイブ。2012年10月27日閲覧。
^ ^a ^b David Salomon (1993). Assemblers and Loaders
^ Microsoft Corporation. “MASM: Directives & Pseudo-Opcodes”. 2011年3月19日閲覧。
^ ^a ^b ^c ^d Intel Architecture Software Developer’s Manual, Volume 2: Instruction Set Reference. INTEL CORPORATION. (1999). pp. 442 and 35 2010年11月18日閲覧。
^ Evans, David (2006年). “x86 Assembly Guide”. University of Virginia. 2010年11月18日閲覧。
^ goto文が存在する言語もあるが、限定利用が推奨される
^ Answers.com. “assembly language: Definition and Much More from Answers.com”. 2008年6月19日閲覧。
^ NESHLA: The High Level, Open Source, 6502 Assembler for the Nintendo Entertainment System
^ Z80 Op Codes for ZINT
^ コンピュータ予約システム (CRS) やクレジットカード会社で使われているトランザクションOS
^ Dr. H.D. Mills (1970) 提案、Marvin Kessler 実装 in IBM連邦政府システム部門
^ “Concept 14 Macros”. MVS Software. 2009年5月25日閲覧。
^ Saxon, James, and Plette, William, Programming the IBM 1401, Prentice-Hall, 1962, LoC 62-20615. - assembly program という用語を使っている例
^ J.DONOVAN, JOHN (1972). systems programming. pp. 59. ISBN 0-07-085175-1
^ bit 編集部『bit 単語帳』共立出版、1990年8月15日、8頁。ISBN 4-320-02526-1。
^ Hyde, Randall. "Chapter 12 – Classes and Objects". The Art of Assembly Language, 2nd Edition. No Starch Press. © 2010.
^ (John Daintith, ed.) A Dictionary of Computing: "meta-assembler"
^ Beck, Leland L. (1996). “2”. System Software: An Introduction to Systems Programming. Addison Wesley
^ Randall Hyde. “Which Assembler is the Best?”. 2007年10月18日時点のオリジナルよりアーカイブ。2007年10月19日閲覧。
^ Salomon. Assemblers and Loaders. p. 7 2012年1月17日閲覧。
^ “The IBM 650 Magnetic Drum Calculator”. 2012年1月17日閲覧。
^ Jim Lawless (2004年5月21日). “Speaking with Don French : The Man Behind the French Silk Assembler Tools”. 2008年8月21日時点のオリジナルよりアーカイブ。2008年7月25日閲覧。
^ 松 --- 事実上最初のパソコン用日本語ワープロソフト
^ Toolchain, libraries and headers relationship - PlayStation Development Network
^ What were PS1 and N64 games written in? : gamedev
^ “SegaBase Volume 6 - Saturn”. Eidolon's Inn (2008年1月10日). 2014年7月2日時点のオリジナルよりアーカイブ。2013年6月27日閲覧。
^ Lispによるリターゲッタブルコードジェネレータの実装 (PDF) Archived 2008年8月20日, at the Wayback Machine.
^ OOエンジニアの輪！～第 21 回川合史朗さんの巻～ | オブジェクトの広場
^ NVIDIA Xbox GPU Specs | TechPowerUp GPU Database
^ Using Shaders in Direct3D 10 - Win32 apps | Microsoft Docs
^ Rusling, David A.. “The Linux Kernel”. 2012年3月11日閲覧。
^ “Writing the Fastest Code, by Hand, for Fun: A Human Computer Keeps Speeding Up Chips”. New York Times, John Markoff (2005年11月28日). 2010年3月4日閲覧。
^ “Bit-field-badness”. hardwarebug.org (2010年1月30日). 2010年2月5日時点のオリジナルよりアーカイブ。2010年3月4日閲覧。
^ “GCC makes a mess”. hardwarebug.org (2009年5月13日). 2010年3月16日時点のオリジナルよりアーカイブ。2010年3月4日閲覧。
^ Randall Hyde. “The Great Debate”. 2008年6月16日時点のオリジナルよりアーカイブ。2008年7月3日閲覧。
^ “Code sourcery fails again”. hardwarebug.org (2010年1月30日). 2010年4月2日時点のオリジナルよりアーカイブ。2010年3月4日閲覧。
^ ［CEDEC］「FINAL FANTASY XV」の最適化はこうして行われた - GamesIndustry.biz Japan Edition
^ “x264.git/common/x86/dct-32.asm”. git.videolan.org (2010年9月29日). 2012年3月4日時点のオリジナルよりアーカイブ。2010年9月29日閲覧。
^ “[https://github.com/torvalds/linux/blob/master/include/linux/export.h GitHub, torvalds / linux, include/linux/export.h]”. 2023年10月8日閲覧。
^ Hyde, Randall (1996年9月30日). “Foreword ("Why would anyone learn this stuff?"), op. cit.”. 2010年3月25日時点のオリジナルよりアーカイブ。2010年3月5日閲覧。

参考文献

Jonathan Bartlett: Programming from the Ground Up. Bartlett Publishing, 2004. ISBN 0-9752838-4-7
Also available online as PDF. 2024年3月20日閲覧。
Robert Britton: MIPS Assembly Language Programming. Prentice Hall, 2003. ISBN 0-13-142044-5
Paul Carter: PC Assembly Language. Free ebook, 2001.
Website
Jeff Duntemann: Assembly Language Step-by-Step. Wiley, 2000. ISBN 0-471-37523-3
Randall Hyde: The Art of Assembly Language. No Starch Press, 2003. ISBN 1-886411-97-2
Peter Norton, John Socha, Peter Norton's Assembly Language Book for the IBM PC, Brady Books, NY: 1986.
Michael Singer, PDP-11. Assembler Language Programming and Machine Organization, John Wiley & Sons, NY: 1980.
Dominic Sweetman: See MIPS Run. Morgan Kaufmann Publishers, 1999. ISBN 1-55860-410-3
John Waldron: Introduction to RISC Assembly Language Programming. Addison Wesley, 1998. ISBN 0-201-39828-1

外部リンク

Machine language for beginners
Unix Assembly Language Programming
IBM High Level Assembler IBMのメインフレーム用アセンブリ言語のマニュアル
PPR: Learning Assembly Language
Assembly Language Programming Examples
Authoring Windows Applications In Assembly Language
Assembly Optimization Tips by Mark Larson
NASM Manual
Z80/Z180/8085 Assembler

[2] IBMはSystem/360から2011年現在まで一貫してアセンブラ言語 (Assembler Language)と呼んでいる。例：IBM High Level Assembler

[4] MIPSのアセンブラの一部など、（分岐命令のターゲットアドレスの先頭にある機械語命令を対象として）その分岐命令の遅延スロットへの移動を（副作用がない場合に）アセンブラ疑似命令 (.set bopt) の指示に応じて行うものもある。OPTASM（SLR社）という最適化アセンブラもあった。

[46] 厳密にはCPUのビット幅に依存するが、マクロ定義はこれを条件付きコンパイルによりカバーしている。

[47] GCC等、C言語への拡張によりシンボルへのセクション指定が可能なコンパイラはあるが、コンパイラへの強い依存性が生じる。アセンブリ言語であれば、およそセクションをサポートしたオブジェクトファイルが出力できるならばセクションの指定は何らかの手段で実装可能となる。

[:0-1] "ニモニックによって表したプログラムをアセンブリ言語(assembly language)プログラムと呼ぶ。" 伊藤. 機械語とアセンブリ言語. 埼玉大学, 電気電子物理工学実験III. 2022-12-25閲覧.

[3] Stroustrup, Bjarne, The C++ Programming Language, Addison-Wesley, 1986, ISBN 0-201-12078-X: "C++ was primarily designed so that the author and his friends would not have to program in assembler, C, or various modern high-level languages." - assembler を assembly language の意味で使っている例

[intel-1999-5] Intel Architecture Software Developer’s Manual, Volume 2: Instruction Set Reference. INTEL CORPORATION. (1999) 2010年11月18日閲覧。

[:1-6] "各命令に、人間にとって意味があり、その命令が行う処理を類推できる文字列を対応付ける。この文字列をニモニック(mnemonic)と呼ぶ。" 伊藤. 機械語とアセンブリ言語. 埼玉大学, 電気電子物理工学実験III. 2022-12-25閲覧.

[7] “The SPARC Architecture Manual, Version 8”. SPARC, International (1992年). 2011年12月10日時点のオリジナルよりアーカイブ。2012年10月27日閲覧。

[Salomon-8] David Salomon (1993). Assemblers and Loaders

[9] Microsoft Corporation. “MASM: Directives & Pseudo-Opcodes”. 2011年3月19日閲覧。

[intel-1999-MOV-10] Intel Architecture Software Developer’s Manual, Volume 2: Instruction Set Reference. INTEL CORPORATION. (1999). pp. 442 and 35 2010年11月18日閲覧。

[11] Evans, David (2006年). “x86 Assembly Guide”. University of Virginia. 2010年11月18日閲覧。

[12] goto文が存在する言語もあるが、限定利用が推奨される

[assembly-language?cat=technology-13] Answers.com. “assembly language: Definition and Much More from Answers.com”. 2008年6月19日閲覧。

[14] NESHLA: The High Level, Open Source, 6502 Assembler for the Nintendo Entertainment System

[15] Z80 Op Codes for ZINT

[16] コンピュータ予約システム (CRS) やクレジットカード会社で使われているトランザクションOS

[17] Dr. H.D. Mills (1970) 提案、Marvin Kessler 実装 in IBM連邦政府システム部門

[18] “Concept 14 Macros”. MVS Software. 2009年5月25日閲覧。

[19] Saxon, James, and Plette, William, Programming the IBM 1401, Prentice-Hall, 1962, LoC 62-20615. - assembly program という用語を使っている例

[20] J.DONOVAN, JOHN (1972). systems programming. pp. 59. ISBN 0-07-085175-1

[21] t 編集部『bit 単語帳』共立出版、1990年8月15日、8頁。ISBN 4-320-02526-1。

[22] Hyde, Randall. "Chapter 12 – Classes and Objects". The Art of Assembly Language, 2nd Edition. No Starch Press. © 2010.

[23] (John Daintith, ed.) A Dictionary of Computing: "meta-assembler"

[24] Beck, Leland L. (1996). “2”. System Software: An Introduction to Systems Programming. Addison Wesley

[Hyde-25] Randall Hyde. “Which Assembler is the Best?”. 2007年10月18日時点のオリジナルよりアーカイブ。2007年10月19日閲覧。

[26] Salomon. Assemblers and Loaders. p. 7 2012年1月17日閲覧。

[27] “The IBM 650 Magnetic Drum Calculator”. 2012年1月17日閲覧。

[28] Jim Lawless (2004年5月21日). “Speaking with Don French : The Man Behind the French Silk Assembler Tools”. 2008年8月21日時点のオリジナルよりアーカイブ。2008年7月25日閲覧。

[29] 松 --- 事実上最初のパソコン用日本語ワープロソフト

[30] Toolchain, libraries and headers relationship - PlayStation Development Network

[31] What were PS1 and N64 games written in? : gamedev

[32] “SegaBase Volume 6 - Saturn”. Eidolon's Inn (2008年1月10日). 2014年7月2日時点のオリジナルよりアーカイブ。2013年6月27日閲覧。

[33] Lispによるリターゲッタブルコードジェネレータの実装 (PDF) Archived 2008年8月20日, at the Wayback Machine.

[34] OOエンジニアの輪！～第 21 回川合史朗さんの巻～ | オブジェクトの広場

[35] NVIDIA Xbox GPU Specs | TechPowerUp GPU Database

[36] Using Shaders in Direct3D 10 - Win32 apps | Microsoft Docs

[37] Rusling, David A.. “The Linux Kernel”. 2012年3月11日閲覧。

[goto-38] “Writing the Fastest Code, by Hand, for Fun: A Human Computer Keeps Speeding Up Chips”. New York Times, John Markoff (2005年11月28日). 2010年3月4日閲覧。

[bit-fild-39] “Bit-field-badness”. hardwarebug.org (2010年1月30日). 2010年2月5日時点のオリジナルよりアーカイブ。2010年3月4日閲覧。

[gcc-mess-40] “GCC makes a mess”. hardwarebug.org (2009年5月13日). 2010年3月16日時点のオリジナルよりアーカイブ。2010年3月4日閲覧。

[GreatDebate1-41] Randall Hyde. “The Great Debate”. 2008年6月16日時点のオリジナルよりアーカイブ。2008年7月3日閲覧。

[compiler-fails1-42] “Code sourcery fails again”. hardwarebug.org (2010年1月30日). 2010年4月2日時点のオリジナルよりアーカイブ。2010年3月4日閲覧。

[43] ［CEDEC］「FINAL FANTASY XV」の最適化はこうして行われた - GamesIndustry.biz Japan Edition

[44] “x264.git/common/x86/dct-32.asm”. git.videolan.org (2010年9月29日). 2012年3月4日時点のオリジナルよりアーカイブ。2010年9月29日閲覧。

[45] “[https://github.com/torvalds/linux/blob/master/include/linux/export.h GitHub, torvalds / linux, include/linux/export.h]”. 2023年10月8日閲覧。

[48] Hyde, Randall (1996年9月30日). “Foreword ("Why would anyone learn this stuff?"), op. cit.”. 2010年3月25日時点のオリジナルよりアーカイブ。2010年3月5日閲覧。

[1]

[注 1]

[2]

[注 2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

[39]

[40]

[41]

[42]

[43]

[注 3]

[注 4]

[44]

アセンブリ言語

概要