共通中間言語
共通中間言語(きょうつうちゅうかんげんご、英語: Common Intermediate Language、略称 : CIL("sil" や "kil" と発音される[要出典]))は、共通言語基盤 (Common Language Infrastructure、CLI) において定義されている、人間が解読可能な最も低水準なプログラミング言語である。これは.NET FrameworkやMonoにより使用される。CLI互換な実行環境をターゲットとしている言語はCILにコンパイルされる。そのCILはバイトコードスタイルフォーマットであるオブジェクトコードにより組み立てられている。CILはオブジェクト指向なアセンブリ言語であり、完全なスタックベースである。そのバイトコードはネイティブコードに翻訳されるか、仮想機械により実行される。 .NET言語がベータリリースである間、CILはMicrosoft Intermediate Language (MSIL) と呼ばれていた。C#およびCLIの標準化により、現在ではバイトコードは公式にCILと呼ばれる[1]。 概要CLIプログラミング言語のコンパイルにより、ソースコードはプラットフォームやプロセッサ固有のオブジェクトコードではなく、CILコードに翻訳される。CILはCPUやプラットフォームに依存しない命令セットである。従って、CILはWindows上の.NETランタイムやクロスプラットフォームなMonoランタイムのようなCLIをサポートするどんな環境でも動作する[2]。この性質により、理論的にはプラットフォームやCPUの種類に応じて異なる実行可能ファイルを配布する必要がなくなる。CILコードは安全のため実行時に検証され、ネイティブにコンパイルされた実行可能ファイルよりも優れた安全性と信頼性を提供する。 実行プロセスは以下のようなものである。
命令CILバイトコードは以下のタスクのグループに分けられる命令である。 計算モデルCILはオブジェクト指向かつスタックベースである。これは、たいていのプログラミング言語同様、命令のパラメータと結果が、いくつかのレジスタや他のメモリ領域に保持されるのではなく、単一のスタック上に保持されることを意味する。 x86における加算命令のアセンブリコード例を挙げる。 add eax, edx
ここで、eaxとedxは汎用レジスタであり、上記はeaxにedxの内容を加算代入している。 これに相当する中間言語 (IL) のコードは以下のように表せる。 ldloc.0 ldloc.1 add stloc.0 // a = a + b または a += b; ここで、スタック上に2つのローカル変数がプッシュされる。加算命令が呼び出された際にオペランドがポップされ結果がプッシュされる。残った値はその後ポップされ最初のローカル変数にストアされる。 オブジェクト指向概念CILは同様にオブジェクト指向概念に拡張される。オブジェクトを作成したり、メソッドを呼び出したり、そしてフィールドのような他の型のメンバーを使用したりできる。 CILはオブジェクト指向に設計され、各メソッドは(いくつかの例外を除き)クラスに属する必要がある。これは静的メソッドにもあてはまる。 .class public Foo { .method public static int32 Add(int32, int32) cil managed { .maxstack 2 ldarg.0 // 1つ目の引数をロード; ldarg.1 // 2つ目の引数をロード; add // それらを加算; ret // 結果を戻す; } } このメソッドは、 int r = Foo.Add(2, 3); // 5
CILにおいては、以下のようになる。 ldc.i4.2 ldc.i4.3 call int32 Foo::Add(int32, int32) stloc.0 インスタンスクラスインスタンスクラスには、最低でも1つのコンストラクタと、いくつかのインスタンスメンバーが含まれる。以下のクラスは .class public Car { .method public specialname rtspecialname instance void .ctor(int32, int32) cil managed { /* コンストラクタ */ } .method public void Move(int32) cil managed { /* 実装は省略 */ } .method public void TurnRight() cil managed { /* 実装は省略 */ } .method public void TurnLeft() cil managed { /* 実装は省略 */ } .method public void Brake() cil managed { /* 実装は省略 */ } } オブジェクト作成C#クラスインスタンスは以下のようにして作成される。 Car myCar = new Car(1, 4);
Car yourCar = new Car(1, 3);
上記のステートメントは大体以下のような命令と同じである。 ldc.i4.1 ldc.i4.4 newobj instance void Car::.ctor(int, int) stloc.0 // myCar = new Car(1, 4); ldc.i4.1 ldc.i4.3 newobj instance void Car::.ctor(int, int) stloc.1 // yourCar = new Car(1, 3); インスタンスメソッド呼び出しインスタンスメソッドは以下のように呼び出される。 myCar.Move(3);
CILにおいては、以下のようになる。 ldloc.0 // "myCar"オブジェクトをスタックにロード ldc.i4.3 call instance void Car::Move(int32) メタデータ→詳細は「メタデータ (共通言語基盤)」を参照
CLIはコンパイルされたクラスについての情報をメタデータとして記録する。Component Object Modelのタイプライブラリのように、メタデータによってアプリケーションが、アセンブリ内にあるインターフェイス、クラス、型、メソッド、そしてフィールドをサポートし発見することを可能とする。このようなメタデータを読み取る処理はリフレクションと呼ばれる。 メタデータは属性 の形式のデータである。カスタム属性は 例以下はCILで書かれた基本的なHello worldプログラムであり、文字列 "Hello, world!" をコンソールに表示する。 .assembly Hello {} .assembly extern mscorlib {} .method static void Main() { .entrypoint .maxstack 1 ldstr "Hello, world!" call void [mscorlib]System.Console::WriteLine(string) ret } 以下のコードはオペコードの数をより複雑にしたものである。 以下のコードはJavaバイトコードについての記事の当該コードと比較することもできる。 static void Main(string[] args)
{
for (int i = 2; i < 1000; i++)
{
for (int j = 2; j < i; j++)
{
if (i % j == 0)
goto outer;
}
Console.WriteLine(i);
outer:
}
}
CILシンタックスでは、以下のようになる。 .method private hidebysig static void Main(string[] args) cil managed { .entrypoint .maxstack 2 .locals init (int32 V_0, int32 V_1) ldc.i4.2 stloc.0 br.s IL_001f IL_0004: ldc.i4.2 stloc.1 br.s IL_0011 IL_0008: ldloc.0 ldloc.1 rem brfalse.s IL_001b ldloc.1 ldc.i4.1 add stloc.1 IL_0011: ldloc.1 ldloc.0 blt.s IL_0008 ldloc.0 call void [mscorlib]System.Console::WriteLine(int32) IL_001b: ldloc.0 ldc.i4.1 add stloc.0 IL_001f: ldloc.0 ldc.i4 0x3e8 blt.s IL_0004 ret } これはVMレベル近くでどのようにCILが見えるかを表現したものである。コンパイルされた場合、メソッドはテーブルにストアされ、アセンブリ内部にバイトとして命令がストアされる。そしてそれはPortable Executable (PE) である。 生成CILアセンブリおよび命令は、コンパイラと、実行環境と共に送られるIL アセンブラー (ILASM) と呼ばれるユーティリティのどちらかで生成される。 アセンブルされたILはIL 逆アセンブラー (ILDASM) を使用して再びコードへと逆アセンブルすることもできる。高水準言語(例えばC#やVisual Basic)へと逆コンパイルする.NET Reflectorのような他のツールもある。これにより、ILはリバースエンジニアリングのとても容易なターゲットとなる。この特徴はJavaバイトコードと共通である。しかしながら、コードを難読化するツールもあり、そうすることによりコードが容易に読めなくなるが実行はできるようになる。
実行実行時コンパイル実行時コンパイルによりバイトコードは、CPUにより即座に実行可能なコードへと変換される。この変換はプログラムの実行中、徐々に実行される。実行時コンパイルは環境固有の最適化、実行時型安全性、そしてアセンブリ検証を提供する。これを達成するため、実行時コンパイラは、任意の不正アクセスに対してアセンブリメタデータを調査し、違反を適切に処理する。 事前コンパイルCLI互換な実行環境には、実行時のJIT処理を省いてより高速に実行できるようにするため、アセンブリの事前コンパイルを処理するためのオプションがある。 .NET Frameworkには、事前コンパイルを行うネイティブ イメージ ジェネレーター (Native Image Generator、NGEN) と呼ばれる特殊なツールがある。Monoにも、事前コンパイルを処理するためのオプションがある。 脚注
関連項目外部リンク |