前回は、関数[1]が呼ばれた際に、関数内での局所的な情報をどのように管理するかについて説明しました。
今回は、関数呼び出しにおける連携方法について説明しようと思います。
引数と戻り値
引数
関数の呼び出し元は、さまざまな形式で引数を指定します。たとえば、
- 自身の局所変数の値
- 自身に指定された引数
- 他の関数の呼び出し結果
- 上記の値から導出された値(例: 四則演算/構造体参照等)
一方で(一般的な)言語仕様上から見て、呼び出された側にとっての引数は、関数終了まで領域が保持されている=終了後は必要ない、という点では局所変数と実質的に差異がありません。
そのため、Intel x86アーキテクチャで関数呼び出しを実現する場合、呼び出し元は引数をスタック上に格納します。
呼び出し先の関数は、スタック上の引数をEBPレジスタ相対の間接アドレッシングで参照します。
格納時のESPレジスタに対する即値指定と、参照時のEBPレジスタに対するそれが異なるのは、
- 関数復帰の際の呼び出し元アドレス格納領域(+4)
- 旧EBP値の格納領域(+4)
上記の分だけスタック上に領域が確保されているためです。
関数が呼び出された際のスタックは以下のような構成となっています。
戻り値
関数引数が複数の値を扱う必要があったのに対して、戻り値は単一の値を扱うだけです。
Intel x86アーキテクチャで関数呼び出しを実現する場合、関数の返却値がEAXレジスタに格納された状態で呼び出し元に復帰します。
再帰呼び出し
関数呼び出しの例として、以下のような再帰呼び出しを実装してみましょう(この処理そのものには全く意味はありません)。
上記のCプログラムをアセンブラで実現すると、以下のようになります。
再帰呼び出しを行う get_crossing_depth()
では、再帰呼び出しのための引数格納領域として、冒頭のenter
命令の時点で4バイト×2=8バイト分をスタック上に確保しています(enter
の詳細は前回の説明を参照)。
また、呼び出し元のentry_point
側でも、ESPレジスタを移動させることで呼び出し引数の格納領域を確保しています。
ESP/EBPと、それぞれの値が格納されている領域の相対位置さえ把握してしまえば、やっている処理は単純ですから、とくに難しいことは無いでしょう。
低レイヤから見た関数呼び出し
Application Programming Interface(API)は、当該プログラミング言語において特定の機能を呼び出す際の仕様であり、専らソースコード上での記述方式について定めたものを指します。
その一方で Application Binary Interface(ABI)は、アセンブラレベルでの実際の連携実現方式について定めたものを指します。「関数呼び出しの際の引数格納形式」のような"呼出規約(calling convention)もABIを構成する要素となります。
本稿ではこれまで、Intel x86アーキテクチャでの関数呼び出しはスタック経由で引数を受け渡しする、と説明してきました。
しかしその一方で、汎用レジスタを多数保持するSPARCプロセッサのようなCPUアーキテクチャの場合は、一定数以内の引数であればレジスタ経由で引数を受け渡すものとABIで定められています。
以上のように、ABIはCPUアーキテクチャに依存するところが大きいのですが、必ずしもCPUアーキテクチャのみで決定されるわけではありません。
たとえば、先の再帰呼び出し実装の例では、とくに説明せずに、Cプログラムでの引数リスト上の左から右の順で、アドレス低位(ESPに対する加算分の少ない)側から格納しました。
これは、Intel x86アーキテクチャのCコンパイラで用いられる標準的な呼出規約(“cdecl”形式)において、スタックへの引数格納仕様がそのように定められているためです。
先の再帰呼び出し実装の例からもわかるように、引数の個数を特定するための情報受け渡しが行われない“cdecl”形式では、引数格納領域の解放は呼び出し元の責務となります。
引数の数が固定=呼び出し先で解放可能な関数の呼び出しであっても、領域解放責務は呼び出し元にありますので、結果として引数領域の解放処理が呼び出し元の数だけ散在することになりますが、裏を返せば、引数格納領域の管理が呼び出し元に一任されることになりますから、事前に必要なだけ確保した領域を再利用することもできれば、任意個の引数を渡すことも可能になります。
その一方で、“stdcall”形式と呼ばれる呼出規約では、引数格納領域の解放は呼び出し先の責務とされます。
これは先ほどの "cdecl" の逆で、引数の数が固定である関数の呼び出しの場合は、引数領域の解放処理が呼び出し先に集約されるメリットと引き換えに、引数格納領域の管理自由度や、可変引数の使用が制限されることになります。
これらの呼出規約は、アセンブラソースを生成するプログラミング言語や、最終的な稼働環境のOSにおいて、機能と制約のバランスの落とし所をどこにするか、といった部分を考慮して決定されます。
すべてを自前の関数で構成するのであれば、既存の呼出規約を無視して、「MY呼出規約による連携」でも構いませんが、一般的なアセンブラの用途としては、性能/ハード依存要求の高い部分だけをアセンブラで実装し、それ以外はCなどを使用するパターンがほとんどでしょうから、呼出規約を含めたABIに対する配慮が重要になります。
おわりに
全6回(+号外)に渡って、アセンブラプログラミングについて説明させていただいたわけですが、如何でしたでしょうか?
ソフトウェアの世界は、日々多機能化/高機能化と共に複雑化が進んでいますが、最終的にはアセンブラレベルでのデータ転送や制御遷移の組み合わせに過ぎません(量子コンピューティング等にパラダイムシフトでもすれば、違ってくるのでしょうが…)。
アセンブラレベルからのボトムアップ的な視点を身につけることで、ソフトウェアへの理解はより深まることでしょう。
この連載が、そのような理解へのきっかけになれば幸いです。