2008-09-30

透過的なLLVM (6)

CentOS 4でLLVMを使いはじめた。__USE_EXTERN_INLINESマクロが定義されていると、GCCはインライン展開を押し進めるべく最適化ヘッダを利用する。/usr/include/stdio.hをひもとこう。

/* If we are compiling with optimizing read this file.  It contains
   several optimizing inline functions and macros.  */
#ifdef __USE_EXTERN_INLINES
# include <bits/stdio.h>
#endif
#if __USE_FORTIFY_LEVEL > 0 && !defined __cplusplus
# include <bits/stdio2.h>
#endif

/usr/include/bits/stdio.hはインライン展開を期待して、関数をいくつか定義する。たとえば、vprintfはvfprintfのラッパーだ。__STDIO_INLINEマクロはextern __inlineに展開されるだろう。

/* Write formatted output to stdout from argument list ARG.  */
__STDIO_INLINE int
vprintf (__const char *__restrict __fmt, _G_va_list __arg)
{
  return vfprintf (stdout, __fmt, __arg);
}

残念なお知らせがある。最適化オプションとともに-std=c99を与えると、LLVM-GCCはvprintfにインライン展開を期待してくれない。結果、/usr/include/stdio.hを利用する全てのコードにvprintfが偏在する。

LLVM-GCCはAppleのGCCを基に開発された。尋ねよ、さらば見出さん。-fno-gnu89-inlineがあるとLLVM-GCCのマニュアルは教えている。

This option is accepted by GCC versions 4.1.3 and up. In GCC versions /* APPLE LOCAL extern inline */ prior to 4.3 (4.2 for Apple's gcc), C99 inline semantics are not supported, and thus this option is effectively assumed to be present regardless of whether or not it is specified; the only effect of specifying it explicitly is to disable warnings about using inline functions in C99 mode. Likewise, the option -fno-gnu89-inline is not supported in versions of /* APPLE LOCAL extern inline */ GCC before 4.3 (4.2 for Apple's gcc). It is supported only in C99 or gnu99 mode, not in C89 or gnu89 mode.

もっとも、システムヘッダとコンパイラの歩調が合ってないことが問題なのだけれど。

2008-09-29

可搬なシェルスクリプト (2)

SUSv3は計算結果がnullか0でなければexprが0で終了すると規定している。

#! /bin/sh

set -e

output="-"

while getopts "ho:" opt; do
    case "$opt" in
        h)
            printf 'Usage: %s [ -h ] [ -o FILE ] [file...]\n' "$0"
            exit 1
            ;;
        o)
            output="$OPTARG"
            ;;
        ?)
            exit 1
            ;;
    esac
done

shift=`expr "$OPTIND" - "1"`
shift "$shift"

printf '[output=%s]\n' "$output"
printf '[%s]\n' "$@"

なにもオプションを指定しないと、シェルスクリプトは期待したように動作しない。shift=`expr "$OPTIND" - "1"`$OPTINDが1のときに0で終了する。set -eはコマンドが正常に終了しなかった場合にシェルスクリプトをただちに終了する。

shift=`expr "$OPTIND" - "1" || true`
shift "$shift"

塵理論

LLVM-GCCの出力結果を眺めていると、当然のようにアウト・オブ・オーダー最適化がなされていて、コンパイラ技術ってやっぱり非モテ技術でありつづけているんだ、と、その瞬間、フラッシュバック、X端末がずらりと並んだ窓のない部屋が襲いかかる。たとえ、iPhoneのクゥゥゥルを実現するためであったとしても、それはイーガンと同じくらいにしかクゥゥゥルでない(コンパイラ技術の因襲だもの、アップルのプレゼンテーションソフトを使ったところで非モテは解消されやしない)。まさに、というよりも、初手から塵理論はそういう話だった。アウト・オブ・オーダー実行がPentiumのハッタリだったように。

2008-09-27

透過的なLLVM (5)

そして、Apple (Computer,) Inc.はlibtoolを発明した。Apple libtoolのマニュアルに曰く、

Libtool with -static is intended to replace ar(5) and ranlib.

動的リンクライブラリはさておくとして、問題はMach-Oユニバーサルバイナリだ。もちろん、-Oで終わる単語(うん、たとえば、シロガネ-OとかPARANOIA-Oとか)はXで始まる単語と同じくらいろくでもないに決まっている。

The libtool command takes the specified input object files and creates a library for use with the link editor, ld(1). The library's name is specified by output (the argument to the -o flag). The input object files may be in any correct format that contains object files ("universal" files, archives, archives, object files). Libtool will not put any non-object input file into the output library (unlike ranlib, which allows this in the archives it operates on).

Mach-OユニバーサルバイナリはNeXTに由来する。CPUタイプ(とサブタイプ)ごとのオブジェクトファイルを合体してユニバーサルバイナリにする(うん、厳密にはオブジェクトファイルがそれぞれのアーキテクチャの機械語コードを内包しているかも)。合体は(釣りバカ日誌の)浜チャンにまかせておきたい。同居人はPowerPCのPowerBookを使いつづけているけれど、私はMacBook Proに移行して久しい(初期型なのでx86-64ではないCoreDuoだけど)。

ユニバーサルバイナリを捨てるとしたら、捨てたのだけれど、利点は、静的ライブラリの作成に際して、ranlibを忘れないことくらいだ(うん、それは実際、悪くはない)。動的ライブラリの作成に際しては、特にC++を使用する場合、使用するのだけれど、素直にg++ -dynamiclibを使用するほうがましだ(悪いのはlibstdc++だ)。

畢竟、Apple libtoolがなくても生きていけるし、生きていく資格なら初手から要らない。じゃあ、なぜ、と言えば、Boostが静的リンクライブラリをビルドするためにApple libtoolを使おうとするからだ。

2008-09-26

strcat

CURL 7.19.0をLLVM-GCC 4.2でコンパイルすると、test539が失敗する。LLVM-GCC固有の問題なのか、GCC 4.2の問題なのかは知らない。

標準は、char *strcat(char *restrict s1, const char *restrict s2);が第一引数s1の末尾に第二引数s2の内容をコピーしてからs1を返すと定めている。充分な最適化オプションを指定し、-fno-builtinを指定しなければ、GCCはstrcatをインライン展開するかもしれない。以下のコードはtests/libtest/lib539.cから抜粋した。

newURL = strcat (strcpy ((char*)malloc (strlen (URL) + 3),
                         URL),
                 "./");

新しく確保した領域にURL"./"を連結した文字列を保存する。newURLmallocで確保した領域の先頭のアドレスを指すだろう。懐かしさこそ感じれど、このコード自体にどうというところはない。

p = malloc(strlen(URL) + 3);
p = strcpy(p, URL);
newURL = strcat(p, "./");
assert(p == newURL);

標準はassertが成功することを保証する。LLVM-GCC 4.2はstrcatstrlenmemcpyに展開する。なにかがおかしくなる。展開の結果を擬似的にCで表現すると、

p = malloc(strlen (URL) + 3);
p = strcpy(p, URL);
newURL = p + strlen(p);
memcpy(newURL, "./", 3);
assert(p == newURL);

assertは成功しない。犯人は誰だろう。これはミステリではないので、strcatの返り値を信用しないようにコードを書き換えれば死人は甦るかもしれない。

2008-09-24

柔らかい現実時間 (2)

多数の非同期入力を読んで、データをこねこねして、多数の非同期出力に書きだす。データをこねこねする処理を定期的に行う。伝統的で先進的なサーバアプリケーションが直面している問題は、だいたいこのようなものだと断定して間違いなかろう(たとえば、AJAXだったり、メディア合成だったり、ネットワークゲームだったり)。

そもそも、負荷が高かったら現実時間なんて望むらくもない。それでもしばしば望むのだ。負荷が高い場合は特定の処理を優先してほしいと。望んだことを叶えるべく、ウンコな並列処理機構のウンコなオプションを端から試す。よくよく考え直そう。データセンタに走っていって、新しいマシンをぶちこむほうが先だ。

負荷がほどほどだったら、システムが望んだ時間間隔で処理の機会を与えてくれることを期待して良い、わけはない。総体としてのサーバアプリケーションはクライアントアプリケーションより資源を管理しやすいけれど、リアルタイムOSを使わないのならば(使うの?)、完全に資源を管理できはしない(言うまでもない。Linuxカーネル 2.6はリアルタイム性を大幅に改善したけれど)。

望んだ定期的な時間間隔の二分の一の時間間隔で機会を与えてくれるようにとシステムに頼むことにしよう(二分の一はサンプリング定理を盲目的に適用しただけで、どんな時間間隔も気の向くままに)。機会を与えられるたび、現在時刻を調べて定期的に処理するべき処理を行う。

システムにお願いする方法はどうしよう。現実的に言えば、非同期入出力のイベントキュー(つまり、selectとかpollとか、/dev/pollとかkqueueとかepollとか)のタイムアウトの精度で充分だ。非同期入出力が本当に多数だったら、イベントキューはタイムアウトしている余裕はなく、機会はもっとたくさん与えられるだろう。シグナルベースのタイマを使用する場合でも、再入可能性の厄介を避けるためにセルフパイプを使うならば、結局、イベントキューに帰着する。

2008-09-22

柔らかい現実時間 (1)

Google ChromeがtimeBeginPeriod(1)を呼び出していたって知ったことじゃない。そもそも、それを捨てたところから二十一世紀は始まったのだ。もちろん、ぼくにとっての。

Cの並列処理機構はウンコで、ウンコを継承したさまざまなプログラミング言語の並列処理機構はウンコだった。結局、最適な時分割と最適な優先度付与はしばしばプログラマ自身の仕事だった。そのプログラマがぼくでなかったらよいのにと思わなかったといえば嘘になる。

だれもが最初に望み、最初に試すだろう。目覚まし時計が正確に悪魔を召還することを。悪魔が忙しくなければ、窓から少女が(言うまでもない、おさななじみの少女が)転がりこんでくるかもしれない。悪魔は、しかし、たいていとても忙しい。畢竟、昔ながらの方法、忙しい繰り返しが使われる。目覚まし時計を見て、少し眠って、また目覚まし時計を見て、ついに慌てて飛び起きるのにそれは似ている。目覚まし時計は鳴らないのだ。

直感的ではないひとつの原因は、言うまでもない、時計の精度とタイマの精度にある。