乱数と再現性：非再現性バグを確率とアルゴリズムの視点から読み解く

2025年10月18日2025年10月20日

ゲーム開発やAIシミュレーションにおいて、開発者が頻繁に直面する問題の一つが「非再現性バグ（non-reproducible bug）」である。同じコードを、同じ環境で実行したはずなのに、ある時は正常に動作し、別の時にはエラーを吐く。テスターの報告には「再現手順不明」と記され、デバッグチームを悩ませる。
こうした現象は、単なる偶然の産物ではない。多くの場合、その背後には「乱数生成」と「再現性設計」の微妙な齟齬が潜んでいる。乱数はプログラムに“多様性”や“予測不能性”を与えるが、同時に「同一結果を再現できないリスク」も孕む。本稿では、この二律背反をアルゴリズムの観点から解き明かし、
**「乱数＝不確実性の発生源」ではなく、「制御可能な確率構造」**として再評価する。

目次 [ close ]

第1章　乱数とは何か ― アルゴリズムが生む「擬似的な不確実性」

1-1. 真の乱数と擬似乱数

「乱数（Random Number）」とは、理論的には予測不能な値の列を指す。
しかし、コンピュータは完全な決定論的装置であり、**真の乱数（True Random Number）**を自ら生成することはできない。
そのため、実際のシステムでは「擬似乱数（Pseudo Random Number）」が利用される。

擬似乱数は、初期値（シード）をもとに数列を計算的に生成する手法である。
たとえば古典的な**線形合同法（Linear Congruential Generator, LCG）**では、次の式で乱数を得る：

$Xₙ₊₁ = (aXₙ + c) mod m$

ここで $a$, $c$, $m$ は定数であり、$X₀$ がシードに相当する。
この手法は高速かつ単純であるが、パラメータ選択を誤ると周期が短く、分布に偏りが生じることが知られている（例：RANDU問題）。

そこで近年では、より長周期かつ統計的に均一な分布をもつ Mersenne Twister（メルセンヌ・ツイスタ）【1】や、
軽量な Xorshift 系列【2】などが広く使われている。
興味深いのは、これらの「乱数」が厳密には完全に再現可能なものである点だ。
つまり、シードを固定すれば、同じ乱数列が何度でも得られる。

この「再現可能な乱数」という一見矛盾した構造が、後述する“確率的バグ”の理解の鍵を握る。

近年のCPUには、ソフトウェアによる決定論的生成とは異なり、物理現象を利用するハードウェア乱数生成器（True Random Number Generator, TRNG）が搭載されている。
たとえば Intel の RDRAND / RDSEED 命令【3】や、Armv8.5-A の RNDR / RNDRRS 命令【4】などが代表例であり、
OSやランタイムはこれらを /dev/hwrng や getrandom(2)【5】を通じて利用できる（Linuxでは getrandom(2) の使用が推奨されている）。
ただし、ハードウェア乱数も「完全な真の乱数」ではなく、物理ノイズ源やチップ設計への依存を持つため、
暗号やセキュリティ分野では信頼性監査が求められる。
ゲームやシミュレーションの再現性を考える場面では、依然として擬似乱数＋シード管理が中心である。

表A：主要な乱数生成アルゴリズムの比較

アルゴリズム	周期	特徴	主な利用例
LCG	～m（短～中）	実装容易だが偏りや短周期が発生しやすい（RANDU問題）	古典的C標準 rand()
Mersenne Twister (MT19937)	2¹⁹⁹³⁷−1	長周期・高速・均等分布。だが暗号用途や並列化には不向き	旧NumPy RandomState
Xorshift / xoroshiro	長	高速・小状態・一部線形成分に弱点。後続改良版あり	ゲーム実装や一部ライブラリ（※JDK既定はLCG。JDK 17でLXM系など新APIが追加）
PCG (Permuted Congruential Generator)	長	高品質・軽量・分岐可能。現行NumPy既定	NumPy default_rng

1-2. シード（seed）の役割と再現性の源泉

シード値は、乱数生成の「出発点」であり、プログラム内部では“初期状態”として機能する。
たとえば、ゲーム開始時に Random.InitState(12345) と設定すれば、その後の乱数列は完全に固定される。
この仕組みにより、開発者は「特定の挙動を再現する」ことができる。

AIキャラクターの行動、アイテム出現順序、敵のスポーン位置など、確率的イベントであっても、
同じシードを用いれば同一の展開を再生成できる。
したがって、「乱数が原因で再現しないバグが発生した」という表現は正確ではない。
正確には、「シード管理の不備により、再現不能な乱数系列が混入した」という設計上の問題である。

実務で用いられるPRNGは、シードが同じであれば常に決定論的であり、
非再現性はシードや状態遷移の制御が破綻した結果として生じる。
ただし、同一シードであっても並列処理・異なる環境設定・浮動小数点丸め差などによって完全一致しないこともあり得る（後述）。

Pythonでは、旧来の numpy.random.seed(0) による固定がMT19937用APIである一方、
NumPy 1.17以降では rng = np.random.default_rng(seed)（既定は PCG64）【6】が推奨されており、
より高品質で再現性の高い乱数生成が可能になっている。

1-3. 比喩的理解：乱数は“サイコロ”ではなく“回転する歯車”

乱数はよく「サイコロ」に例えられるが、擬似乱数においてはこの比喩は正確ではない。
むしろ、乱数生成器は規則的に回転する歯車の機構に近い。
外から見れば歯車の動きは複雑で予測不能に見えるが、初期の位置（シード）を知っていれば、回転の順序も周期もすべて決定されている。

この理解をもとにすると、乱数の再現性設計とは「歯車の初期位置を記録し、いつでも同じ回転を再現する技術」と言い換えられる。
そして、この“歯車”が他の歯車（スレッド、物理演算、入力イベント）と噛み合うとき、偶発的な非再現性が生じる。

第2章　再現性の設計 ― 「偶然を制御する」ためのプログラム構造

2-1. 再現性（Reproducibility）とは何か

再現性とは、同一の条件・手順で同一結果を得る能力を指す。
この概念は科学の根幹に位置し、実験の信頼性を保証する基盤である。
一方、ソフトウェア開発では「工学的再現性」が重視される。
これは、システムの内部状態や入力系列を厳密に制御・記録し、再実行時に同一挙動を保証するという意味である。

乱数を扱うプログラムにおいて、再現性は主に以下の3要素で決まる：

シード値の固定
乱数生成器の状態遷移の同期
外部要因（スレッド、時間、入力）の制御

これらのいずれかが乱れると、非再現的な挙動が発生する。
したがって、乱数を「完全に制御された疑似的不確実性」として扱うことが、再現性設計の基本となる。

2-2. 並列処理と非決定性

マルチスレッド環境では、同じ乱数列を使っても、スレッド間での実行順序の非決定性が再現性を破壊する。
これは典型的な**レースコンディション（race condition）**の一形態である。
例えば、2つのスレッドが同じ乱数生成器にアクセスすると、生成順序が異なるだけで結果全体がずれていく。

この問題に対して、現代のゲームエンジンや科学シミュレーションではいくつかの対策が取られている：

スレッド単位で独立した乱数生成器を持たせる
グローバルなシード同期機構を設ける
実行順序を固定化する**デターミニスティック・リプレイ（Deterministic Replay）**機構を導入する【7】【8】

多くのエンジンや研究基盤では、「乱数シード＋入力履歴＋主要状態」をログ化して
デターミニスティック・リプレイを実現する手法が採用されている。
ただし、浮動小数点演算やCPUアーキテクチャ差によっても、同一シードでも厳密一致しない現象が起こる【8】。
したがって、クロスプラットフォームでの厳密再現には、ロックステップ設計／入力リプレイに加え、
実行環境の固定化や数値設定の統一が不可欠である。

2-3. 再現性デバッグの実装例

実際の開発現場では、以下のような再現性確保の手法が採用されている：

シード固定テスト：
　Pythonでは numpy.random.seed(0)、C#では Random.InitState(seed) を利用し、確率イベントを固定化する。
入力ログ＋シード記録：
　ユーザー操作やAI決定を全て時系列でログに残し、乱数シードと合わせて再実行することで完全再現を実現。
確率的テスト戦略（Property-Based Testing）：
　ランダム入力を大量に生成し、テスト失敗時にそのシードを記録・報告する。
　後に同じシードで再実行することで「再現不能な失敗」を再構成できる【9】。

これらの実装は単に品質保証の効率を高めるだけでなく、
バグを「確率的現象」として理解するための観測装置としても機能する。

第3章　バグを確率現象として読む ― 「非決定的な現象」の再定義

3-1. 非再現バグの確率モデル

「バグが出たり出なかったりする」――開発者が最も頭を抱える現象である。
このような非再現バグは、直感的には“偶然の結果”に見えるが、実際には確率空間上での状態遷移として説明可能である。

コンピュータ・システムを「状態集合 S」と「遷移関数 f」によって記述すると、各実行時の挙動は以下のように表せる：

$Sₜ₊₁ = f(Sₜ, Rₜ, Iₜ)$

ここで $Rₜ$ は乱数系列、$Iₜ$ は入力イベント（または外部要因）である。
もし $Rₜ$ または $Iₜ$ が非決定的であれば、出力も非決定的になる。
だが、これは「物理的な偶然」ではなく、観測粒度が不足しているために見かけ上ランダムに見えるだけである。
（ただし、ハードウェアノイズ・I/O遅延・キャッシュ競合など、理論上制御不能な要因も一部存在する。）

表B：非再現バグを構成する3要因

要因	具体例	対策
Race（並列競合）	複数スレッドが同PRNGに同時アクセス	スレッドごとに独立PRNGを用意／実行順序の固定
Seed Bias（初期値偏り）	シード未固定・乱数状態の混入	シード初期化の統一・シードログ
Timing（時間的不確定）	タイマー精度・FPS差・浮動小数点分岐	ロックステップ実行・記録再生の導入

3-2. 確率的バグ検出の手法

この確率モデルに基づくと、「再現不能なバグ」も統計的に再構成できる。
その代表的なアプローチが**確率的テスト（Stochastic Testing）**である。

ファズテスト（Fuzz Testing）：
　無作為に生成された入力をプログラムに与え、クラッシュや例外を検出する手法【10】。
　各入力生成には乱数が使われ、失敗したシードを記録して再実行可能にすることで、非再現性を抑制する。
　Googleの OSS-Fuzz や AFL（American Fuzzy Lop）はこの原理に基づく【11】。
モンテカルロ・デバッグ（Monte Carlo Debugging）：
　乱数シードを系統的に変化させ、挙動分布を解析する。
　シードを1万通り試し、バグ発生率を統計的に評価することで、問題の再現条件を定量化できる。
　AIシミュレーションやゲームAI検証にも応用される。
確率ログ解析：
　乱数シード・入力列・スケジューリング情報を時系列で記録する実務的なログ技術。
　“運”に見える失敗を、再実行可能な事象として再構成できる。

3-3. 比喩：バグは“量子的ゆらぎ”ではなく“観測されない状態遷移”

非再現バグはしばしば「量子的な揺らぎ」に喩えられるが、実際には量子とは無関係である。
本質的には、観測の解像度が不足しているために決定論的過程が見えなくなっているだけだ。

たとえば、

フレーム間の演算順序
タイマー精度
スレッド間の同期ミス

といった要素が未記録であれば、再現不能に見える。
しかし、それらを完全にログ化すれば、同じ乱数系列で同一挙動が再生成される。
つまり、非再現性は観測範囲の欠損として説明できる。
再現性を高めるとは、偶然を排除することではなく、観測の解像度を上げることに他ならない。

この視点は、デバッグを「因果の特定作業」から「確率分布の観測設計」へと拡張するものである。
完全決定論的な再現は現実には到達困難であっても、観測設計を精密化することで“非再現的に見える現象”を有限の確率空間上に再構成できる。
この理解が、確率的システムの解析やAI挙動ログ設計においても重要な基礎となる。

第4章　設計哲学としての再現性 ― ゲームと科学の間で

4-1. ゲーム開発における「不確実性の演出」

ゲーム設計においては、すべてを再現可能にすることが必ずしも望ましいわけではない。
むしろ、プレイヤー体験の多様性や緊張感を演出するために、意図的に不確実性を導入することがある。

代表的な例が、Roguelike（ローグライク）ゲームである。
これらのゲームでは、ダンジョン生成やアイテム配置が乱数に依存するが、
同時に「シードラン（Seed Run）」という概念を導入し、特定のシード値を共有することで、
同じ生成世界を他のプレイヤーと再体験できるようにしている。
これは、「偶然の共有」＝制御された確率体験の再配布という設計思想である。

たとえば『Spelunky HD（スペランキーHD）』の「デイリーチャレンジ」はその好例であり、
同日の共通シードで同一レイアウトを全員がプレイする（ただしプラットフォームごとにシードは異なる）【12】。
プラットフォーム差のある設計は、各実装のPRNG差・浮動小数点処理差を吸収し、結果の再現性を担保するためでもある。

また、AI生成コンテンツ（例：敵AIの即興行動、音楽生成など）では、
シードをパラメータとして外部公開することで、“揺らぎを含む再現性”を提供するケースも増えている。
このように、乱数と再現性のバランスは、設計意図の一部として調整可能な芸術的要素にもなっている。

4-2. 再現性と創造性のトレードオフ

科学では再現性が信頼性の根拠である一方、芸術では「再現できない一回性」こそが価値を持つ。
ゲーム開発はこの二極の中間に位置する。
完全再現可能なゲームは、安定性を得る代わりに“驚き”を失う。
一方、完全な不確実性は、プレイヤーに「不公平」や「不信感」を与える。

したがって、理想的な設計は**「制御された不確実性（Controlled Randomness）」**にある。
これは乱数生成アルゴリズムと再現性設計の両立点を探る実践的哲学である。

たとえば、RPGにおける「クリティカルヒット確率」や「ガチャ排出率」は、
乱数アルゴリズムによって厳密に管理されながらも、プレイヤーには“偶然”として提示される。
この「確率の演出」こそ、現代のデジタルゲームが持つ哲学的な特徴といえる。
プレイヤーの信頼を維持しつつ、驚きを設計する――その微妙なバランスは、
再現性の哲学が最も人間的に現れる領域である。

4-3. 今後の展望：確率設計の倫理と透明性

近年、確率要素を含むアルゴリズムの社会的影響が注目されている。
特に、ガチャシステムやAI推薦アルゴリズムでは、乱数の設計や偏りが利用者の行動や心理に直接的な影響を与えることが問題視されている。

そのため、今後は「確率設計の透明性」が求められるだろう。
すなわち、乱数アルゴリズムやシード生成方針を部分的に公開し、検証可能性を担保することが、信頼構築につながる。
ただし、完全な公開はシステム予測・操作リスクを伴うため、透明性と安全性のトレードオフの議論が必要である。

これは、単なる技術的課題ではなく、**アルゴリズム倫理（algorithmic ethics）**の一部として位置づけられる。
確率を「支配」する設計者が、どのように偶然を演出し、どこまで制御するか――その判断は、
もはやエンジニアリングを超えて、創作と倫理の交点にある。

乱数と再現性をめぐる議論は、単なるプログラムの設計問題を超え、
「人間が偶然とどう向き合うか」という哲学的主題へとつながっている。

結論：乱数と再現性をめぐる新しい理解

本稿で見たように、乱数とは「不確実性の象徴」ではなく、決定論的に制御された確率構造である。
再現性とは、この構造の状態空間をどれだけ精密に観測・再構成できるかの指標であり、
偶然とは「観測できなかった決定論」にすぎない。

バグ解析やAI実験において、“偶然”を排除するよりも、確率構造として可視化する視点を持つことが重要である。
非再現性を「不可解な運」ではなく、「観測情報の欠落」としてモデル化できれば、
偶然と再現性の関係は、対立ではなく調和の中に再定義される。

そしてその理解が進めば、
乱数と再現性の境界は、もはや敵対ではなく、創造性と信頼性を両立させる設計軸として活用できるだろう。

参考文献

【1】 Matsumoto, M., & Nishimura, T. (1998). Mersenne Twister: A 623-dimensionally equidistributed uniform pseudo-random number generator. ACM TOMACS.
【2】 Marsaglia, G. (2003). Xorshift RNGs. Journal of Statistical Software.
【3】 Intel Corporation. (2018). Digital Random Number Generator (DRNG) Software Implementation Guide.
【4】 Arm Limited. (2020). Arm Architecture Reference Manual for A-profile architecture: FEAT_RNG (RNDR/RNDRRS Instructions).
【5】 Linux Manual. (2016). getrandom(2) – Linux manual page.
【6】 NumPy Developers. (2021). Random Generator and BitGenerators (PCG64 default).
【7】 Gaffer On Games. (2014). Deterministic Lockstep.
【8】 Gaffer On Games. (2010). Floating Point Determinism.
【9】 Claessen, K., & Hughes, J. (2000). QuickCheck: A Lightweight Tool for Random Testing of Haskell Programs.
【10】 Miller, B. P., Fredriksen, L., & So, B. (1990). An empirical study of the reliability of UNIX utilities. Communications of the ACM.
【11】 Zalewski, M. (2014). American Fuzzy Lop Technical Notes.
【12】 PlayStation Blog (2013) / Spelunky Wiki. “Daily Challenge”項目（プラットフォームごとにシードが異なる旨を明記）。

免責事項

本記事は一般的な情報提供を目的としたものであり、記載された数値・事例・効果等は一部想定例を含みます。内容の正確性・完全性を保証するものではありません。詳細は利用規約をご確認ください。

メモリ破損とは何か ― ゲーム世界が崩壊する瞬間

クレジットカードと間違えて禁止カードを出した ― 決済と次元干渉の報告書

第1章 乱数とは何か ― アルゴリズムが生む「擬似的な不確実性」