概念とワークフロー¶

このページでは、mlmm-toolkit を使ううえでの 全体像 を説明します。 ML/MM 3 層システム、ONIOM 分解、「セグメント」「画像（image）」「テンプレート」が何を指すのか、そしてトップレベルの all が各サブコマンドをどう組み合わせるのかを解説します。

ワークフローの全体像¶

一般的なワークフローは以下の通りです。

全系入力 (PDB/XYZ)
 │
 ├─ ML 領域定義 [extract] ← --center/-c を使う場合は PDB が必要
 │ ↓
 │ ML 領域構造 (PDB)
 │ │
 │ ├─ MM トポロジー構築 [mm-parm] ← parm7/rst7 の自動生成
 │ │ ↓
 │ │ real.parm7 + real.rst7
 │ │
 │ ├─ (任意) 3層定義 [define-layer] ← B-factor による層エンコード
 │ │
 │ ├─ (任意) 段階的スキャン [scan] ← 単一構造ワークフロー
 │ │ ↓
 │ │ 順序付けられた中間体
 │ │
 │ └─ MEP 探索 [path-opt] または [path-search]
 │ ↓
 │ MEP 軌跡 (mep_trj.xyz) + エネルギーダイアグラム  ← ML/MM (MLIP + hessian_ff) 計算
 │
 └─ (任意) TS 最適化 + IRC [tsopt] → [irc]
 └─ (任意) 熱化学解析 [freq]（ΔG 取得）
 └─ (任意) DFT 一点計算 [dft]

各ステージはサブコマンドとして単独実行できます。また mlmm all を使うと、複数ステージをまとめて実行できます。

Important

遷移状態: HEI や tsopt の出力は TS 候補 として扱い、freq（虚振動数モードが 1 本）と irc（両端が意図した極小へ落ちる）で検証してから解釈してください。

ML/MM 3層システム¶

mlmm-toolkit の中核は、ONIOM 的な ML/MM 結合スキームです。系を以下の 3 層に分割し、各層に異なるレベルの理論を適用します。

層	B-factor	計算レベル	説明
Layer 1: ML 領域	0.0	MLIP（UMA, ORB, MACE, AIMNet2）	活性部位。エネルギー・力・Hessianすべてを MLIP バックエンドで計算
Layer 2: Movable-MM	10.0	hessian_ff（MM）	最適化時に移動可能な MM 原子
Layer 3: Frozen	20.0	なし	座標固定。計算不参加

B-factor 値は PDB ファイルの温度因子カラム（列 61-66）にエンコードされます。define-layer サブコマンドが ML 領域からの距離に基づいて自動設定します（--radius-freeze（デフォルト 8.0 Å）以内を Movable-MM、それより遠方を Frozen に割り当て）。Hessian対象 MM 原子は hess_cutoff や hess_mm_atoms で別途制御します。

Tip

B-factor エンコーディングにより、B-factor カラーリングに対応した分子ビューアで層割り当てを視覚的に確認できます。

ONIOM 的エネルギー分解¶

全系の ML/MM エネルギーは次のように計算されます:

E(ML/MM) = E_MM(real) + E_ML(model) - E_MM(model)

ここで:

E_MM(real): 全系（real system）の MM エネルギー（hessian_ff）
E_ML(model): ML 領域（model system）の MLIP エネルギー（デフォルトは UMA、ORB/MACE/AIMNet2 も利用可能）
E_MM(model): ML 領域の MM エネルギー（重複分を差し引くため）

力とHessianも同様の ONIOM 分解で結合されます。リンク水素の寄与はヤコビアンを用いて ML 原子と MM 原子に再分配されます。

MLIP バックエンドは -b/--backend（デフォルト: uma）で選択します。orb は pip install "mlmm-toolkit[orb]"、aimnet2 は [aimnet] extra でインストールします。mace には専用 extra がなく、e3nn のピンが UMA（fairchem-core）と競合するため別の conda env でインストールします。

--embedcharge を有効にすると、MM 環境が ML 領域に及ぼす静電影響を考慮するための xTB 点電荷埋め込み補正が適用されます。

従来の QM/MM との比較¶

側面	従来の QM/MM	mlmm-toolkit ML/MM
高レベル手法	DFT、HF、post-HF	MLIP（UMA, ORB, MACE, AIMNet2）
低レベル手法	OpenMM / Amber	hessian_ff（C++ ネイティブ拡張）
リンク原子	通常必要	共有結合境界で自動生成
静電埋め込み	一般的	デフォルトでは不使用（ONIOM 減算による機械的埋め込み）。`--embedcharge` で xTB 点電荷埋め込みを有効化可能
速度	低速（QM がボトルネック）	高速（GPU 上の ML 推論）

リンク原子¶

ML/MM 境界で共有結合が切断される場合、モデル（ML）系のダングリングボンドをキャップするためにリンク水素原子が挿入されます。--link-atom-method で配置方式を選択できます:

方式	配置	推奨
scaled (g-factor, デフォルト)	`r_L = r_QM + g·(r_MM − r_QM)`, `g = (CR_QM + CR_H)/(CR_QM + CR_MM)`	推奨（滑らかな PES、定数ヤコビアン）
fixed	`r_L = r_QM + d·û`, `d` = 1.09 Å (C) / 1.01 Å (N), `û` = MM方向の単位ベクトル	非推奨（座標依存ヤコビアン）

デフォルトは scaled（Morokuma–Dapprich g-factor法）で、Gaussian ONIOM と同じ方式です。リンク原子の位置が QM–MM 距離に比例し、滑らかな PES と定数ヤコビアンを生み出します（二次微分補正不要）。fixed 方式は QM–MM 距離に依存せず一定の距離でリンク水素を配置します。

リンク原子に作用する力はヤコビアンを介して QM/MM 親原子に再分配されます:

F_QM += (1−g) · F_link    (scaled の場合)
F_MM += g · F_link

Hessianにも同様の変換が適用されます: H_再分配 = Jᵀ H_link J。

マイクロイテレーション¶

可動 MM 原子が多い系では、全座標の同時最適化は高コストです。高レベル（MLIP）の勾配が毎ステップ必要なため、MM 環境の緩和中も不必要な MLIP 計算が発生します。

マイクロイテレーション（Gaussian 16 方式）は最適化をマクロ/マイクロステップに分割します:

収束するまで繰り返す:
    マクロステップ — ML原子 + リンク原子MM親原子を1 RFOステップ（全ONIOM力）
    マイクロステップ — 残りのMM原子をL-BFGSで緩和（MM力のみ）

	マクロステップ	マイクロステップ
Calculator	全 ONIOM (`E_MM_real + E_ML − E_MM_model`)	MM 力場のみ (`E_MM_real`)
最適化座標	ML原子 + リンク原子MM親原子	可動MM（リンク原子MM親を除く）
オプティマイザ	RFO（陽的Hessian、BFGS更新）	L-BFGS（Hessian不要、毎回初期化）
収束判定	`--thresh`（デフォルト: `gau`）	YAML の `microiter.micro_thresh`（デフォルト: `--thresh` と同じ）

Note

リンク原子 MM 親原子をマクロステップに含める理由: scaled (g-factor) 法では r_L = (1−g)·r_QM + g·r_MM により、リンク原子の位置が QM と MM 両方の親原子に結合しています。マイクロステップで MM 親原子が（ML 寄与なしの MM 力のみで）移動すると、次のマクロステップでリンク H の位置がずれ、ML エネルギー面に不連続が生じてエネルギーが振動します。MM 親原子をマイクロステップで凍結し、マクロステップで ML と一緒に動かすことで、この結合の不整合を解消します。

収束判定基準¶

pysisyphus は複数のプリセット閾値を提供します（単位: 力は Hartree/Bohr、ステップは Bohr）:

プリセット	max(force)	rms(force)	max(step)	rms(step)
`gau_loose`	2.5×10⁻³	1.7×10⁻³	1.0×10⁻²	6.7×10⁻³
`gau`	4.5×10⁻⁴	3.0×10⁻⁴	1.8×10⁻³	1.2×10⁻³
`gau_tight`	1.5×10⁻⁵	1.0×10⁻⁵	6.0×10⁻⁵	4.0×10⁻⁵
`baker`	3.0×10⁻⁴	2.0×10⁻⁴	3.0×10⁻⁴	2.0×10⁻⁴

overachieve_factor は収束のショートカットです。max(force) と rms(force) の両方が threshold / overachieve_factor を下回った場合、ステップサイズ基準が未達であっても収束と判定されます。デフォルト設定では、マイクロイテレーションの MM 緩和ループを含むすべてのオプティマイザで overachieve_factor は 0.0（無効）です。必要な場合は YAML で有効化できます（例: overachieve_factor: 3）。

マイクロイテレーションは --microiter で有効化します（--opt-mode hess 時のデフォルト）:

mlmm opt -i layered.pdb --parm system.parm7 -q 0 --opt-mode hess --microiter
mlmm opt -i layered.pdb --parm system.parm7 -q 0 --opt-mode hess --no-microiter  # 無効化

hessian_ff: MM エンジン¶

hessian_ff は Amber 力場パラメータ（parm7）をベースとした C++ ネイティブ拡張の力場計算エンジンです。エネルギー・力、そして特に解析Hessianを計算します。主な特徴:

結合、角度、二面角、不正二面角項
ファン・デル・ワールス（Lennard-Jones）相互作用
静電相互作用
解析的二次微分（Hessian）
CPU 実行（GPU メモリを MLIP 推論に専有させるため）
CMAP トーション補正（実装済みだがデフォルト無効、Gaussian と同様）

OpenMM とは異なり、hessian_ff は ONIOM 結合と振動解析に必要な MM Hessian を提供します。

Amber parm7/rst7 トポロジー¶

内部の MM 計算には Amber トポロジーファイルが必要です:

parm7（prmtop）: Amber のトポロジーファイル。原子タイプ、結合、角度、二面角、VDW パラメータ、部分電荷などを含む
rst7（inpcrd）: Amber の座標/速度ファイル。原子座標を含む（ユーザーが直接指定する必要はない。mlmm は入力 PDB から座標を読み込む）

mm-parm サブコマンドが AmberTools（tleap、antechamber、parmchk2）を使用して PDB から parm7/rst7 を自動生成します。具体的には:

非標準残基（基質、補因子）の自動識別
GAFF2（General Amber Force Field 2）によるパラメータ化
AM1-BCC 部分電荷の割り当て
タンパク質残基には ff19SB で完全なトポロジーを構築

主要オブジェクトと用語¶

全系と ML 領域¶

全系: 元の入力構造（酵素ならタンパク質-基質複合体など）。
ML 領域: MLIP バックエンドで扱う反応部位。extract サブコマンドで指定した基質からの距離に基づいて定義されます。

ML 領域定義は主に以下で制御します。

-c/--center: 基質の指定（残基ID、残基名、または基質のみのPDB）
-r/--radius, --radius-het2het, --include-H2O, --exclude-backbone, --add-linkH, --selected-resn

ML 領域の指定には 2 通りあります。

自動切り出し（-c/--center + --exclude-backbone）: extract / all が Cα–Cβ 境界で主鎖を切断し、切断結合をリンク水素でキャップし、残基・--modified-residue・ -l/--ligand-charge から model 電荷を導出します。非標準アミノ酸は --modified-residue NAME:charge、リガンドは -l NAME:charge で与え、-q は不要です。
手動（--model-pdb + --parm）: ML 原子の選択を自分で与え、model 電荷は -q で明示します。電荷が変わる原子を手で編集した場合（独自の切断・プロトン化/電荷変更で自動導出が当てにならない場合）や、自動切り出しが扱えない異常トポロジーで確実です。この経路では --modified-residue / -l は効かず、model PDB にリンク水素を入れる必要もありません — ML/MM calculator が --parm のトポロジーから ML/MM 境界に付与します。

Real system と Model system（ONIOM 用語）¶

Real system（実系）: すべての原子（3 層すべて）。MM（低レベル）で評価されます。
Model system（モデル系）: ML 領域（Layer 1 のみ）。MLIP（高レベル）と MM（低レベル）の両方で評価されます。

画像（image）とセグメント¶

イメージ（image）: Growing String Method (GSM) などの Minimum Energy Path (MEP) 探索手法における経路上の 1 つの構造（1 ノード）。
セグメント: 2つの端点を結ぶ MEP。多構造入力は、隣接する端点ペアごとのセグメントに分解されます。

テンプレートとファイル変換（`--convert-files`）¶

mlmm-toolkit は軌跡（例: mep_trj.xyz, finished_irc_trj.xyz）を出力します。トポロジー対応の入力（PDB テンプレート）がある場合、対応するファイルも出力できます:

PDB テンプレートがあれば対応する .pdb

この動作は --convert-files/--no-convert-files（デフォルト: --convert-files）でグローバルに制御します。

代表的な3つの使い方¶

1) 複数構造の MEP 探索（R →… → P）¶

すでに反応座標に沿った 2つ以上 の構造がある場合。

例:

mlmm -i R.pdb P.pdb -c 'SAM,GPP' -l 'SAM:1,GPP:-3'

2) 単一構造の段階的スキャン → MEP¶

複数の端点構造を用意するより、反応座標を自分で定義したい場合。

例:

mlmm -i holo.pdb -c '308,309' -l 'MMT:-1' \
 --scan-lists '[("TYR,285,CA","MMT,309,C10",2.20)]'

3) TSOPT のみ（ML/MM TS 最適化）¶

TS 候補がすでにある、あるいは 1 構造で TS 最適化だけ試したい場合。

例:

mlmm -i ts_guess.pdb -c 'SAM,GPP' -l 'SAM:1,GPP:-3' --tsopt

`all` と個別サブコマンドの使い分け¶

`mlmm all` を推奨するケース¶

ML/MM モデル構築 → MEP 探索 → TSOPT/IRC → freq/DFT まで まとめて 実行したい
出力ディレクトリやログ管理を 1 コマンドに寄せたい

個別サブコマンドを推奨するケース¶

各ステージを 1 つずつ実行し、その都度結果を確認したい。複雑な反応では、一括実行よりもステップごとの実行が有効なことが多い
カスタムワークフローを組みたい場合（例: 独自の端点準備）
前回の実行から parm7/rst7 と層付き PDB ファイルがすでにある場合
oniom-export --mode g16|orca で Gaussian/ORCA ONIOM 入力を生成したい

CLI に関する重要な注意点¶

Important

ブール値オプションは --flag / --no-flag と --flag True/False（yes/no, 1/0 含む）の両方を受理します。新規スクリプトでは toggle 形式を推奨します。
複数 PDB を与える場合、各ファイルは 同じ原子が同じ順序 で並んでいることが重要です（座標だけが異なる）。
酵素の反応機構解析では、水素を含んだ入力 PDB を用意することを強く推奨します。
ML/MM 計算には parm7 トポロジーが必須です。all ワークフローでは自動生成されますが、個別サブコマンドでは --parm（全系トポロジー）と --model-pdb（ML 領域定義 PDB）を明示的に指定する必要があります。

次に読むページ¶

入門¶

はじめに – インストールと初回実行
典型エラー別レシピ – 症状起点の切り分け
トラブルシューティング – よくあるエラーと対処法

主要サブコマンド¶

サブコマンド	用途	ドキュメント
`all`	一気通貫ワークフロー	all.md
`extract`	ML 領域定義	extract.md
`mm-parm`	Amber トポロジー構築	mm-parm.md
`define-layer`	3 層 ML/MM 領域定義	define-layer.md
`path-search`	再帰的 MEP 探索	path-search.md
`tsopt`	TS 最適化	tsopt.md
`freq`	振動解析	freq.md
`dft`	DFT 一点計算	dft.md
`oniom-export`	Gaussian ONIOM / ORCA QM/MM 入力生成（`--mode g16\|orca`）	oniom-export.md

リファレンス¶

YAML リファレンス – 全オプションの YAML 設定
用語集 – 用語リファレンス

概念とワークフロー¶

ワークフローの全体像¶

ML/MM 3層システム¶

ONIOM 的エネルギー分解¶

従来の QM/MM との比較¶

リンク原子¶

マイクロイテレーション¶

収束判定基準¶

hessian_ff: MM エンジン¶

Amber parm7/rst7 トポロジー¶

主要オブジェクトと用語¶

全系と ML 領域¶

Real system と Model system（ONIOM 用語）¶

画像（image）とセグメント¶

テンプレートとファイル変換（--convert-files）¶

代表的な3つの使い方¶

1) 複数構造の MEP 探索（R →… → P）¶

2) 単一構造の段階的スキャン → MEP¶

3) TSOPT のみ（ML/MM TS 最適化）¶

all と個別サブコマンドの使い分け¶

mlmm all を推奨するケース¶

個別サブコマンドを推奨するケース¶

CLI に関する重要な注意点¶

次に読むページ¶

入門¶

主要サブコマンド¶

リファレンス¶

テンプレートとファイル変換（`--convert-files`）¶

`all` と個別サブコマンドの使い分け¶

`mlmm all` を推奨するケース¶