scan¶
ML/MM calculatorを用い、調和拘束による結合距離スキャンで階層化された酵素 PDB の反応座標を駆動します。単一の出発構造から 1 つ以上の原子間距離を目標値まで駆動して反応軌跡の粗い候補を生成し、下流の MEP 精密化用の中間体/生成物候補を得たいときに使用します。mlmm scan は ML/MM calculator(mlmm.backends.mlmm_calc.mlmm)による調和拘束付きの段階的な結合距離駆動スキャンを実行します。各ステップで一時的なターゲットを更新し、調和拘束ポテンシャルを適用して LBFGS で構造を緩和します。ML/MM calculatorは MLIP バックエンド(デフォルト: UMA、-b/--backend で選択)と hessian_ff を結合します。-s/--scan-lists で YAML/JSON スペックファイル(推奨)またはインライン Python リテラルとしてターゲット距離を定義します。
実行例¶
コマンド形式:
mlmm scan -i INPUT.pdb --parm real.parm7 --model-pdb ml_region.pdb \
-q CHARGE [-m MULT] \
[-s scan.yaml | -s "[(I,J,TARGET_ANG)]"] [options]
スペックファイルによるスキャン(--print-parsed を追加すると、解釈したスキャンスペックを検証し GPU 計算を実行せずに終了します):
mlmm scan -i pocket.pdb --parm real.parm7 --model-pdb ml_region.pdb \
-q 0 -s scan.yaml -o ./result_scan
インライン Python リテラル:
# インライン Python リテラル
mlmm scan -i pocket.pdb --parm real.parm7 --model-pdb ml_region.pdb \
-q 0 -s "[(12,45,2.20)]"
ステージごとの軌跡を保存して確認する:
# ステージごとの軌跡を保存して確認する
mlmm scan -i pocket.pdb --parm real.parm7 --model-pdb ml_region.pdb \
-q 0 -s scan.yaml --dump -o ./result_scan_dump
処理の流れ¶
geom_loaderで構造を読み込み、CLI またはデフォルトから電荷/スピンを解決します。ML/MM calculatorに--parm、--model-pdb、-q/--charge、任意で-m/--multiplicityを提供します。任意でバイアスなし事前最適化(
--preopt)を実行し、開始点を緩和します。-s/--scan-lists(YAML/JSON スペックファイルまたはインラインリテラル)からステージターゲットを解析し、(i, j)インデックスを正規化します(デフォルトは 1 始まり)。入力が PDB の場合、各エントリは整数インデックスまたは'TYR,285,CA'のような原子セレクター文字列のいずれかで指定可能です。セレクターフィールドはスペース、カンマ、スラッシュ、バッククォート、バックスラッシュで区切ることができ、順序は任意です。結合ごとの変位を計算してステップに分割します:
スキャンタプル
[(i, j, target_A)]に対し、delta = target - current_distance_Aを計算。--max-step-size = hの場合、ステージはN = ceil(max(|delta|) / h)回のバイアス付き緩和を実行。各ペアの増分変化は
step_k = delta / N(Å)。ステップsでの一時ターゲットはr_k(s) = r_k(0) + s * step_k。
すべてのステップを進み、調和拘束ポテンシャル
E_bias = sum 1/2 * k * (|r_i - r_j| - target_k)^2を適用して LBFGS で極小化。kは--bias-k(eV/Ų)から取得され、Hartree/Bohr^2 に一度だけ変換されます。座標は PySisyphus 用に Bohr で保存され、レポート時に内部変換されます。各ステージの最後のステップ後、任意でバイアスなし緩和(
--endopt)を実行してから共有結合変化を報告しresult.*ファイルを書き出します。すべてのステージで繰り返します。任意の軌跡は
--dumpがTrueの場合のみダンプされます。
出力¶
各ステージは最終ジオメトリとバイアスステップ軌跡を stage_XX/ 配下に書き出し、ルートに連結軌跡を生成します。最初に確認するファイルはステージ別の result.pdb(または result.xyz)と、常に生成される scan_trj.xyz / scan.pdb です。
out_dir/ (デフォルト:./result_scan/)
├─ scan_trj.xyz # 全ステージ連結軌跡(常に書き出し)
├─ scan.pdb # 対応する連結 PDB(PDB 入力のみ、常に書き出し)
├─ preopt/ # --preopt が True の場合
│ ├─ result.xyz
│ └─ result.pdb # PDB 入力のみ
└─ stage_XX/ # ステージごとに 1 フォルダ(k = 01..K)
├─ result.xyz # 最終(endopt 済みの可能性あり)ジオメトリ
├─ result.pdb # 入力が PDB の場合
├─ scan_trj.xyz # ステージ別バイアスステップフレーム(常に書き出し)
└─ scan.pdb # scan_trj.xyz の PDB 版(PDB 入力のみ、常に書き出し)
CLI オプション¶
完全なフラグ一覧は生成された コマンドリファレンス にあります。下表は説明が必要なオプションを扱います。
オプション |
説明 |
デフォルト |
|---|---|---|
|
入力 PDB(またはトポロジー用に |
必須 |
|
完全 REAL 系の Amber prmtop。 |
必須 |
|
ML 領域を定義する PDB(原子 ID)。 |
None |
|
ML 領域原子インデックス(カンマ区切り、範囲指定可)。 |
None |
|
|
|
|
入力 PDB の B 因子から ML/MM レイヤーを検出。 |
|
|
ML 領域の総電荷。 |
None( |
|
残基ごとの電荷マッピング(例: |
None |
|
スピン多重度 (2S+1)。 |
|
|
凍結する 1 始まりカンマ区切り原子インデックス(YAML |
None |
|
Hessian 計算に含める MM 原子の ML 領域からの距離カットオフ (Å)。 |
None |
|
可動 MM 距離カットオフ (Å)。指定すると |
None |
|
スキャンターゲット: YAML/JSON スペックファイルパス(自動検出)または |
必須 |
|
原子インデックスを 1 始まり(デフォルト)または 0 始まりとして解釈。 |
|
|
|
|
|
ステップごとのスキャン結合の最大変化量 (Å)。積分ステップ数を制御。 |
|
|
調和バイアス強度 |
|
|
|
None |
|
各バイアスステップおよび pre/end 最適化ステージの最大 LBFGS サイクル。 |
|
|
|
None |
|
スキャン前にバイアスなし最適化を実行。 |
|
|
各ステージ後にバイアスなし最適化を実行。 |
|
|
ステップごとのオプティマイザ軌跡ファイルをダンプ。注: |
|
|
出力ディレクトリルート。 |
|
|
収束プリセット( |
None( |
|
ベース YAML 設定ファイル(最初に適用)。 |
None |
|
|
None |
|
ML 領域の MLIP バックエンド: |
|
|
xTB 点電荷埋め込み補正(実験的機能)の有効化。MM 環境から ML 領域への静電的影響を考慮。 |
|
|
xTB 埋め込み用 MM 原子のカットオフ半径(Å)。 |
|
|
model parm7 に CMAP(骨格クロスマップ二面角補正)を含めるかどうか。デフォルト: 無効(Gaussian ONIOM と同一)。 |
|
|
MM バックエンド(解析的 Hessian vs OpenMM 有限差分)。 |
|
|
リンク原子の配置: scaled($g$ 因子)または固定 1.09/1.01 Å。 |
|
|
機械可読な |
|
|
オプションの検証と実行計画の表示のみ行い、スキャンは実行しない。 |
|
|
PDB テンプレートが利用可能な場合に、XYZ/TRJ から対応する PDB を生成するかどうかを切り替え。 |
|
スキャン対象の構文¶
YAML/JSON スペックフォーマット(推奨)
-s/--scan-lists は YAML/JSON ファイルを自動検出します。ファイルパスを渡すとスペックモードになります:
one_based: true # 任意; デフォルトは CLI の --one-based/--zero-based
stages:
- [[12, 45, 2.20]]
- [[10, 55, 1.35], [23, 34, 1.80]]
stagesは必須です。各ステージは
(i, j, target_A)の 3 要素タプルのリストです。インデックスは整数または PDB セレクター(PDB 入力時)が使用可能で、インラインリテラルと同じです。
インラインリテラルフォーマット
-s/--scan-lists がファイルパスでない値を受け取ると、Python リテラル文字列として評価されます。シェルクォートに注意してください。
各リテラルは 3 要素タプル (atom1, atom2, target_A) の Python リストです:
-s '[(atom1, atom2, target_A),...]'
シェルが括弧やスペースを解釈しないよう、リテラル全体をシングルクォートで囲んでください。
各 3 要素タプルは
atom1–atom2間の距離をtarget_Aに向けて駆動します。1 つのリテラル = 1 つのステージです。複数ステージの場合、単一の
-s/--scan-listsフラグの後に複数リテラルを渡します(フラグを繰り返さないでください)。
原子は整数インデックスまたは PDB セレクター文字列で指定できます:
方法 |
例 |
備考 |
|---|---|---|
整数インデックス |
|
デフォルトは 1 始まり( |
PDB セレクター |
|
残基名、残基番号、原子名 |
PDB セレクターのトークンは、カンマ ,、スペース、スラッシュ /、バッククォート `、バックスラッシュ \ のいずれかで区切れます。トークンの順序は自由です。
# 以下はすべて同じ原子を指定:
"TYR,285,CA"
"TYR 285 CA"
"TYR/285/CA"
"285,TYR,CA" # 順序は自由
クォート規則:
# 正しい: リスト全体をシングルクォート、内側のセレクター文字列をダブルクォート
-s '[("TYR,285,CA","MMT,309,C10",1.35)]'
# 正しい: 整数インデックスは内側のクォート不要
-s '[(1, 5, 2.0)]'
# 非推奨: 外側をダブルクォートにすると内側のクォートをエスケープする必要あり
-s "[(\"TYR,285,CA\",\"MMT,309,C10\",1.35)]"
単一の -s/--scan-lists フラグの後に複数リテラルを渡します。各リテラルが 1 ステージになります:
# ステージ 1: 1 つの結合を 1.35 Å に駆動
# ステージ 2: 2 つの結合を同時に駆動
-s \
'[("TYR,285,CA","MMT,309,C10",1.35)]' \
'[("TYR,285,CA","MMT,309,C10",2.20),("TYR,285,CB","MMT,309,C11",1.80)]'
ステージは順次実行され、各ステージは前のステージの緩和結果から開始します。-s/--scan-lists フラグを繰り返さないでください – 単一のフラグの後にすべてのステージリテラルを供給してください。
協奏的スキャン vs 段階的スキャン
渡すリテラルの数で、座標を同時に駆動するか(協奏的)順次駆動するか(段階的)が決まります:
形式 |
指定方法 |
意味 |
事前に機構が必要? |
|---|---|---|---|
協奏的 |
単一のリテラルに複数の |
すべての座標を 1 ステージ内で同時に駆動 |
不要 |
段階的 |
複数のリテラル(ステージごとに 1 つ) |
各ステージが独自の拘束付き緩和を行い、 |
必要 — ステージごとに機構を定義 |
# 協奏的: 1 ステージ、2 つの距離を同時に駆動
mlmm scan -i r.pdb --parm enzyme.parm7 -l 'LIG:Q' \
-s '[(1,5,1.40),(7,9,1.60)]' -o result_concerted
# 段階的: 2 つの順次ステージ
mlmm scan -i r.pdb --parm enzyme.parm7 -l 'LIG:Q' \
-s '[(1,5,1.40)]' \
'[(7,9,0.95)]' -o result_staged
協奏的スキャンは機構の分解を必要としません — path-search が多段の自動セグメント化を行ってくれます。段階的スキャンは事前に機構の定義が必要ですが、機構が分かっている場合は段階的スキャンの方がステップごとの制御が明快で、一般に推奨されます。(4-tuple は双方向スキャン用に 2 ステージへ展開されます。)
双方向スキャン(4-tuple)
3-tuple (i, j, target) の代わりに 4-tuple (i, j, start, end) を指定すると、現在の構造から両方向にスキャンします。CLI は各 4-tuple を自動的に 2 ステージに展開します:
パス 1:
i–jの距離を現在の値からstartに向けて駆動。パス 2: 初期構造を復元し、
i–jの距離をendに向けて駆動。
連結軌跡は start → 初期構造 → end の順に並び、出発構造を通る連続的な経路が得られます。
# 双方向スキャン: 結合 12--45 を現在の構造から
# 1.35 Å(パス 1)と 2.50 Å(パス 2)に向けて駆動
mlmm scan -i pocket.pdb --parm real.parm7 --model-pdb ml_region.pdb \
-q 0 -s '[(12, 45, 1.35, 2.50)]'
これは 2 つの手動ステージの間にジオメトリリセットを行うのと同等ですが、スクリプトを書く必要がありません。同じリテラル内で 3-tuple と 4-tuple を混在させることもできます。
バリアの方向を読む¶
読み取るバリアは、スキャンがどちらの端点から始まったかに依存します。スキャン(またはそれを起点に生成した経路)が生成物から始まる場合、生のバリア値は逆方向です。
量 |
式 |
|---|---|
順方向バリア |
|
逆方向バリア(生成物始点の生の値) |
|
これは読み取り時の解釈であり、CLI フラグではありません。どちらの端点が反応物か生成物かは、スキャン方向を信頼せず、IRC の segments/seg_NN/{reactant,product}.pdb を読んで必ず確認してください。生成物始点の計算では、必要な順方向バリアは E(TS) − E(reactant) であり、生成物始点に対して印字される値ではありません。
YAML 設定¶
スキャンは共有の geom(coord_type、freeze_atoms)、calc / mlmm(ML/MM calculator設定)、opt / lbfgs(オプティマイザ)の各セクションに加え、bias(k、調和強度(eV/Ų))と MLIP ベースの結合変化検出用 bond セクションを読み込みます。
coord_type: 座標タイプ(デカルト vs dlc 内部座標)。freeze_atoms: CLI--freeze-atomsとマージされる 1 始まり凍結原子。
セクション calc / mlmm¶
ML/MM calculatorの設定:
charge、spin、backend、embedcharge、MLIP モデル設定、device、近傍半径、Hessianオプション等。
セクション opt / lbfgs¶
オプティマイザ設定:
thresh、max_cycles、print_every、ステップ制御、ラインサーチ、ダンプフラグ。
セクション bias¶
k(300): 調和強度(eV/Ų)。
セクション bond¶
MLIP ベースの結合変化検出:
device("auto"): グラフ分析用の MLIP デバイス。bond_factor(1.20): カットオフ用の共有結合半径スケーリング。margin_fraction(0.05): 比較用の許容割合。delta_fraction(0.05): 結合形成/切断と判定する最小相対変化。
全スキーマ(すべてのキーとデフォルト): YAML リファレンス。
関連項目¶
典型エラー別レシピ – 症状起点の切り分け
トラブルシューティング – 詳細な対処ガイド
scan2d – 2D 距離グリッドスキャン
scan3d – 3D 距離グリッドスキャン
opt – 単一構造の構造最適化
all – 単一構造入力の
--scan-lists付き一気通貫ワークフローpath-search – スキャン端点を中間体として使用する MEP 探索