Contents Menu Expand Light mode Dark mode Auto light/dark, in light mode Auto light/dark, in dark mode
pdb2reaction
pdb2reaction

Guides

  • Getting Started
  • Installation
  • Quickstart: pdb2reaction all (Endpoint mode)
  • Quickstart: pdb2reaction all --scan-lists (Scan mode)
  • Quickstart: pdb2reaction all --tsopt (TS-only mode)
  • Frozen Atoms
  • Common Error Recipes
  • Troubleshooting
  • CLI Conventions
  • Reproducibility and determinism

Commands

  • all
  • extract
  • fix-altloc
  • add-elem-info
  • opt
  • tsopt
  • path-opt
  • path-search
  • scan
  • scan2d
  • scan3d
  • freq
  • irc
  • dft
  • sp
  • trj2fig
  • energy-diagram
  • bond-summary

Reference

  • CLI Command Reference
    • pdb2reaction add-elem-info
    • pdb2reaction all
    • pdb2reaction bond-summary
    • pdb2reaction dft
    • pdb2reaction energy-diagram
    • pdb2reaction extract
    • pdb2reaction fix-altloc
    • pdb2reaction freq
    • pdb2reaction irc
    • pdb2reaction opt
    • pdb2reaction path-opt
    • pdb2reaction path-search
    • pdb2reaction scan
    • pdb2reaction scan2d
    • pdb2reaction scan3d
    • pdb2reaction sp
    • pdb2reaction trj2fig
    • pdb2reaction tsopt
  • YAML Reference
  • JSON Output Reference
  • MLIP Calculator
  • MLIP Backends
  • Architecture: pdb2reaction
  • Output Directory Layout
  • pdb2reaction MCP server
  • HPC example: PBS + Open MPI + Ray
  • Glossary

ガイド

  • pdb2reaction ドキュメント
  • はじめに
  • インストール
  • クイックスタート: pdb2reaction all(Endpoint モード)
  • クイックスタート: pdb2reaction all --scan-lists(Scan モード)
  • クイックスタート: pdb2reaction all --tsopt(TS-only モード)
  • 凍結原子(Frozen Atoms)
  • 典型エラー別レシピ
  • トラブルシューティング
  • CLI 規約
  • 再現性と決定性

コマンド

  • all
  • extract
  • fix-altloc
  • add-elem-info
  • opt
  • tsopt
  • path-opt
  • path-search
  • scan
  • scan2d
  • scan3d
  • freq
  • irc
  • dft
  • sp
  • trj2fig
  • energy-diagram
  • bond-summary

リファレンス

  • YAML 設定リファレンス
  • JSON 出力リファレンス
  • MLIP 計算機
  • MLIP バックエンド
  • アーキテクチャ: pdb2reaction
  • 出力ディレクトリのレイアウト
  • pdb2reaction MCP サーバー
  • HPC 実行例: PBS + Open MPI + Ray
  • 用語集
Back to top
EN | JA

path-search¶

R → … → P の 2 構造以上から、連続的な最小エネルギー経路(MEP)を構築します。自動精密化を含む連続 MEP を 1 本の軌跡にまとめたい場面で使用します。2 端点だけで再帰精密化が不要な場合は、path-opt の方がシンプルです。

経路は 2 つのエンジンのいずれかで生成します。GSM(デフォルト、--mep-mode gsm、string ベース)か、DMF(--mep-mode dmf、direct flux)です。共有結合変化が検出される領域のみを選択的に精密化します(--refine-mode peak は HEI±1 を最適化、--refine-mode minima は最寄り局所極小点へ外側探索、デフォルトは GSM で peak、DMF で minima)。解決済みのサブパスを連結して 1 本の軌跡にまとめ、各セグメントの最高エネルギー画像(HEI)を TS 候補として出力します(tsopt + IRC で検証)。

再帰的分解により多段階反応を自動検出し、各素反応ステップの詳細な MEP を構築します。複雑な多段階反応について妥当な MEP を得るには、入力中間体やスキャン仕様、収束閾値の調整など手動での試行錯誤が必要になることがあります。

実行例¶

コマンド形式:

pdb2reaction path-search -i R.pdb [-i I.pdb ...] -i P.pdb [-q CHARGE] [-l, --ligand-charge <number|'RES:Q,...'>] [--multiplicity 2S+1] \
 [-b/--backend uma|orb|mace|aimnet2] [--solvent SOLVENT] [--solvent-model alpb|cpcmx] \
 [--workers N] [--workers-per-node N] \
 [--mep-mode {gsm|dmf}] [--freeze-links/--no-freeze-links] [--thresh PRESET] [--thresh-stopt PRESET] \
 [--refine-mode {peak|minima}] \
 [--max-nodes N] [--max-cycles N] [--climb/--no-climb] \
 [--opt-mode grad|hess] [--dump/--no-dump] \
 [--out-dir DIR] [--preopt/--no-preopt] \
 [--align/--no-align] [--ref-full-pdb FILE...] [--ref-pdb FILE...] \
 [--convert-files/--no-convert-files] \
 [--show-config/--no-show-config] [--dry-run/--no-dry-run]

2 端点(反応物 → 生成物):

pdb2reaction path-search -i reactant.pdb -i product.pdb -q 0 -m 1 \
 --out-dir ./result_path_search

中間体を明示して多段の経路を与える:

# 中間体を明示して多段の経路を与える
pdb2reaction path-search -i R.pdb -i IM1.pdb -i IM2.pdb -i P.pdb -q -1 -m 1 \
 --out-dir ./result_path_search_multi

テンプレート参照を使って全系マージ出力を有効化する:

# テンプレート参照を使って全系マージ出力を有効化する
pdb2reaction path-search -i R.pdb -i IM1.pdb -i P.pdb -q 0 -m 1 \
 --ref-full-pdb holo_template.pdb --out-dir ./result_path_search_merge

DMF + minima 精密化で探索する:

# DMF + minima 精密化で探索する
pdb2reaction path-search -i reactant.pdb -i product.pdb -q 0 -m 1 \
 --mep-mode dmf --refine-mode minima --out-dir ./result_path_search_dmf

処理の流れ¶

  1. ペアごとの初期セグメント(GSM/DMF) – 各隣接入力(A→B)間で GrowingString または DMF を実行し、粗い MEP と最高エネルギー画像(HEI)を取得。

  2. HEI 周辺の局所緩和 – refine-mode=peak なら HEI±1、refine-mode=minima なら HEI 近傍の局所極小点を、選択した単一構造オプティマイザ(opt-mode)で精密化し End1/End2 を得る。

    デフォルト: --refine-mode 省略時は GSM では peak、DMF では minima が選択されます。

  3. ねじれ vs. 精密化の決定 – End1 と End2 間に共有結合変化がなければ ねじれ(kink: 共有結合変化を伴わない構造変化区間。用語集 参照)とみなし、search.kink_max_nodes の線形ノードを挿入して個別最適化。結合変化がある場合は 反応セグメント(端点間に共有結合変化が検出される区間。用語集 参照)として扱い、End1 と End2 間に 精密化セグメント (GSM/DMF) を起動して障壁を先鋭化。

  4. 選択的再帰 – (A→End1) と (End2→B) の結合変化を bond しきい値で比較し、共有結合更新が残るサブ区間のみ再帰的に探索。再帰深度は search.max_depth で制限。

  5. スティッチング & ブリッジング – 解決済みのサブパスを連結し、RMSD ≤ search.stitch_rmsd_thresh の重複エンドポイントを除去。RMSD ギャップが search.bridge_rmsd_thresh を超える場合は ブリッジセグメント(非隣接の中間体間を接続するセグメント。用語集 参照)を GSM/DMF で挿入。境界で結合変化が検出される場合はブリッジではなく新規の再帰セグメントで置換。

  6. アライメント & マージング(オプション) – --align(デフォルト)で事前最適化構造を先頭入力へ剛体アライメントし、freeze_atoms を整合。--ref-full-pdb を指定すると活性部位モデル軌跡をフルサイズ PDB テンプレートへマージ(--align により先頭テンプレートの再利用が可能)。

結合変化の判定は bond_changes.compare_structures を用い、bond セクションのしきい値に従います。MLIP バックエンドは全構造で共有・再利用されます。

出力¶

out_dir/ (デフォルト:./result_path_search/)
├─ mep_trj.xyz # 主要 MEP 軌跡
├─ mep.pdb # 入力がPDB テンプレートで変換が有効な場合に対応する PDB
├─ mep.gjf # Gaussian テンプレート検出時に対応する Gaussian
├─ mep_w_ref.pdb # マージされた全系MEP(参照 PDB/テンプレートが必要)
├─ mep_seg_XX_trj.xyz # セグメントごとの MEP 軌跡(XYZ)
├─ mep_seg_XX.pdb # セグメントごとに対応する PDB(変換有効時)
├─ mep_seg_XX.gjf # セグメントごとに対応する Gaussian(テンプレート検出時)
├─ mep_w_ref_seg_XX.pdb # 共有結合変化がある場合のマージされたセグメントごとのパス
├─ hei_seg_XX.xyz # セグメントごとの最高エネルギー画像
├─ hei_seg_XX.pdb # HEI に対応する PDB(変換有効時)
├─ hei_seg_XX.gjf # HEI に対応する Gaussian(テンプレート検出時)
├─ hei_w_ref_seg_XX.pdb # 全系コンテキストでマージされた HEI(参照 PDB が必要)
├─ summary.json # すべての再帰セグメントの障壁と分類サマリー
├─ summary.log # 結果要約
├─ mep_plot.png # `trj2fig` で生成した ΔE プロファイル(kcal/mol、反応物基準)
├─ energy_diagram_MEP.png # MEP 状態エネルギーダイアグラムの静止画出力(反応物基準)
└─ seg_NNN_*/ # セグメントごとの GSM/DMF ダンプ、HEI スナップショット、kink/精密化の診断情報

結果は通常、次のファイルを開いて確認します。

  • result_path_search/mep_trj.xyz

  • result_path_search/summary.json

  • result_path_search/summary.log

  • result_path_search/mep_plot.png(プロット生成時)

  • コンソールには確定済みの設定ブロック(geom, calc, gs, stopt, opt.*, bond, search)が出力されます。詳細は ログ詳細度 (verbosity) を参照してください。

CLI オプション¶

完全なフラグ一覧は生成された コマンドリファレンス を参照してください。以下の表は説明が必要なオプションのみを扱います。

表は目的ごとにグループ化しており、各グループ内では使用頻度の高いオプションを先に並べています。

オプション

説明

デフォルト

入力と電荷

-i, --input PATH

反応順序の 2 つ以上の構造(反応物 → 生成物)。各ファイルごとに -i/--input を繰り返すか、単一の -i の後ろに複数ファイルを並べる(例: -i R.pdb -i IM1.pdb -i P.pdb または -i R.pdb IM1.pdb P.pdb)

必須

-q, --charge INT

総電荷。非 .gjf 入力では --ligand-charge の導出が成功しない限り必須。両方指定時は -q が優先

テンプレート/導出が適用されない限り必須

-l, --ligand-charge TEXT

単一の整数(例: -1)でリガンド総電荷を指定するか、残基別マッピング(例: GPP:-3,SAM:1)で PDB 残基電荷から全系の電荷を導出。-q 省略時に使用(PDB 入力のみ。XYZ/GJF は -q 必須)

None

-m, --multiplicity INT

スピン多重度(2S+1)

.gjf テンプレート値または 1

バックエンドと計算

-b, --backend {uma,orb,mace,aimnet2}

MLIP バックエンド

uma

--workers, --workers-per-node

MLIP 予測器の並列度(workers > 1 で解析Hessian無効; UMA バックエンドのみ; workers_per_node は並列予測器に渡されます)。診断上の注意は workers > 1 は解析Hessianを無効化する(UMA バックエンド) を参照

1, 1

--solvent TEXT

xTB 暗黙溶媒(例: water)。none で無効化

none

--solvent-model {alpb,cpcmx}

xTB 溶媒モデル

alpb

活性領域の凍結

--freeze-links/--no-freeze-links

PDB 活性部位モデル読み込み時、キャップ水素の親原子を凍結。詳細は extract を参照

True

--freeze-atoms TEXT

凍結する原子の 1 始まりインデックスをカンマ区切りで明示的に指定(例: '1,3,5')。--freeze-links と併用可、任意の入力形式に適用

None

MEP 探索

--mep-mode {gsm|dmf}

セグメント生成器: GSM(string)または DMF(direct flux)

gsm

--dmf-backend {cpu|gpu}

DMF 計算バックエンド(--mep-mode dmf 時のみ): gpu(dmf.torch/CUDA)または cpu(dmf/NumPy)。GPU メモリ不足時は cpu で再実行

gpu

--preopt/--no-preopt

選択された単一構造オプティマイザ(L-BFGS/RFO)で MEP 探索前に各エンドポイントを事前最適化。

True

--max-nodes INT

MEP セグメントごとの内部ノード(GSM string image または DMF image)

20

--max-cycles INT

最大 MEP 最適化サイクル(GSM/DMF)

300

--climb/--no-climb

GSM セグメントのクライミングイメージを有効化(ブリッジは無効)

True

精密化

--refine-mode {peak|minima}

精密化シード: peak は HEI±1、minima は HEI から最寄り局所極小点へ外側探索。未指定時は GSM で peak、DMF で minima

Auto

--opt-mode TEXT

HEI±1/ねじれノード用の単一構造オプティマイザ(grad=L-BFGS、hess=RFO)。同じトークンが tsopt では Dimer / RS-I-RFO へ対応する点については --opt-mode(サブコマンド依存) を参照してください

grad

収束閾値

--thresh TEXT

単一構造最適化のみの収束プリセットを上書き(opt.lbfgs/rfo.thresh)

gau

--thresh-stopt TEXT

ストリングオプティマイザの収束プリセットを上書き(stopt.thresh)

gau_loose

マージとアライメント

--align/--no-align

探索前にすべての入力を最初の構造にアライメント

True

--ref-full-pdb PATH...

フルサイズテンプレート PDB(入力と同数。--align があれば先頭のみ再利用可)

None

--ref-pdb PATH...

入力が XYZ/GJF の場合に最終的な全系マージで用いるポケット参照 PDB(入力と同数・同順)

None

出力と設定

-o, --out-dir TEXT

出力ディレクトリ

./result_path_search/

--dump/--no-dump

MEP(GSM/DMF)と単一構造軌跡をダンプ。リスタート YAML は YAML で有効化した場合のみ書き出されます

False

--convert-files/--no-convert-files

PDB/Gaussian 入力の XYZ/TRJ → 対応する PDB/GJF を切り替え。XYZ/GJF 入力では主軌跡に対応する PDB は生成されません。

True

--config FILE

明示 CLI 指定より前に適用されるベース YAML

None

--show-config/--no-show-config

解決済み設定(YAML レイヤ情報を含む)を表示して実行継続

False

--dry-run/--no-dry-run

実行せずに検証と実行計画表示のみを行う

False

設定の優先順位は CLI 規約: 設定の優先順位 を参照してください。

YAML 設定¶

YAML ルートはマッピングでなければなりません。共通セクションは YAML リファレンス を再利用します: geom/calc は単一構造設定を反映し(PDB 入力では --freeze-links が geom.freeze_atoms を補強します。詳細は キャップ水素と凍結原子 を参照)、stopt は path-opt(path-opt.md)に記載の StringOptimizer 設定を継承します。

bond と search は path-search の再帰ロジックの中核であり、ここで詳述します。gs、dmf、stopt、opt.lbfgs、opt.rfo は path-search 固有の out_dir 上書きのみ再掲します。

bond は MLIP ベースの結合変化検出パラメータで、scan の bond セクションと共通の device, bond_factor, margin_fraction, delta_fraction を持ちます。

path-search 固有の上書き¶

stopt:
 out_dir: ./result_path_search/ # path-search 上書き(正準デフォルト: ./result_path_opt/)
opt:
 lbfgs:
   out_dir: ./result_path_search/ # path-search 上書き(正準デフォルト: ./result_opt/)
 rfo:
   out_dir: ./result_path_search/ # path-search 上書き(正準デフォルト: ./result_opt/)

bond / search:

bond:
 device: auto # MLIP device for bond analysis
 bond_factor: 1.2 # covalent-radius scaling
 margin_fraction: 0.05 # tolerance margin for comparisons
 delta_fraction: 0.05 # minimum relative change to flag bonds
search:
 max_depth: 10 # recursion depth limit
 stitch_rmsd_thresh: 0.0001 # RMSD threshold for stitching segments
 bridge_rmsd_thresh: 0.0001 # RMSD threshold for bridging nodes
 max_nodes_segment: 20 # max nodes per segment
 max_nodes_bridge: 5 # max nodes per bridge
 kink_max_nodes: 3 # max nodes for kink optimizations
 max_seq_kink: 2 # max sequential kinks
 refine_mode: null # optional refinement strategy (auto-chooses when null)

注記¶

  • 入力は 2 つ以上が必須。満たさない場合、-i/--input の “invalid value” エラーで終了します。

関連項目¶

  • 典型エラー別レシピ — 症状起点の切り分け

  • トラブルシューティング — 詳細な対処ガイド

  • path-opt — 単一パス MEP 最適化(再帰的精密化なし)

  • tsopt — HEI を遷移状態として最適化

  • extract — path-search 入力用の活性部位モデル PDB を生成

  • all — 一気通貫ワークフロー(デフォルトで単一パス path-opt を使用; --refine-path True で再帰的 path-search に切替)

  • YAML リファレンス — gs、dmf、bond、search の完全な設定オプション

  • 用語集 — MEP、GSM、DMF、HEI の定義

Copyright © 2025, Takuto Ohmura
Made with Sphinx and @pradyunsg's Furo
Contents
  • path-search
    • 実行例
    • 処理の流れ
    • 出力
    • CLI オプション
    • YAML 設定
      • path-search 固有の上書き
    • 注記
    • 関連項目