scan¶
概要¶
要約: 調和拘束を用いて結合距離をスキャンし、反応座標を駆動します。
-s/--scan-lists(YAML/JSON ファイルパス、推奨)でターゲット距離を指定します。インライン Python リテラルも利用できます。
要点¶
想定場面: 単一構造から特定の原子間距離を変化させ、もっともらしい反応経路を探索したい場合に使います(
path-search/path-optの前処理として使うことが多い)。入力は 1 つの構造 +-s scan.yaml(推奨)または-s/--scan-listsの 1 個以上のインラインリテラル(1 リテラル = 1 ステージ)。可能な限り YAML/JSON ファイルパスを渡してください。インライン Python リテラルはクォート/エスケープが必要で、単純な単一ステージのスキャン向きです。計算手法: MLIP バックエンド(デフォルト: UMA、
-b/--backendで切替可能)に調和拘束E = Σ ½ k (|ri − rj| − target)²を加え、各ステップを LBFGS(--opt-mode grad)または RFOptimizer(--opt-mode hess)で緩和。主な出力: ステージごとの
result.xyz(必要に応じて.pdb/.gjf)と結合スキャン軌跡(scan_trj.xyz/scan.pdb)。--dumpはステップごとの最適化軌跡のみを制御。デフォルト値:
--opt-mode grad(LBFGS)、--no-preopt、--no-endopt、--max-step-size 0.20 Å、--bias-k 300 eV·Å⁻²、--thresh gau、--out-dir ./result_scan/。次のステップ: ステージの端点(
stage_XX/result.pdb)をpath-search/path-optに渡して MEP を精密化するか、pdb2reaction all -s ...でスキャン → MEP → TSOPT/IRC/freq/DFT を一気通貫で実行します。
pdb2reaction scan は MLIP バックエンド(デフォルト: UMA、-b/--backend で ORB・MACE・AIMNet2 も選択可能)と調和拘束による段階的な結合長スキャンを実行します。各ステップで一時ターゲットを更新し、拘束ポテンシャルを適用したうえで構造全体を LBFGS(--opt-mode grad)または RFOptimizer(--opt-mode hess)で緩和します。
XYZ/GJF 入力では、--ref-pdb で参照 PDB トポロジーを指定すると、XYZ 座標を保持したまま PDB/GJF へのフォーマット対応変換が可能になります。
最小例¶
pdb2reaction scan -i input.pdb -q 0 -m 1 -s scan.yaml --out-dir ./result_scan
出力の見方¶
result_scan/stage_01/result.pdb(またはresult.xyz)result_scan/stage_02/result.pdb(またはresult.xyz)result_scan/stage_*/scan_trj.xyzとscan.pdb(常に生成されます。--dumpはステップごとの最適化軌跡ファイルのみを制御)
よくある例¶
YAML spec から実行する。
pdb2reaction scan -i input.pdb -q 0 -m 1 -s scan.yaml
リテラル入力を使う。
pdb2reaction scan -i input.pdb -q 0 -m 1 -s '[("TYR,285,CA","SAM,309,C10",1.35)]'
ステージごとの軌跡を保存して確認する。
pdb2reaction scan -i input.pdb -q 0 -m 1 -s scan.yaml --dump --out-dir ./result_scan_dump
Note:
-s/--scan-listsの解釈結果を確認したい場合は--print-parsedを追加してください。
使用法¶
pdb2reaction scan -i INPUT.{pdb|xyz|trj|...} [-q CHARGE] [-l, --ligand-charge <number|'RES:Q,...'>] [-m MULT] \
[-b/--backend uma|orb|mace|aimnet2] [--solvent SOLVENT] [--solvent-model alpb|cpcmx] \
[-s/--scan-lists scan.yaml | '[(i,j,targetÅ),...]'] [options] \
[--convert-files/--no-convert-files] [--ref-pdb FILE]
例¶
# 推奨: YAML/JSON spec
cat > scan.yaml << 'YAML'
one_based: true
stages:
- [["TYR,285,CA", "SAM,309,C10", 1.35]]
- [["TYR,285,CA", "SAM,309,C10", 2.20], ["TYR,285,CB", "SAM,309,C11", 1.80]]
YAML
pdb2reaction scan -i input.pdb -q 0 -s scan.yaml
# 代替: Python リテラル
pdb2reaction scan -i input.pdb -q 0 -s '[("TYR,285,CA","SAM,309,C10",1.35)]'
# 2 ステージ、LBFGS 緩和、軌跡ダンプ
pdb2reaction scan -i input.pdb -q 0 -s \
'[("TYR,285,CA","SAM,309,C10",1.35)]' \
'[("TYR,285,CA","SAM,309,C10",2.20),("TYR,285,CB","SAM,309,C11",1.80)]' \
--max-step-size 0.20 --dump --out-dir ./result_scan/ --opt-mode grad \
--preopt --endopt
スキャンリスト仕様¶
YAML/JSON ファイル書式、インライン Python リテラル構文、原子セレクタ、クォート規則については CLI 規約: スキャンリスト仕様 を参照してください。
複数ステージ¶
1 つの -s/--scan-lists フラグの後に、複数のリテラルを並べます。各リテラルが 1 ステージになります。
# ステージ 1: 1 つの結合を 1.35 Å に駆動
# ステージ 2: 2 つの結合を同時に駆動
-s \
'[("TYR,285,CA","SAM,309,C10",1.35)]' \
'[("TYR,285,CA","SAM,309,C10",2.20),("TYR,285,CB","SAM,309,C11",1.80)]'
ステージは順次実行され、各ステージは前ステージの緩和結果から開始します。
双方向スキャン(4-tuple)¶
3-tuple (i, j, target) の代わりに 4-tuple (i, j, start, end) を指定すると、現在の構造から両方向にスキャンします。CLI は各 4-tuple を自動的に 2 ステージに展開します:
パス 1:
i–jの距離を現在の値からstartに向けて駆動。パス 2: 初期構造を復元し、
i–jの距離をendに向けて駆動。
結合軌跡は start → 初期構造 → end の順に連結され、出発構造を通る連続的な経路が得られます。
# 双方向スキャン: 結合 12--45 を現在の構造から
# 1.35 Å(パス 1)と 2.50 Å(パス 2)に向けて駆動
pdb2reaction scan -i input.pdb -q 0 -s '[(12, 45, 1.35, 2.50)]'
これは 2 つの手動ステージの間にジオメトリリセットを行うのと同等ですが、スクリプトを書く必要がありません。同じリテラル内で 3-tuple と 4-tuple を混在させることもできます。
Note
4-tuple 使用時のステージ番号。 1 つの 4-tuple は出力ツリー内で 2 つ のステージに展開されます。start パスは stage_NN/ に、end パスは stage_NN+1/ に書き込まれます。したがって最初のリテラルとして 1 個の 4-tuple を渡した場合、1 つの統合された stage_01/ ではなく stage_01/ と stage_02/ が作成されます。3-tuple と 4-tuple を混在させた場合、カウンターは 3-tuple ごとに +1、4-tuple ごとに +2 進みます。
ワークフロー¶
geom_loaderで構造を読み込み、電荷とスピンを解決します。電荷の解決順序の詳細は CLI 規約: 電荷の指定 を参照してください。--preoptの場合、バイアスをかける前に無バイアスの前処理最適化を実行し、開始構造を緩和します。-s/--scan-lists(YAML/JSON ファイルパスまたはインライン Python リテラル)からステージターゲットを読み取り、(i, j)インデックスを正規化します(デフォルトは 1 始まり)。PDB 入力では、各エントリに整数インデックスまたは'TYR,285,CA'のような原子セレクタ文字列を指定できます。セレクタの区切りは空白・カンマ・スラッシュ・バッククォート・バックスラッシュのいずれも可で、トークン順序は任意です(フォールバックは resname, resseq, atom を想定)。 各結合について変位Δ = target − currentを計算し、h = --max-step-sizeとしてN = ceil(max(|Δ|) / h)ステップに分割します。各結合はδ = Δ / Nずつ更新されます。すべてのステップを順に進め、一時ターゲットを更新しながら調和ポテンシャル
E = Σ ½ k (|ri − rj| − target)²を適用し、UMA で最適化します。最適化サイクルの上限は--relax-max-cyclesで設定します(YAML でopt.max_cyclesが指定されていない場合)。各ステージの最終ステップ後、必要に応じて無バイアス緩和(
--endopt)を実行し、共有結合の変化を報告してresult.*を出力します。すべてのステージについて繰り返します。結合スキャン軌跡(
scan_trj.xyzおよびscan.pdb)は常に書き出されます。--dumpはステップごとの最適化軌跡ファイルのみを制御します。
CLI オプション¶
オプション |
説明 |
デフォルト |
|---|---|---|
|
|
必須 |
|
総電荷(CLI > テンプレート)。 |
|
|
残基別電荷マッピング(例: |
None |
|
UMA 予測器の並列度(workers > 1 で解析ヘシアンは無効化; |
|
|
スピン多重度 2S+1。 |
|
|
スキャンターゲット: YAML/JSON スペックファイルパス(推奨)またはインライン Python リテラル( |
必須 |
|
原子インデックスを 1 始まり/0 始まりとして解釈 |
|
|
|
|
|
1 ステップあたりのスキャン結合の最大変化量(Å)。ステップ数を決定 |
|
|
調和バイアス強度 |
|
|
前処理・各バイアスステップ・後処理における最適化サイクルの上限。YAML で |
|
|
|
|
|
PDB 入力時にリンク水素の親原子を凍結 |
|
|
凍結する原子の 1 始まりインデックスをカンマ区切りで明示的に指定(例: |
None |
|
ステップごとの最適化軌跡を出力。注: |
|
|
PDB/Gaussian 入力で XYZ/TRJ → PDB/GJF コンパニオン変換を切り替え(軌跡変換は PDB のみ) |
|
|
XYZ/GJF 入力時の参照 PDB トポロジー(XYZ 座標は保持) |
None |
|
出力ディレクトリ |
|
|
収束プリセットの上書き( |
|
|
ベース YAML 設定ファイル(最初に適用) |
None |
|
MLIP バックエンド |
|
|
xTB 暗黙溶媒(例: |
|
|
xTB 溶媒モデル |
|
|
スキャン前に無バイアス最適化を実行。スコープ依存デフォルト: 単体では |
|
|
各ステージ後に無バイアス最適化を実行 |
|
|
|
|
共有 YAML セクション¶
geom,calc,opt,lbfgs,rfo: YAML リファレンス と同じキーを使用します。opt.dumpは YAML で設定可能ですが、ステージ軌跡の出力は--dumpで制御します。--relax-max-cyclesは明示的に指定され、かつ YAML でopt.max_cyclesが設定されていない場合にのみ適用されます(デフォルト10000)。
セクション bias¶
k(300): 調和バイアス強度(eV·Å⁻²)。
セクション bond¶
path-search と共通の UMA ベース結合変化検出:
device("auto"): 結合解析用 UMA デバイス。bond_factor(1.20): 共有結合半径のスケーリング係数。margin_fraction(0.05): 比較時の相対許容値。delta_fraction(0.05): 結合の形成・切断を判定する最小相対変化量。
出力¶
out_dir/ (デフォルト:./result_scan/)
├─ preopt/ # --preopt が True の場合
│ ├─ result.xyz
│ ├─ result.pdb # PDB 入力かつ変換有効時
│ └─ result.gjf # Gaussian テンプレートがあり変換有効時
├─ stage_XX/ # ステージごとのフォルダ
│ ├─ result.xyz
│ ├─ result.pdb # 最終構造の PDB コンパニオン(変換有効時)
│ ├─ result.gjf # テンプレートがある場合の Gaussian コンパニオン(変換有効時)
│ ├─ scan_trj.xyz # 常に生成(結合バイアス付き軌跡)
│ └─ scan.pdb # PDB 入力で変換有効時に常に生成(scan.gjf は生成されない)
├─ scan_trj.xyz # 全ステージの結合軌跡
└─ scan.pdb # 結合 PDB 軌跡(変換有効時)
geom/calc/opt/bias/bondおよび最適化ブロックの解決結果と、各ステージの結合変化レポートがコンソールに出力されます。
注意事項¶
症状起点で切り分ける場合は 典型エラー別レシピ を先に参照し、詳細は トラブルシューティング を確認してください。
-s/--scan-listsには単一フラグの後に複数リテラルを並べます。ターゲット距離は正の値である必要があります。原子インデックスは内部で 0 始まりに正規化されます。PDB 入力ではセレクタ文字列を使用でき、空白・カンマ・スラッシュ・バッククォート・バックスラッシュで区切れます。トークン順序は任意です。--freeze-linksが有効な場合、リンク水素の親原子は自動的に凍結されます(リンク水素と凍結原子 を参照)。ステージ結果(
result.xyzと任意の PDB/GJF コンパニオン)は常に書き出されます。結合スキャン軌跡(scan_trj.xyzおよび PDB 入力で変換有効時のscan.pdb)も常に書き出されます。--dumpフラグはステップごとの最適化軌跡ファイルのみを制御します。
geom:
coord_type: cart # coordinate type: cartesian vs dlc internals
freeze_atoms: [] # 1-based frozen atoms merged with CLI/link detection
calc:
charge: 0 # total charge (CLI/template override)
spin: 1 # spin multiplicity 2S+1
model: uma-s-1p1 # uma-s-1p1 | uma-m-1p1
task_name: omol # UMA task name
device: auto # MLIP device selection
max_neigh: null # maximum neighbors for graph construction
radius: null # cutoff radius for neighbor search
r_edges: false # store radial edges
out_hess_torch: true # request torch-form Hessian
freeze_atoms: null # calculator-level frozen atoms
hessian_calc_mode: FiniteDifference # Hessian mode selection
return_partial_hessian: true # partial Hessian over active DOFs
opt:
thresh: gau # convergence preset (Gaussian/Baker-style)
max_cycles: 10000 # optimizer cycle cap
print_every: 100 # logging stride
min_step_norm: 1.0e-08 # minimum norm for step acceptance
assert_min_step: true # stop if steps fall below threshold
rms_force: null # explicit RMS force target
rms_force_only: false # rely only on RMS force convergence
max_force_only: false # rely only on max force convergence
force_only: false # skip displacement checks
converge_to_geom_rms_thresh: 0.05 # geom RMS threshold when converging to ref
overachieve_factor: 0.0 # factor to tighten thresholds
check_eigval_structure: false # validate Hessian eigenstructure
line_search: true # enable line search
dump: false # dump trajectory/restart data
dump_restart: false # dump restart checkpoints
prefix: "" # filename prefix
out_dir: ./result_scan/ # output directory
lbfgs:
thresh: gau # LBFGS convergence preset
max_cycles: 10000 # iteration limit
print_every: 100 # logging stride
min_step_norm: 1.0e-08 # minimum accepted step norm
assert_min_step: true # assert when steps stagnate
rms_force: null # explicit RMS force target
rms_force_only: false # rely only on RMS force convergence
max_force_only: false # rely only on max force convergence
force_only: false # skip displacement checks
converge_to_geom_rms_thresh: 0.05 # RMS threshold when targeting geometry
overachieve_factor: 0.0 # tighten thresholds
check_eigval_structure: false # validate Hessian eigenstructure
line_search: true # enable line search
dump: false # dump trajectory/restart data
dump_restart: false # dump restart checkpoints
prefix: "" # filename prefix
out_dir: ./result_scan/ # output directory
keep_last: 7 # history size for LBFGS buffers
beta: 1.0 # initial damping beta
gamma_mult: false # multiplicative gamma update toggle
max_step: 0.3 # maximum step length
control_step: true # control step length adaptively
double_damp: true # double damping safeguard
mu_reg: null # regularization strength
max_mu_reg_adaptions: 10 # cap on mu adaptations
rfo:
thresh: gau # RFOptimizer convergence preset
max_cycles: 10000 # iteration cap
print_every: 100 # logging stride
min_step_norm: 1.0e-08 # minimum accepted step norm
assert_min_step: true # assert when steps stagnate
rms_force: null # explicit RMS force target
rms_force_only: false # rely only on RMS force convergence
max_force_only: false # rely only on max force convergence
force_only: false # skip displacement checks
converge_to_geom_rms_thresh: 0.05 # RMS threshold when targeting geometry
overachieve_factor: 0.0 # tighten thresholds
check_eigval_structure: false # validate Hessian eigenstructure
line_search: true # enable line search
dump: false # dump trajectory/restart data
dump_restart: false # dump restart checkpoints
prefix: "" # filename prefix
out_dir: ./result_scan/ # output directory
trust_radius: 0.10 # trust-region radius
trust_update: true # enable trust-region updates
trust_min: 0.0001 # minimum trust radius
trust_max: 0.10 # maximum trust radius
max_energy_incr: null # allowed energy increase per step
hessian_update: bfgs # Hessian update scheme
hessian_init: calc # Hessian initialization source
hessian_recalc: 500 # rebuild Hessian every N steps
hessian_recalc_adapt: null # adaptive Hessian rebuild factor
small_eigval_thresh: 1.0e-08 # eigenvalue threshold for stability
alpha0: 1.0 # initial micro step
max_micro_cycles: 50 # micro-iteration limit
rfo_overlaps: false # enable RFO overlaps
gediis: false # enable GEDIIS
gdiis: true # enable GDIIS
gdiis_thresh: 0.0025 # GDIIS acceptance threshold
gediis_thresh: 0.01 # GEDIIS acceptance threshold
gdiis_test_direction: true # test descent direction before DIIS
adapt_step_func: true # adaptive step scaling toggle
bias:
k: 300 # harmonic bias strength (eV·Å⁻²)
bond:
device: auto # MLIP device for bond analysis
bond_factor: 1.2 # covalent-radius scaling
margin_fraction: 0.05 # tolerance margin for comparisons
delta_fraction: 0.05 # minimum relative change to flag bonds
関連項目¶
典型エラー別レシピ – 症状起点の切り分け
all — 単一構造入力に
--scan-listsを使用した一気通貫ワークフローpath-search — スキャン端点を中間体として MEP を探索
extract — スキャン前に活性部位モデル(バインディングポケット) PDB を生成
YAML リファレンス —
biasとbondの完全な設定オプション用語集 — MEP、セグメントの定義