scan3d¶
概要¶
要約: 調和拘束と ML/MM 緩和による 3 距離(d1, d2, d3)グリッドスキャンを実行します。
-s/--scan-listsで YAML/JSON スペックファイル(推奨)またはインライン Python リテラルを使用します。
mlmm scan3d は d1、d2、d3 のネストループを実行し、ML/MM 計算機(mlmm.mlmm_calc.mlmm)を使用して適切な拘束で各点を緩和します。ML 領域は --model-pdb から、Amber パラメータは --parm から読み取られ、MLIP バックエンドは -b/--backend で選択(デフォルト: uma)、オプティマイザーは PySisyphus LBFGS です。
最小例¶
mlmm scan3d -i input.pdb --parm real.parm7 --model-pdb ml_region.pdb \
-q 0 -s scan3d.yaml --print-parsed -o ./result_scan3d/
出力の見方¶
result_scan3d/surface.csvresult_scan3d/grid/point_i000_j000_k000.xyzresult_scan3d/scan3d_density.html
よくある例¶
YAML spec の
pairsを先に検証する。--scan-listsを使う。--dumpを有効にして(d1,d2)スライスごとの d3 軌跡を保存する。
注記:
-s/--scan-listsの解釈結果を確認したい場合は--print-parsedを追加してください。
使用法¶
mlmm scan3d -i INPUT.pdb --parm real.parm7 --model-pdb ml_region.pdb \
-q CHARGE [-m MULT] \
[--csv precomputed_surface.csv] \
[-s scan3d.yaml | -s "[(I1,J1,LOW1,HIGH1),(I2,J2,LOW2,HIGH2),(I3,J3,LOW3,HIGH3)]"] \
[--one-based|--zero-based] [--max-step-size FLOAT] [--bias-k FLOAT] \
[--freeze-atoms "1,3,5"] [--relax-max-cycles INT] [--thresh PRESET] \
[--dump/--no-dump] [--out-dir DIR] \
[--preopt/--no-preopt] [--baseline {min|first}] [--zmin FLOAT] [--zmax FLOAT]
例¶
# 推奨: YAML/JSON spec
cat > scan3d.yaml << 'YAML'
one_based: true
pairs:
- [12, 45, 1.30, 3.10]
- [10, 55, 1.20, 3.20]
- [15, 60, 1.10, 3.00]
YAML
mlmm scan3d -i input.pdb --parm real.parm7 --model-pdb ml_region.pdb \
-q 0 -s scan3d.yaml --print-parsed
# 代替: インライン Python リテラル
mlmm scan3d -i input.pdb --parm real.parm7 --model-pdb ml_region.pdb \
-q 0 -s "[(12,45,1.30,3.10),(10,55,1.20,3.20),(15,60,1.10,3.00)]"
# 事前最適化とカスタム出力ディレクトリ付き
mlmm scan3d -i input.pdb --parm real.parm7 --model-pdb ml_region.pdb \
-q 0 -s "[(12,45,1.30,3.10),(10,55,1.20,3.20),(15,60,1.10,3.00)]" \
--max-step-size 0.20 --dump -o ./result_scan3d/ \
--preopt --baseline min
YAML/JSON スペックフォーマット(推奨)¶
-s/--scan-lists は YAML/JSON ファイルを自動検出します。ファイルパスを渡すとスペックモードになります:
one_based: true # 任意; デフォルトは CLI の --one-based/--zero-based
pairs:
- [12, 45, 1.30, 3.10]
- [10, 55, 1.20, 3.20]
- [15, 60, 1.10, 3.00]
pairsは必須で、正確に 3 つの四つ組を含む必要があります。各四つ組は
(i, j, low_A, high_A)です。インデックスは整数または PDB セレクター(
--scan-listsと同じ)が使用可能です。
インラインリテラルフォーマット¶
-s/--scan-lists がファイルパスでない値を受け取ると、単一の Python リテラル文字列として評価されます。シェルクォートに注意してください。
基本構造¶
リテラルは正確に 3 つの四つ組 (atom1, atom2, low_A, high_A) の Python リストです:
-s '[(atom1, atom2, low_A, high_A), (atom3, atom4, low_A, high_A), (atom5, atom6, low_A, high_A)]'
シェルが括弧やスペースを解釈しないよう、リテラル全体をシングルクォートで囲んでください。
各四つ組は 1 つのスキャン軸を定義します:
atom1–atom2間の距離をlow_Aからhigh_Aまでスキャンします。scanと異なり、1 つのリテラルのみ受け付けます(マルチステージ非対応)。
原子の指定¶
原子は整数インデックスまたは PDB セレクター文字列で指定できます:
方法 |
例 |
備考 |
|---|---|---|
整数インデックス |
|
デフォルトは 1 始まり( |
PDB セレクター |
|
残基名、残基番号、原子名 |
PDB セレクターのトークンは、カンマ ,、スペース、スラッシュ /、バッククォート `、バックスラッシュ \ のいずれかで区切れます。トークンの順序は自由です。
# 以下はすべて同じ原子を指定:
"TYR,285,CA"
"TYR 285 CA"
"TYR/285/CA"
"285,TYR,CA" # 順序は自由
クォート規則¶
# 正しい: リスト全体をシングルクォート、内側のセレクター文字列をダブルクォート
-s '[("TYR,285,CA","MMT,309,C10",1.30,3.10),("TYR,285,CB","MMT,309,C11",1.20,3.20),("TYR,285,CG","MMT,309,C12",1.10,3.00)]'
# 正しい: 整数インデックスは内側のクォート不要
-s '[(1, 5, 1.30, 3.10), (2, 8, 1.20, 3.20), (3, 12, 1.10, 3.00)]'
# 非推奨: 外側をダブルクォートにすると内側のクォートをエスケープする必要あり
-s "[(\"TYR,285,CA\",\"MMT,309,C10\",1.30,3.10),...]"
ワークフロー¶
geom_loaderで構造を読み込み、CLI から電荷/スピンを解決し、--preoptの場合は任意でバイアスなし事前最適化を実行。-s/--scan-lists(YAML/JSON スペックファイルまたはインラインリテラル)からターゲットを解析して 3 つの四つ組にします(デフォルト 1 始まりインデックス、--zero-based指定時は 0 始まり)。PDB 入力の場合、各原子エントリは整数インデックスまたは"TYR,285,CA"のようなセレクター文字列が使用可能。区切り文字はスペース、カンマ、スラッシュ、バッククォート、バックスラッシュ。外側ループ
d1[i]: d1 拘束のみで緩和。d1 値が最も近い以前のスキャン済みジオメトリから開始。中間ループ
d2[j]: d1 と d2 の拘束で緩和。最も近い (d1, d2) ジオメトリから開始。内側ループ
d3[k]: 3 つの拘束すべてで緩和。バイアスなしエネルギーを測定(評価時にバイアス除去)し、拘束ジオメトリと収束フラグを書き出し。スキャン完了後、
surface.csvを組み立て、kcal/mol ベースラインシフト(--baseline {min|first})を適用し、3D RBF 補間アイソサーフェスプロット(scan3d_density.html)を生成(--zmin/--zmaxを尊重)。
CLI オプション¶
オプション |
説明 |
デフォルト |
|---|---|---|
|
完全酵素 PDB(リンク原子なし)。 |
|
|
完全酵素の Amber parm7 トポロジー。 |
|
|
ML 領域を定義する PDB。 |
None |
|
明示的な ML 領域原子インデックス( |
None |
|
|
|
|
B 因子から ML/MM レイヤーを自動検出。 |
|
|
ML 領域の総電荷。 |
None( |
|
残基ごとの電荷マッピング(例: |
None |
|
スピン多重度 (2S+1)。 |
|
|
1 始まりカンマ区切りの凍結原子インデックス。 |
None |
|
ML 領域からの距離カットオフ (Å) — ヘシアン計算に含める MM 原子を指定。 |
None |
|
ML 領域からの可動 MM 原子の距離カットオフ (Å)。指定すると |
None |
|
スキャンターゲット: YAML/JSON スペックファイルパス(自動検出、 |
必須 |
|
事前計算済み |
None |
|
|
|
|
|
|
|
ステップごとの最大距離増分 (Å)。グリッド密度を制御。 |
|
|
調和ウェル強度 k (eV/Ų)。 |
|
|
バイアス緩和ごとの最大オプティマイザーサイクル。 |
|
|
(d1, d2) スライスごとの内側 d3 スキャン TRJ を書き出し。 |
|
|
グリッドとプロットの出力ディレクトリルート。 |
|
|
収束プリセット上書き( |
|
|
ベース YAML 設定ファイル(最初に適用)。 |
None |
|
非 PDB 入力用の参照 PDB トポロジー。 |
None |
|
スキャン前にバイアスなし最適化を実行。 |
|
|
kcal/mol エネルギーをグローバル最小値または |
|
|
アイソサーフェスカラーバンドの手動下限(kcal/mol)。 |
自動スケール |
|
アイソサーフェスカラーバンドの手動上限(kcal/mol)。 |
自動スケール |
|
ML 領域の MLIP バックエンド: |
None(内部で |
|
xTB 点電荷埋め込み補正の有効化。MM 環境から ML 領域への静電的影響を考慮。 |
|
|
xTB 埋め込み用 MM 原子のカットオフ半径(Å)。 |
|
|
PDB テンプレート利用可能時の XYZ/TRJ から PDB コンパニオン生成の切り替え。 |
|
出力¶
out_dir/ (デフォルト:./result_scan3d/)
surface.csv # グリッドメタデータ(d1, d2, d3, energy, convergence)
scan3d_density.html # 3D エネルギーアイソサーフェス可視化
grid/point_i###_j###_k###.xyz # 各グリッド点の緩和ジオメトリ
grid/point_i###_j###_k###.pdb # PDB コンパニオン(B 因子: ML=0, Movable-MM=10, Frozen=20)
grid/inner_path_d1_###_d2_###_trj.xyz # --dump が True の場合のみ
YAML 設定¶
geom:
coord_type: cart
freeze_atoms: []
calc:
charge: 0
spin: 1
mlmm:
real_parm7: real.parm7
model_pdb: ml_region.pdb
opt:
thresh: baker
max_cycles: 10000
dump: false
out_dir: ./result_scan3d/
lbfgs:
max_step: 0.3
out_dir: ./result_scan3d/
bias:
k: 300.0
関連項目¶
典型エラー別レシピ – 症状起点の切り分け
トラブルシューティング – 詳細な対処ガイド
scan – 1D 結合距離駆動スキャン
scan2d – 2D 距離グリッドスキャン
opt – 構造最適化(スキャン前に実行する場合が多い)
all – end-to-endワークフロー
YAML リファレンス – スキャンの完全な設定オプション