add-elem-info¶
概要¶
add-elem-info は、PDB ファイルの ATOM/HETATM レコードにある元素記号カラム(77–78)を修復します。
出力の挙動¶
-o/--outが省略され、--overwriteがTrueでない場合、出力は<input>_add_elem.pdbに書き込まれます(末尾の.pdbを_add_elem.pdbに置換)。--overwrite Trueかつ-o/--outが省略されている場合、入力ファイルをその場で上書きします。-o/--outが指定された場合、--overwriteは無視されます。
使用法¶
pdb2reaction add-elem-info -i INPUT.pdb [-o OUTPUT.pdb] [--overwrite {True\|False}]
例¶
# 元素カラムを補完して "<input>_add_elem.pdb" に出力
pdb2reaction add-elem-info -i 1abc.pdb
# 出力ファイルを指定
pdb2reaction add-elem-info -i 1abc.pdb -o 1abc_fixed.pdb
# 入力ファイルをその場で上書き
pdb2reaction add-elem-info -i 1abc.pdb --overwrite True
ワークフロー¶
Bio.PDB.PDBParserで入力を解析し、extract.pyで使用される残基定義(AMINO_ACIDS、WATER_RES、ION)と照合する。各原子について、原子名・残基名・HETATMフラグを組み合わせて元素を推定:
ION辞書に登録された単原子イオン残基は対応する元素を使用タンパク質/核酸/水はH/DやSeの特例を扱い、C/N/O/P/Sは先頭文字で判定(炭素側鎖ラベルはC)
その他のリガンドは原子名の接頭辞で判定し、ハロゲン認識や重水素→水素の正規化にフォールバック
PDBIOで書き出し:デフォルト出力:
<input>_add_elem.pdb(-o/--out省略かつ--overwriteがTrueでない場合)-o/--out: 指定パスへ書き込み(この場合--overwriteは無視)--overwrite True(-o/--outなし): 入力パスを上書き
割り当て/再割り当て数、元素別合計、未解決原子のリスト(最大50件)を要約表示。
CLI オプション¶
オプション |
説明 |
デフォルト |
|---|---|---|
|
入力 PDB ファイル |
必須 |
|
出力パス。指定した場合 |
None → |
|
|
|
出力¶
元素記号が補完/修正されたPDB ファイル:
デフォルト:
<input>_add_elem.pdb(-o/--out省略かつ--overwriteがTrueでない場合)-o/--out指定時:OUTPUT.pdb(--overwriteの値に関わらず)--overwrite Trueを-o/--outなしで指定:INPUT.pdbをその場で上書き
コンソールに、処理/割り当て原子数、元素別カウント、未解決原子(最大50件)を出力
注意事項¶
変更されるのは列 77–78 のみ。座標、占有率、B因子、電荷、altloc、挿入コード、レコード順序は保持されます。
すべてのモデル/チェーン/残基にわたる ATOM/HETATM レコードを処理します。
重水素は水素に正規化され、セレン(
SE*)やハロゲンは自動認識されます。