add-elem-info

概要

要約: Biopython を使用して PDB の元素記号(カラム 77-78)を追加または修復します。原子名と残基コンテキスト(タンパク質、核酸、水、イオン、リガンド)から元素を推定します。

最小例

mlmm add-elem-info -i 1abc.pdb

出力の見方

  • 元素カラム(77-78)が正しく設定された PDB ファイル

  • コンソールに処理/割り当て済み原子の合計、元素ごとのカウント、未解決原子(最大 50 件)を報告

よくある例

  1. 特定の出力ファイルに書き出し。

mlmm add-elem-info -i 1abc.pdb -o 1abc_fixed.pdb
  1. 既存の元素フィールドを再推定して上書き。

mlmm add-elem-info -i 1abc.pdb --overwrite

ワークフロー

  1. Bio.PDB.PDBParser で入力 PDB を解析します。extract.py で使用される残基定義(AMINO_ACIDSWATER_RESION)をミラーリングします。

  2. 各原子について、原子名、残基名、レコードが HETATM かどうかを組み合わせて元素を推定します:

  • イオン残基: 残基由来の元素を優先します。多原子イオン(例: NH4、H3O+)は原子ごとに割り当て(H/N/O)。

  • タンパク質、核酸、水: H/D を H にマッピング、水原子を O/H に、P/N/O/S の先頭文字マッピング、Se を認識、炭素ラベル(CA/CB/CG/…)を C に。

  • リガンド/補因子: 原子名接頭辞(C*/P*、CL を除く)と 2 文字/1 文字の正規化を使用。ハロゲン(Cl/Br/I/F)を認識。

  1. PDBIO で構造を書き出します:

  • -o/--out 未指定: 入力ファイルを上書き。

  • -o/--out 指定: 指定パスに書き出し。

  1. 処理結果のサマリーを出力します: 総原子数、新規割り当て数、既存保持数、上書き数(--overwrite 時)、元素ごとのカウント、未解決原子(最大 50 件、モデル/鎖/残基/原子/シリアル番号)。

CLI オプション

オプション

説明

デフォルト

-i, --input PATH

入力 PDB ファイル。

必須

-o, --out PATH

出力 PDB パス。省略時は入力ファイルを上書き。

None(入力を上書き)

--overwrite/--no-overwrite

既存の元素フィールドがあっても再推定して上書き(デフォルトでは既存値を保持)。

False


関連項目