`add-elem-info`¶

Biopython を使用して PDB の元素記号（カラム 77-78）を追加または修復します。元素カラムを持たない PDB へ追加する場合や、それを必要とする下流ツールに渡す前に既存のカラムを修正する場合に使用します。既存の元素フィールドが信頼できない場合は、再推定して上書きすることもできます（--overwrite）。入力 PDB を Biopython（PDBParser）で解析し、残基の種類と原子名のヒューリスティクスから atom.element を割り当て、PDBIO でカラム 77-78 を書き込みます。座標を変更せず、全モデル/鎖/残基にわたって ATOM・HETATM レコードを処理します。

実行例¶

コマンド形式:

mlmm add-elem-info -i INPUT [-o OUTPUT] [--overwrite]

元素カラムを追加または修復し、入力ファイルをその場で上書きする:

mlmm add-elem-info -i 1abc.pdb

結果を別の出力ファイルに書き出す:

mlmm add-elem-info -i 1abc.pdb -o 1abc_fixed.pdb

既存の元素フィールドを再推定して上書きする:

mlmm add-elem-info -i 1abc.pdb --overwrite

処理の流れ¶

Bio.PDB.PDBParser で入力 PDB を解析します。extract.py と同じ残基定義（AMINO_ACIDS、WATER_RES、ION）を用います。
各原子について、原子名、残基名、レコードが HETATM かどうかを組み合わせて元素を推定します:

イオン残基: 残基由来の元素を優先します。多原子イオン（例: NH4、H3O+）は原子ごとに割り当て（H/N/O）。
タンパク質、核酸、水: H/D は H に、水素・酸素原子は H/O に、P/N/O/S は先頭文字から、Se は専用判定で、炭素ラベル（CA/CB/CG/…）は C に割り当てます。
リガンド/補因子: 原子名接頭辞（C*/P*、CL を除く）と 2 文字/1 文字の正規化を使用。ハロゲン（Cl/Br/I/F）を認識。

PDBIO で構造を書き出します:

-o/--out 未指定: 入力ファイルを上書き。
-o/--out 指定: 指定パスに書き出し。

処理結果のサマリーを出力します: 総原子数、新規割り当て数、既存保持数、上書き数（--overwrite 時）、元素ごとのカウント、未解決原子（最大 50 件、モデル/鎖/残基/原子/シリアル番号）。

出力¶

元素カラム（77-78）が正しく設定された PDB ファイル
コンソールに処理/割り当て済み原子の合計、元素ごとのカウント、未解決原子（最大 50 件）を報告

CLI オプション¶

オプション	説明	デフォルト
`-i, --input PATH`	入力 PDB ファイル。	必須
`-o, --out PATH`	出力 PDB パス。省略時は入力ファイルを上書き。	None（入力を上書き）
`--overwrite/--no-overwrite`	既存の元素フィールドがあっても再推定して上書き（デフォルトでは既存値を保持）。	`False`

すべてのフラグの一覧は生成されたコマンドリファレンスを参照してください。

add-elem-info¶

実行例¶

処理の流れ¶

出力¶

CLI オプション¶

関連項目¶

`add-elem-info`¶