add-elem-info¶
Biopython を使用して PDB の元素記号(カラム 77-78)を追加または修復します。元素カラムを持たない PDB へ追加する場合や、それを必要とする下流ツールに渡す前に既存のカラムを修正する場合に使用します。既存の元素フィールドが信頼できない場合は、再推定して上書きすることもできます(--overwrite)。入力 PDB を Biopython(PDBParser)で解析し、残基の種類と原子名のヒューリスティクスから atom.element を割り当て、PDBIO でカラム 77-78 を書き込みます。座標を変更せず、全モデル/鎖/残基にわたって ATOM・HETATM レコードを処理します。
実行例¶
コマンド形式:
mlmm add-elem-info -i INPUT [-o OUTPUT] [--overwrite]
元素カラムを追加または修復し、入力ファイルをその場で上書きする:
mlmm add-elem-info -i 1abc.pdb
結果を別の出力ファイルに書き出す:
mlmm add-elem-info -i 1abc.pdb -o 1abc_fixed.pdb
既存の元素フィールドを再推定して上書きする:
mlmm add-elem-info -i 1abc.pdb --overwrite
処理の流れ¶
Bio.PDB.PDBParserで入力 PDB を解析します。extract.pyと同じ残基定義(AMINO_ACIDS、WATER_RES、ION)を用います。各原子について、原子名、残基名、レコードが HETATM かどうかを組み合わせて元素を推定します:
イオン残基: 残基由来の元素を優先します。多原子イオン(例: NH4、H3O+)は原子ごとに割り当て(H/N/O)。
タンパク質、核酸、水: H/D は H に、水素・酸素原子は H/O に、P/N/O/S は先頭文字から、Se は専用判定で、炭素ラベル(CA/CB/CG/…)は C に割り当てます。
リガンド/補因子: 原子名接頭辞(C*/P*、CL を除く)と 2 文字/1 文字の正規化を使用。ハロゲン(Cl/Br/I/F)を認識。
PDBIOで構造を書き出します:
-o/--out未指定: 入力ファイルを上書き。-o/--out指定: 指定パスに書き出し。
処理結果のサマリーを出力します: 総原子数、新規割り当て数、既存保持数、上書き数(
--overwrite時)、元素ごとのカウント、未解決原子(最大 50 件、モデル/鎖/残基/原子/シリアル番号)。
出力¶
元素カラム(77-78)が正しく設定された PDB ファイル
コンソールに処理/割り当て済み原子の合計、元素ごとのカウント、未解決原子(最大 50 件)を報告
CLI オプション¶
オプション |
説明 |
デフォルト |
|---|---|---|
|
入力 PDB ファイル。 |
必須 |
|
出力 PDB パス。省略時は入力ファイルを上書き。 |
None(入力を上書き) |
|
既存の元素フィールドがあっても再推定して上書き(デフォルトでは既存値を保持)。 |
|
すべてのフラグの一覧は生成された コマンドリファレンス を参照してください。
関連項目¶
典型エラー別レシピ – 症状起点の切り分け
トラブルシューティング – 詳細な対処ガイド
mm_parm – AMBER トポロジー構築(正しい元素カラムが必要)
extract – タンパク質-リガンド複合体から活性部位ポケットを抽出