6 種の細菌ゲノムに対し、DFAST を
--mge --amr --no_cdd --no_hmm --debug オプションで実行した検証結果です。
--mge は MobileElementFinder による MGE 検出、--amr は CARD/VFDB(薬剤耐性・病原因子)と
PlasmidFinder(プラスミド型)の同定を有効化します。検出された MGE は GenBank 出力に座標付き feature として記載されます。
MobileElementFinder(ツール本体)と MGEdb の BLAST インデックス(参照データ)は、次の 1 コマンドでまとめて準備できます。
非 Docker の DFAST インストール向けの手順です(Docker イメージ dfast2026:dev には MobileElementFinder が同梱済みのため不要)。
<DB_ROOT> は DFAST のデータベースディレクトリ(例: dfast_core/db)に読み替えてください。
$ dfast_file_downloader.py --mefinder -d <DB_ROOT>
このコマンドは次を順に実行します。
| 段階 | 内容 |
|---|---|
| ① ツール導入 | mefinder が未インストールの場合のみ、ソース(bitbucket.org/mhkj/mge_finder)を取得し、biopython の上限ピンを緩めて pip install します(DFAST の biopython 1.87 と共存させるため)。導入済みならスキップ。 |
| ② インデックス構築 | 同梱の MGEdb (v1.1.1) から blastn 用インデックスを <DB_ROOT>/mefinder_db に構築します(mge_records.nin / .nhr / .nsq 等)。完了後にファイル存在を検証。 |
--no_indexing を付けるとツールの導入のみ行い、インデックス構築をスキップします。
既にインデックスがある場合、DFAST 実行時に再構築は行われません(既存を再利用)。
MGE 検出は --mge オプションで有効化します。--amr と併用できます。
$ dfast --genome your_genome.fna --mge -o OUTPUT_DIR # AMR/VFG・プラスミド型判定も同時に行う場合 $ dfast --genome your_genome.fna --mge --amr -o OUTPUT_DIR
既定では --min-coverage 0.95(MEF 既定の 0.9 より厳しめ)で実行され、参照インデックスは
<DB_ROOT>/mefinder_db を使用します。検出された MGE は genome.gbk に座標付き feature
(mobile_element / misc_feature)として、所見は
amr_summary.tsv の ## 行として記載されます(詳細は次節以降)。
| 生物種 / 株 | アクセッション | mobile_element | misc_feature | AMR/VFG ヒット | MGE 注釈行 (##) |
|---|---|---|---|---|---|
| Escherichia coli K-12 MG1655 | GCA_000005845.2 | 52 | 8 | 169 | 60 |
| Klebsiella pneumoniae NTUH-K2044 | GCA_000009345.1 | 78 | 5 | 236 | 84 |
| Klebsiella pneumoniae plasmid pOXA-48 | JN626286.1 | 1 | 0 | 1 | 2 |
| Lactobacillus hokkaidonensis LOOC260 | GCA_000829395.1 | 25 | 5 | 0 | 30 |
| Salmonella enterica Typhimurium DT104 | GCA_000493675.1 | 25 | 1 | 316 | 28 |
| Vibrio cholerae N16961 | GCA_000006745.1 | 15 | 0 | 193 | 15 |
MobileElementFinder が検出した MGE のタイプを、INSDC(DDBJ/GenBank)の統制語彙に従って次のように feature へマッピングします。
| MGE タイプ | GenBank feature key | 主な qualifier |
|---|---|---|
| insertion sequence (IS) | mobile_element | /mobile_element_type="insertion sequence:名称" |
| MITE | mobile_element | /mobile_element_type="MITE:名称" |
| unit transposon | mobile_element | /mobile_element_type="transposon:名称" |
| composite transposon(DB ヒット) | mobile_element | /mobile_element_type="transposon:名称" |
| composite transposon(putative = 予測のみ) | misc_feature | /note="putative composite transposon (predicted by MobileElementFinder)" |
| ICE / IME / CIME / mobile insertion cassette | misc_feature | /note="タイプ説明: 名称" |
| integron / superintegron | 検出されません(MGEdb v1.1.1 に integron 参照配列が無いため。下記の注記参照) | |
mobile_element complement(2292..8429) /note="MobileElementFinder: Tn1999; identity:100.0%, coverage:100.0%; similar to AY236073 (MGEdb)" /note="MGE_1" /mobile_element_type="transposon:Tn1999"
mobile_element 9186..10732 /note="MobileElementFinder: ISLho1; identity:100.0%, coverage:100.0%" /note="MGE_23" /mobile_element_type="insertion sequence:ISLho1"
misc_feature 1799238..1851240 /note="MobileElementFinder: Tn6254; identity:100.0%, coverage:99.1%; similar to AP014680 (MGEdb)" /note="integrative conjugative element (ICE): Tn6254"
misc_feature complement(257907..279930) /note="MobileElementFinder: cn_22023_ISSen9; identity:94.0%, coverage:100.0%" /note="putative composite transposon (predicted by MobileElementFinder)"
なぜ ICE などが misc_feature なのか:
INSDC の /mobile_element_type は統制語彙(insertion sequence・MITE・transposon・integron・retrotransposon 等)に限定され、
ICE / IME / CIME / mobile insertion cassette に対応する値が存在しません。
無理に other とせず、情報を保持できる misc_feature + 説明 /note で記載しています(DDBJ バリデーションも通過)。
IS・MITE・transposon は対応語彙があるため mobile_element として出力されます。
putative composite transposon が出力される条件:
同一の挿入配列 (IS) が同一 contig 上に 2 コピー存在し、次を満たすとき —
(1) 少なくとも片方が確実に検出された IS、
(2) 逆位反復配列 (IR) が保存(端の切断 ≤ 20 bp かつ隣接 HSP ≥ 60 bp)、
(3) 2 つの IS を含む全長が < 52,452 bp。
MGEdb に既知エントリは無く IS の配置から推定する(evidence = PUTATIVE)ため、確信度の低い misc_feature として
cn_<全長>_<IS名>(例 cn_22023_ISSen9)の名称で出力します。間の積荷の中身は問わないため偽陽性もあり得ます。
amr_summary.tsv では、各 contig の薬剤耐性/病原因子ヒット(タブ区切り行)の上に、
PlasmidFinder と MobileElementFinder の所見が ## 行として併記されます。
下は pOXA-48 の例で、OXA-48 カルバペネマーゼが Tn1999 複合トランスポゾン上の IncL プラスミドに載っていることが一目で分かります。
#locus location hit_accession gene product identity q_cov s_cov e_value note ## sequence1 PlasmidFinder: IncL, Description: Possibly derived from enterobacteriales IncL type plasmid., ... ## sequence1 MobileElementFinder: Tn1999 (composite transposon), identity:100.0%, coverage:100.0%, 2292..8429 LOCUS_060 sequence1:complement(5445..6242) ARO:3001782:AAP70012.1 OXA-48 OXA beta-lactamase 100.0 100.0 100.0 0.0 similar to CARD:OXA-48 ...
各ゲノムについて以下 2 ファイルを <生物種_株_アクセッション> 命名で収録しています(計 12 ファイル)。