DFAST 可動性遺伝因子 (MGE) / 薬剤耐性 (AMR) アノテーション検証サマリ

生成日: 2026-06-11  |  DFAST ver. 1.3.9  |  MobileElementFinder 1.1.2 (MGEdb 1.1.1)  |  PlasmidFinder / CARD / VFDB

6 種の細菌ゲノムに対し、DFAST を --mge --amr --no_cdd --no_hmm --debug オプションで実行した検証結果です。 --mge は MobileElementFinder による MGE 検出、--amr は CARD/VFDB(薬剤耐性・病原因子)と PlasmidFinder(プラスミド型)の同定を有効化します。検出された MGE は GenBank 出力に座標付き feature として記載されます。

1. インストールと使い方

ツール・参照データのインストール

MobileElementFinder(ツール本体)と MGEdb の BLAST インデックス(参照データ)は、次の 1 コマンドでまとめて準備できます。 非 Docker の DFAST インストール向けの手順です(Docker イメージ dfast2026:dev には MobileElementFinder が同梱済みのため不要)。 <DB_ROOT> は DFAST のデータベースディレクトリ(例: dfast_core/db)に読み替えてください。

$ dfast_file_downloader.py --mefinder -d <DB_ROOT>

このコマンドは次を順に実行します。

段階内容
① ツール導入mefinder が未インストールの場合のみ、ソース(bitbucket.org/mhkj/mge_finder)を取得し、biopython の上限ピンを緩めて pip install します(DFAST の biopython 1.87 と共存させるため)。導入済みならスキップ。
② インデックス構築同梱の MGEdb (v1.1.1) から blastn 用インデックスを <DB_ROOT>/mefinder_db に構築します(mge_records.nin / .nhr / .nsq 等)。完了後にファイル存在を検証。
--no_indexing を付けるとツールの導入のみ行い、インデックス構築をスキップします。 既にインデックスがある場合、DFAST 実行時に再構築は行われません(既存を再利用)。

DFAST の実行

MGE 検出は --mge オプションで有効化します。--amr と併用できます。

$ dfast --genome your_genome.fna --mge -o OUTPUT_DIR
# AMR/VFG・プラスミド型判定も同時に行う場合
$ dfast --genome your_genome.fna --mge --amr -o OUTPUT_DIR

既定では --min-coverage 0.95(MEF 既定の 0.9 より厳しめ)で実行され、参照インデックスは <DB_ROOT>/mefinder_db を使用します。検出された MGE は genome.gbk に座標付き feature (mobile_element / misc_feature)として、所見は amr_summary.tsv## 行として記載されます(詳細は次節以降)。

2. ゲノム別 検出結果

生物種 / 株アクセッション mobile_elementmisc_feature AMR/VFG ヒットMGE 注釈行 (##)
Escherichia coli K-12 MG1655GCA_000005845.252816960
Klebsiella pneumoniae NTUH-K2044GCA_000009345.178523684
Klebsiella pneumoniae plasmid pOXA-48JN626286.11012
Lactobacillus hokkaidonensis LOOC260GCA_000829395.1255030
Salmonella enterica Typhimurium DT104GCA_000493675.125131628
Vibrio cholerae N16961GCA_000006745.115019315

全 6 ゲノムで DFAST は正常終了 (exit 0)。L. hokkaidonensis(食品由来)で AMR ヒット 0 件は妥当。 mobile_element / misc_feature は genome.gbk に、AMR/VFG ヒットと MGE 注釈行は amr_summary.tsv に記載されます。

3. MGE が GenBank にどう記載されるか

MobileElementFinder が検出した MGE のタイプを、INSDC(DDBJ/GenBank)の統制語彙に従って次のように feature へマッピングします。

MGE タイプGenBank feature key主な qualifier
insertion sequence (IS)mobile_element/mobile_element_type="insertion sequence:名称"
MITEmobile_element/mobile_element_type="MITE:名称"
unit transposonmobile_element/mobile_element_type="transposon:名称"
composite transposon(DB ヒット)mobile_element/mobile_element_type="transposon:名称"
composite transposon(putative = 予測のみ)misc_feature/note="putative composite transposon (predicted by MobileElementFinder)"
ICE / IME / CIME / mobile insertion cassettemisc_feature/note="タイプ説明: 名称"
integron / superintegron検出されません(MGEdb v1.1.1 に integron 参照配列が無いため。下記の注記参照)

共通で全 feature に /note="MobileElementFinder: 名称; identity:X%, coverage:Y%; similar to accession (MGEdb)" を付与(accession が無い場合は "similar to ..." 部分を省略)。 /note="MGE_n" は DFAST の内部 feature ID(出力詳細度 3 の標準動作)。 座標の < / > は参照配列に対して 5'/3' が不完全な場合のみ付与されます。

mobile_element 記載例① — transposon(pOXA-48 / Tn1999)

     mobile_element  complement(2292..8429)
                     /note="MobileElementFinder: Tn1999; identity:100.0%,
                     coverage:100.0%; similar to AY236073 (MGEdb)"
                     /note="MGE_1"
                     /mobile_element_type="transposon:Tn1999"

mobile_element 記載例② — insertion sequence(L. hokkaidonensis / ISLho1)

     mobile_element  9186..10732
                     /note="MobileElementFinder: ISLho1; identity:100.0%,
                     coverage:100.0%"
                     /note="MGE_23"
                     /mobile_element_type="insertion sequence:ISLho1"

misc_feature 記載例③ — ICE(L. hokkaidonensis / Tn6254)

     misc_feature    1799238..1851240
                     /note="MobileElementFinder: Tn6254; identity:100.0%,
                     coverage:99.1%; similar to AP014680 (MGEdb)"
                     /note="integrative conjugative element (ICE): Tn6254"

misc_feature 記載例④ — putative composite transposon(E. coli K-12)

     misc_feature    complement(257907..279930)
                     /note="MobileElementFinder: cn_22023_ISSen9;
                     identity:94.0%, coverage:100.0%"
                     /note="putative composite transposon (predicted by MobileElementFinder)"
integron / superintegron について: MobileElementFinder の参照データベース MGEdb v1.1.1 には integron の参照配列が含まれていません (登録があるのは IS・ICE・transposon・IME・MITE・CIME・mobile insertion cassette の 8 タイプ)。 そのため V. cholerae N16961 のスーパーインテグロンや S. enterica DT104 の SGI1 内 class 1 integron は 「integron」としては検出されません(内部の IS は insertion sequence として検出されます)。これはアライメント検出方式の原理的制約です。

補足: 分類の判断基準

なぜ ICE などが misc_feature なのか: INSDC の /mobile_element_type は統制語彙(insertion sequence・MITE・transposon・integron・retrotransposon 等)に限定され、 ICE / IME / CIME / mobile insertion cassette に対応する値が存在しません。 無理に other とせず、情報を保持できる misc_feature + 説明 /note で記載しています(DDBJ バリデーションも通過)。 IS・MITE・transposon は対応語彙があるため mobile_element として出力されます。

putative composite transposon が出力される条件: 同一の挿入配列 (IS) が同一 contig 上に 2 コピー存在し、次を満たすとき — (1) 少なくとも片方が確実に検出された IS、 (2) 逆位反復配列 (IR) が保存(端の切断 ≤ 20 bp かつ隣接 HSP ≥ 60 bp)、 (3) 2 つの IS を含む全長が < 52,452 bp。 MGEdb に既知エントリは無く IS の配置から推定する(evidence = PUTATIVE)ため、確信度の低い misc_feature として cn_<全長>_<IS名>(例 cn_22023_ISSen9)の名称で出力します。間の積荷の中身は問わないため偽陽性もあり得ます。

4. AMR × MGE の文脈(amr_summary.tsv)

amr_summary.tsv では、各 contig の薬剤耐性/病原因子ヒット(タブ区切り行)の上に、 PlasmidFinder と MobileElementFinder の所見が ## 行として併記されます。 下は pOXA-48 の例で、OXA-48 カルバペネマーゼが Tn1999 複合トランスポゾン上の IncL プラスミドに載っていることが一目で分かります。

#locus  location  hit_accession  gene  product  identity  q_cov  s_cov  e_value  note
## sequence1 PlasmidFinder: IncL, Description: Possibly derived from enterobacteriales IncL type plasmid., ...
## sequence1 MobileElementFinder: Tn1999 (composite transposon), identity:100.0%, coverage:100.0%, 2292..8429
LOCUS_060  sequence1:complement(5445..6242)  ARO:3001782:AAP70012.1  OXA-48  OXA beta-lactamase  100.0  100.0  100.0  0.0  similar to CARD:OXA-48 ...

5. 同梱ファイル

各ゲノムについて以下 2 ファイルを <生物種_株_アクセッション> 命名で収録しています(計 12 ファイル)。