DFAST の PlasmidFinder 参照データに、レプリコン型・プラスミドタイピング用の
追加データベース 3 件を統合しました。標準の PlasmidFinder データベース
(enterobacteriales・Inc18・Rep1–3・RepA_N など)に加え、以下が
dfast_file_downloader.py --plasmidfinder で自動取得・登録され、
--amr 実行時のプラスミド(レプリコン型)判定に使用されます。
| DB 名 | 説明 | ファイル | 配列数 | サイズ | 配布元 (figshare) |
|---|---|---|---|---|---|
| PseudomonasRepDB | Pseudomonas レプリコン型データベース v1.0 | PseudomonasRepDB_v1.fsa | 404 | 421 KB | PseudomonasRepDB database v1.0 |
| WHRepDB | WHRepDB database v1.0 | WHRepDB_v1.fsa | 12,923 | 12 MB | WHRepDB database v1.0 |
| Acinetobacter | AcinetobacterPlasmidTyping database v3 | AcinetobacterPlasmidTyping_v3.fsa | 555 | 561 KB | AcinetobacterPlasmidTyping database v3.0 |
いずれも PlasmidFinder v3 形式(アンダースコア区切り・スペースを含まない)で配布されており、 そのまま blastn の subject として使用できます。事前インデックス(makeblastdb / KMA)は不要です。
| DB 名 | ヘッダ例 | 備考 |
|---|---|---|
| PseudomonasRepDB | >PInc-1alpha__CP002151.1 | — |
| WHRepDB | >WH-A1__NZCP038616.1 | — |
| Acinetobacter | >R3-T1_1__NC010605.1 | 元ヘッダにスペースを含むため取得時に自動補正(空白→アンダースコア) |
<DB_ROOT> は DFAST のデータベースディレクトリ(例: dfast_core/db)に読み替えてください。
標準 PlasmidFinder DB のクローンと、追加 DB 3 件の figshare からの取得・登録が自動で行われます。
$ dfast_file_downloader.py --plasmidfinder -d <DB_ROOT>
データは <DB_ROOT>/plasmidfinder_db にダウンロードされ、追加 DB の行が
<DB_ROOT>/plasmidfinder_db/config に追記されます。
plasmidfinder_db ディレクトリを削除してから
作り直すため、何度実行しても追加 DB が重複登録されることはありません。
プラスミド(レプリコン型)判定は --amr オプションで有効になります(PlasmidFinder を含む)。追加 DB は自動的に使用されます。
$ dfast --genome your_genome.fna --amr -o OUTPUT_DIR
ヒットしたレプリコン型は、コンティグ(source feature)の注釈および amr_summary.tsv に出力されます。
取得した 3 つの追加 DB はそれぞれ <DB_ROOT>/plasmidfinder_db/config に登録され、判定に使用されます。
scripts/dfast_file_downloader.py の plasmidfinder_extra_databases 各エントリにも
コメントとして記載しています。直接ダウンロードには ndownloader.figshare.com/files/<id> 形式の URL を使用します
(データセットページの figshare.com/... 形式は空レスポンスを返すため不可)。