エクセルから Submission、Experiment と Run XML を生成します。
D-way アカウント ID、submission 番号と BioProject アクセッション番号を指定します。
例
DRA submission id ‘example-0001’: -a example -i 0001
BioProject ‘PRJDB7252’ : -p PRJDB7252
singularity exec excel2xml.simg excel2xml_dra -a example -i 0001 -p PRJDB7252 example/example-0001_dra_metadata.xlsx
エクセルから三つの XML が生成されます。
example-0001_dra_Submission.xml
example-0001_dra_Experiment.xml
example-0001_dra_Run.xml
Analysis シートが記入されている場合は Analysis XML も生成されます。
example-0001_dra_Analysis.xml
Submission ID を指定して XML をチェックします。XML は submission-excel2xml ディレクトリ直下に配置されている必要があります。SRA xsd ファイルは build 中にコンテナー内の /opt/submission-excel2xml/ にダウンロードされています。
singularity exec excel2xml.simg validate_meta_dra -a example -i 0001
ここでは xsd に対するチェックと最低限のチェックが実施されます。
DRA の登録サイトではより詳細なチェックが実施されるため、パスした XML が登録過程でエラーになることがあります。
Analysis XML のみを生成
既存 Submission に Analysis を追加する場合、’Analysis’ シートのみを記入し、Analysis XML を生成します。XML 生成時に -c で center name を指定します。
例
DRA submission id ‘example-0002’: -a example -i 0002
BioProject ‘PRJDB7252’ : -p PRJDB7252
Center name: National Institute of Genetics
singularity exec excel2xml.simg excel2xml_dra -a example -i 0002 -p PRJDB7252 -c "National Institute of Genetics" example/example-0002_dra_metadata.xlsx
エクセルから Analysis XML が生成されます。
example-0002_dra_Analysis.xml
XML 生成とチェック: Docker
エクセルから Submission、Experiment と Run XML を生成します。
D-way アカウント ID、submission 番号、BioProject アクセッション番号とエクセルを含むディレクトリのフルパスを指定します。
例
DRA submission id ‘example-0001’: -a example -i 0001
BioProject ‘PRJDB7252’ : -p PRJDB7252
‘path_to_excel_directory’: エクセルを含むディレクトリのフルパス
sudo docker run -v /path_to_excel_directory:/data -w /data excel2xml excel2xml_dra -a example -i 0001 -p PRJDB7252 example/example-0001_dra_metadata.xlsx
エクセルから三つの XML が生成されます。
example-0001_dra_Submission.xml
example-0001_dra_Experiment.xml
example-0001_dra_Run.xml
Analysis シートが記入されている場合は Analysis XML も生成されます。
example-0001_dra_Analysis.xml
Submission ID を指定して XML をチェックします。XML は submission-excel2xml ディレクトリ直下に配置されている必要があります。SRA xsd ファイルは build 中にコンテナー内の /opt/submission-excel2xml/ にダウンロードされています。
sudo docker run -v /path_to_excel_directory:/data -w /data excel2xml validate_meta_dra -a example -i 0001
ここでは xsd に対するチェックと最低限のチェックが実施されます。
DRA の登録サイトではより詳細なチェックが実施されるため、パスした XML が登録過程でエラーになることがあります。
Analysis XML のみを生成
既存 Submission に Analysis を追加する場合、’Analysis’ シートのみを記入し、Analysis XML を生成します。XML 生成時に -c で center name を指定します。
例
DRA submission id ‘example-0002’: -a example -i 0002
BioProject ‘PRJDB7252’ : -p PRJDB7252
Center name: National Institute of Genetics
sudo docker run -v /path_to_excel_directory:/data -w /data excel2xml excel2xml_dra -a example -i 0002 -p PRJDB7252 -c "National Institute of Genetics" example/example-0002_dra_metadata.xlsx
エクセルから Analysis XML が生成されます。
example-0002_dra_Analysis.xml
チェック
SRA xsd に対する XML チェック
メタデータ XML は SRA xsd に対してチェックされます。メッセージに従って XML を修正してください。
XML の内容チェック
Submission
Error: Submission: 公開予定日が過去の日付
将来の日付を指定してください。
Experiment と Run
Error: Run: #{run_alias} Paired library only has one file.
ペアライブラリ Experiment では少なくとも二つの配列データファイル (例、R1.fastq と R2.fastq) が含まれている必要があります。
オブジェクトの参照関係チェック
Error: Run to Experiment reference error.
全ての Experiment が Run から参照されていない。
Experiment を参照していない Run が存在する。
Run から参照されていない Experiment が存在する。
このような場合、全ての Run が全ての Experiment を参照するように修正してください。
JGA と同様の手順になります。AGD のメタデータも JGA_metadata.xlsx に記入します。
Submission ID には AGD Submission ID (例 ASUB000001) を指定します。
NIG スパコンでの実施方法
国立遺伝学研究所 生命情報・DDBJ センターが運営する NIG スパコン では /lustre9/open/shared_data/software/submission-excel2xml/
に Singularity イメージが設置されています。ダウンロードや build 作業をすることなく、メタデータエクセルファイルがあれば XML 生成や XML のチェックを実施することができます。
DRA
多件数のデータファイルがスパコンにある場合、メタデータ XML 作成、及び、データファイルの DRA ファイル受付サーバ (ftp-private.ddbj.nig.ac.jp) への転送をスパコン上で完結することができます。
エクセルから Submission、Experiment と Run XML を生成。
cp /lustre9/open/shared_data/software/submission-excel2xml/excel2xml.simg ~/
cd
singularity exec excel2xml.simg excel2xml_dra -a example -i 0001 -p PRJDB7252 example/example-0001_dra_metadata.xlsx
XML のチェック。
singularity exec excel2xml.simg validate_meta_dra -a example -i 0001
JGA
TBD
AGD
TBD
English
Bioinformation and DDBJ Center
release: 2026-04-09
version: v3.6.3
These files are Excel, container images and tools for generation and validation of metadata XML files for databases of Bioinformation and DDBJ Center.
Download the Singularity image or build the Singularity image as follows.
cd submission-excel2xml
sudo singularity build excel2xml.simg Singularity
Docker
Build the Docker image as follows.
cd submission-excel2xml
sudo docker build -t excel2xml .
DRA
Enter metadata in the excel
Enter metadata and data files in the ‘Submission’, ‘Experiment’, ‘Run’ and ‘Run-file’ sheets of the excel “metadata_dra.xlsx”.
See our website for metadata and ‘Readme’ sheet of the excel for details.
See ‘example-0001_dra_metadata.xlsx’ for example.
To submit Analysis (optional) object(s), enter an ‘Analysis’ sheet. Analysis-only submission is not acceptable. Submit Analysis to a Submission having Run(s).
See ‘example/example-0002_dra_metadata.xlsx’ for example.
Generate XMLs: Singularity
Generate Submission, Experiment and Run XMLs from the excel.
Specify the D-way account ID, submission number and BioProject accession.
For example,
DRA submission id ‘example-0001’: -a example -i 0001
BioProject ‘PRJDB7252’ : -p PRJDB7252
singularity exec excel2xml.simg excel2xml_dra -a example -i 0001 -p PRJDB7252 example/example-0001_dra_metadata.xlsx
Three XMLs are generated from the excel.
example-0001_dra_Submission.xml
example-0001_dra_Experiment.xml
example-0001_dra_Run.xml
When an Analysis sheet is filled, an Analysis XML is generated.
example-0001_dra_Analysis.xml
Validate the XMLs by specifying the submission ID. The XML files must be under the submission-excel2xml directory. The SRA xsd files have been downloaded to /opt/submission-excel2xml/ from pub in the container during the build.
singularity exec excel2xml.simg validate_meta_dra -a example -i 0001
Please note that this validator only performs xsd validation and minimum checks.
The XMLs are fully validated in the DRA web XML registration process,
so the checked XMLs may be failed in the DRA submission system.
Generate Analysis XML only
To add Analysis object(s) to an existing Submission, you may enter an ‘Analysis’ sheet only and generate only an Analysis XML. Specify a center name by -c option.
Example
DRA submission id ‘example-0002’: -a example -i 0002
BioProject ‘PRJDB7252’ : -p PRJDB7252
Center name: National Institute of Genetics
singularity exec excel2xml.simg excel2xml_dra -a example -i 0002 -p PRJDB7252 -c "National Institute of Genetics" example/example-0002_dra_metadata.xlsx
An Analysis XML is generated from the excel.
example-0001_dra_Analysis.xml
Generate XMLs: Docker
Generate Submission, Experiment and Run XMLs from the excel.
Specify the D-way account ID, submission number, BioProject accession and full path of the directory which contains the excel.
For example,
DRA submission id ‘example-0001’: -a example -i 0001
BioProject ‘PRJDB7252’ : -p PRJDB7252
‘path_to_excel_directory’: full path of the directory which contains the excel.
sudo docker run -v /path_to_excel_directory:/data -w /data excel2xml excel2xml_dra -a example -i 0001 -p PRJDB7252 example/example-0001_dra_metadata.xlsx
Three XMLs are generated from the excel.
example-0001_dra_Submission.xml
example-0001_dra_Experiment.xml
example-0001_dra_Run.xml
When an Analysis sheet is filled, an Analysis XML is generated.
example-0001_dra_Analysis.xml
Validate the XMLs by specifying the submission ID. The XML files must be under the submission-excel2xml directory. The SRA xsd files have been downloaded to /opt/submission-excel2xml/ from pub in the container during the build.
sudo docker run -v /path_to_excel_directory:/data -w /data excel2xml validate_meta_dra -a example -i 0001
Please note that this validator only performs xsd validation and minimum checks.
The XMLs are fully validated in the DRA web XML registration process,
so the checked XMLs may be failed in the DRA submission system.
Generate Analysis XML only
To add Analysis object(s) to an existing Submission, you may enter an ‘Analysis’ sheet only and generate only an Analysis XML. Specify a center name by -c option.
Example
DRA submission id ‘example-0002’: -a example -i 0002
BioProject ‘PRJDB7252’ : -p PRJDB7252
Center name: National Institute of Genetics
singularity exec excel2xml.simg excel2xml_dra -a example -i 0002 -p PRJDB7252 -c "National Institute of Genetics" example/example-0002_dra_metadata.xlsx
An Analysis XML is generated from the excel.
example-0002_dra_Analysis.xml
Validation results
XML validation against SRA xsd
Metadata XMLs are validated against respective SRA xsd. Modify the XMLs according to the xsd validation messages.
XML content check
Submission
Error: Submission: Past hold date.
Set the future hold date.
Experiment and Run
Error: Run: #{run_alias} Paired library only has one file.
Include at least two sequence data files (for example, R1.fastq and R2.fastq) for paired library Experiment.
Object reference check
Error: Run to Experiment reference error.
Not all Experiments are referenced by Runs.
There is Run(s) not referencing Experiment.
There is Experiment(s) not referenced by Run.
Modify metadata to make all Runs reference all Experiments.
Same with JGA. Enter AGD metadata to the JGA excel “JGA_metadata.xlsx”.
Specify the AGD Submission ID (e.g. ASUB000001).
NIG SuperComputer
The singularity image is available at /lustre9/open/shared_data/software/submission-excel2xml/ in the NIG SuperComputer operated by Bioinformation and DDBJ Center, National Institute of Genetics. The SuperComputer user can readily generate XMLs from the metadata excel file and check the XMLs.
DRA
The user can create DRA metadata XMLs and transfer corresponding data files to the DRA file server (ftp-private.ddbj.nig.ac.jp) in the SuperComputer.
Generate Submission, Experiment and Run XMLs from the excel.
cp /lustre9/open/shared_data/software/submission-excel2xml/excel2xml.simg ~/
cd
singularity exec excel2xml.simg excel2xml -a example -i 0001 -p PRJDB7252 example/example-0001_dra_metadata.xlsx
Validate the XMLs.
singularity exec excel2xml.simg validate_meta_dra -a example -i 0001
JGA
TBD
AGD
TBD
開発環境構築
cd submission-excel2xml
bundle install
bundle exec submission-excel2xml download_xsd
bundle exec excel2xml_dra # or excel2xml_jga, etc.
Excel and container images for DRA/JGA/AGD metadata XML submissions
日本語
Bioinformation and DDBJ Center のデータベースに登録するためのメタデータ XML を生成、チェックするツール。
履歴
ダウンロード
submission-excel2xml レポジトリをダウンロードします。
イメージ構築
Singularity
Singularity イメージをダウンロード、もしくは、以下の手順でローカル環境で構築します。
Docker
Docker イメージを以下の手順でローカル環境で構築します。
DRA
エクセルにメタデータを記入
メタデータとデータファイルをエクセル metadata_dra.xlsx の ‘Submission’、’Experiment’、’Run’ と ‘Run-file’ シートに記入します。メタデータについてはウェブサイトと ‘Readme’ シートをご覧ください。 ‘example/example-0001_dra_metadata.xlsx’ が記入例になります。
Analysis (任意) を登録する場合は ‘Analysis’ シートに記入します。Analysis のみを新規登録することはできず、Run を持った Submission に登録します。 ‘example/example-0002_dra_metadata.xlsx’ が記入例になります。
XML 生成とチェック: Singularity
エクセルから Submission、Experiment と Run XML を生成します。 D-way アカウント ID、submission 番号と BioProject アクセッション番号を指定します。
例
エクセルから三つの XML が生成されます。
Analysis シートが記入されている場合は Analysis XML も生成されます。
Submission ID を指定して XML をチェックします。XML は submission-excel2xml ディレクトリ直下に配置されている必要があります。SRA xsd ファイルは build 中にコンテナー内の /opt/submission-excel2xml/ にダウンロードされています。
ここでは xsd に対するチェックと最低限のチェックが実施されます。 DRA の登録サイトではより詳細なチェックが実施されるため、パスした XML が登録過程でエラーになることがあります。
Analysis XML のみを生成
既存 Submission に Analysis を追加する場合、’Analysis’ シートのみを記入し、Analysis XML を生成します。XML 生成時に -c で center name を指定します。
例
エクセルから Analysis XML が生成されます。
XML 生成とチェック: Docker
エクセルから Submission、Experiment と Run XML を生成します。 D-way アカウント ID、submission 番号、BioProject アクセッション番号とエクセルを含むディレクトリのフルパスを指定します。
例
エクセルから三つの XML が生成されます。
Analysis シートが記入されている場合は Analysis XML も生成されます。
Submission ID を指定して XML をチェックします。XML は submission-excel2xml ディレクトリ直下に配置されている必要があります。SRA xsd ファイルは build 中にコンテナー内の /opt/submission-excel2xml/ にダウンロードされています。
ここでは xsd に対するチェックと最低限のチェックが実施されます。 DRA の登録サイトではより詳細なチェックが実施されるため、パスした XML が登録過程でエラーになることがあります。
Analysis XML のみを生成
既存 Submission に Analysis を追加する場合、’Analysis’ シートのみを記入し、Analysis XML を生成します。XML 生成時に -c で center name を指定します。
例
エクセルから Analysis XML が生成されます。
チェック
SRA xsd に対する XML チェック
XML の内容チェック
Submission
Experiment と Run
オブジェクトの参照関係チェック
メタデータモデルは DRA Handbook を参照してください。
DRA ウェブ画面から XML を登録する
メタデータ XML を登録する前に登録ディレクトリに配列データファイルをアップロードします。D-way にログイン後、Submission、Experiment と Run XML を DRA 登録ページででアップロード します。通常5分以内に登録が完了します。
Github や XML 生成方法が分からない場合
DRA メタデータエクセル をダウンロード、内容を英語で記入し、メール (trace@ddbj.nig.ac.jp) 添付で DRA チームにお送りください。
JGA
エクセルにメタデータを記入
メタデータとデータファイルをエクセル JGA_metadata.xlsx の ‘Submission’、’Study’、’Sample’、’Experiment’、’Data’、’Analysis’ (該当する場合)、’Dataset’ と ‘File’ シートに記入します。 メタデータについてはウェブサイトと ‘Readme’ シートをご覧ください。 ‘example/JSUB999999_jga_metadata.xlsx’ が記入例になります。
XML 生成とチェック: Singularity
エクセルから Submission、Study、Sample、Experiment、Data、Analysis (該当する場合)、Dataset XML を生成します。 JGA submission id を指定します。
例
エクセルから七つの XML が生成されます。
Sample 追加属性の記載方法が v2.6 以前の形式 (例 age:37; collection_date:2015-03-05) の場合、-r オプションを付けて XML を生成します。
JGA Submission ID を指定して XML をチェックします。XML は submission-excel2xml ディレクトリ直下に配置されている必要があります。JGA xsd ファイルは build 中にコンテナー内の /opt/submission-excel2xml/ にダウンロードされています。
ここでは xsd に対するチェックと最低限のチェックが実施されます。
XML 生成とチェック: Docker
エクセルから Submission、Study、Sample、Experiment、Data、Analysis (該当する場合)、Dataset XML を生成します。 JGA submission id を指定します。
例
エクセルから七つの XML が生成されます。
Sample 追加属性の記載方法が v2.6 以前の形式 (例 age:37; collection_date:2015-03-05) の場合、-r オプションを付けて XML を生成します。
Submission ID を指定して XML をチェックします。XML は submission-excel2xml ディレクトリ直下に配置されている必要があります。JGA xsd ファイルは build 中にコンテナー内の /opt/submission-excel2xml/ にダウンロードされています。
ここでは xsd に対するチェックと最低限のチェックが実施されます。
チェック
JGA xsd に対する XML チェック
XML の内容チェック
オブジェクトの参照関係チェック
以下のオブジェクト間の関係がチェックされます。
XML を登録する
XML を JGA データ受付サーバにアップロードします。アップロードする前に NBDC 事業推進部 で提供申請が承認されている必要があります。
Github や XML 生成方法が分からない場合
JGA メタデータエクセルをダウンロード、内容を英語で記入し、メール (jga@ddbj.nig.ac.jp) 添付で JGA チームにお送りください。
AGD
JGA と同様の手順になります。AGD のメタデータも JGA_metadata.xlsx に記入します。 Submission ID には AGD Submission ID (例 ASUB000001) を指定します。
NIG スパコンでの実施方法
国立遺伝学研究所 生命情報・DDBJ センターが運営する NIG スパコン では
/lustre9/open/shared_data/software/submission-excel2xml/に Singularity イメージが設置されています。ダウンロードや build 作業をすることなく、メタデータエクセルファイルがあれば XML 生成や XML のチェックを実施することができます。DRA
多件数のデータファイルがスパコンにある場合、メタデータ XML 作成、及び、データファイルの DRA ファイル受付サーバ (ftp-private.ddbj.nig.ac.jp) への転送をスパコン上で完結することができます。
エクセルから Submission、Experiment と Run XML を生成。
XML のチェック。
JGA
TBD
AGD
TBD
English
These files are Excel, container images and tools for generation and validation of metadata XML files for databases of Bioinformation and DDBJ Center.
History
Download
Download the DDBJ submission-excel2xml repository.
Image construction
Singularity
Download the Singularity image or build the Singularity image as follows.
Docker
Build the Docker image as follows.
DRA
Enter metadata in the excel
Enter metadata and data files in the ‘Submission’, ‘Experiment’, ‘Run’ and ‘Run-file’ sheets of the excel “metadata_dra.xlsx”. See our website for metadata and ‘Readme’ sheet of the excel for details. See ‘example-0001_dra_metadata.xlsx’ for example.
To submit Analysis (optional) object(s), enter an ‘Analysis’ sheet. Analysis-only submission is not acceptable. Submit Analysis to a Submission having Run(s). See ‘example/example-0002_dra_metadata.xlsx’ for example.
Generate XMLs: Singularity
Generate Submission, Experiment and Run XMLs from the excel. Specify the D-way account ID, submission number and BioProject accession.
For example,
Three XMLs are generated from the excel.
When an Analysis sheet is filled, an Analysis XML is generated.
Validate the XMLs by specifying the submission ID. The XML files must be under the submission-excel2xml directory. The SRA xsd files have been downloaded to /opt/submission-excel2xml/ from pub in the container during the build.
Please note that this validator only performs xsd validation and minimum checks. The XMLs are fully validated in the DRA web XML registration process, so the checked XMLs may be failed in the DRA submission system.
Generate Analysis XML only
To add Analysis object(s) to an existing Submission, you may enter an ‘Analysis’ sheet only and generate only an Analysis XML. Specify a center name by -c option.
Example
An Analysis XML is generated from the excel.
Generate XMLs: Docker
Generate Submission, Experiment and Run XMLs from the excel. Specify the D-way account ID, submission number, BioProject accession and full path of the directory which contains the excel.
For example,
Three XMLs are generated from the excel.
When an Analysis sheet is filled, an Analysis XML is generated.
Validate the XMLs by specifying the submission ID. The XML files must be under the submission-excel2xml directory. The SRA xsd files have been downloaded to /opt/submission-excel2xml/ from pub in the container during the build.
Please note that this validator only performs xsd validation and minimum checks. The XMLs are fully validated in the DRA web XML registration process, so the checked XMLs may be failed in the DRA submission system.
Generate Analysis XML only
To add Analysis object(s) to an existing Submission, you may enter an ‘Analysis’ sheet only and generate only an Analysis XML. Specify a center name by -c option.
Example
An Analysis XML is generated from the excel.
Validation results
XML validation against SRA xsd
XML content check
Submission
Experiment and Run
Object reference check
See the DRA Handbook for metadata model.
Submit XMLs in the DRA web interface
Before submitting the metadata XMLs, upload sequence data files to the submission directory. After logging in the D-way, upload the Submission, Experiment and Run XMLs in the XML upload area of the DRA submission. Your web browser may time out, however, submission processes are ongoing on the backend. Please close the browser and leave it for a while. The XML submission will be registered.
When Github and XML generation are not clear for you
Download DRA metadata Excel, fill in and send it to the DRA team by Email (trace@ddbj.nig.ac.jp).
JGA
TBD
AGD
Same with JGA. Enter AGD metadata to the JGA excel “JGA_metadata.xlsx”. Specify the AGD Submission ID (e.g. ASUB000001).
NIG SuperComputer
The singularity image is available at
/lustre9/open/shared_data/software/submission-excel2xml/in the NIG SuperComputer operated by Bioinformation and DDBJ Center, National Institute of Genetics. The SuperComputer user can readily generate XMLs from the metadata excel file and check the XMLs.DRA
The user can create DRA metadata XMLs and transfer corresponding data files to the DRA file server (ftp-private.ddbj.nig.ac.jp) in the SuperComputer.
Generate Submission, Experiment and Run XMLs from the excel.
Validate the XMLs.
JGA
TBD
AGD
TBD
開発環境構築