Срок действия документа ограничен 1 сентября 2030 года.

Приложение N 2

к Положению о государственной

информационной системе

в области генетической

информации "Национальная база

генетической информации"

ФОРМАТЫ

ПРЕДОСТАВЛЕНИЯ ИНФОРМАЦИИ В ГОСУДАРСТВЕННУЮ ИНФОРМАЦИОННУЮ

СИСТЕМУ В ОБЛАСТИ ГЕНЕТИЧЕСКОЙ ИНФОРМАЦИИ "НАЦИОНАЛЬНАЯ

БАЗА ГЕНЕТИЧЕСКОЙ ИНФОРМАЦИИ"

Входная информация

Формат предоставления информации <*>

Файлы генетических данных, в том числе:

данные секвенирования

SFF, HDF5, FAST5, FASTQ (.fastq, .fq), SAM (Sequence Alignment/Map), BAM, CRAM

геномные сборки и нуклеотидные последовательности

FASTA (.fnt, .fna, .faa, .fa, .fas, .fasta)

аннотированные последовательности

GFF2 (General Feature Format version 2), GTF (Gene Transfer Format), GFF3 (General Feature Format version 3)

данные о структурных вариациях в геноме

VCF (Variant Call Format)

данные геномных треков

BED (Browser Extensible Data), bedGraph, WIG (Wiggle Track Format), bigwig (bigWig Track Format), bigBed (bigBed Track Format)

данные трехмерной структуры молекул

PDB (Protein Data Bank), PDBx/mmCIF

Файлы для массовой загрузки генетических данных

csv, tsv

--------------------------------

<*> Указанные форматы являются общепринятыми и поддерживаются наиболее распространенным оборудованием или свободно распространяемыми инструментами.