') ?>
・FASTQ形式
FASTQ形式は、SBS(Sequencing By Synthesis)法を用いたDNAシーケンサ−などで広く用いられているデータフォーマットです。ショートリード(50〜300塩基対)のシーケンス配列の記述に向いており、テキストファイル形式なのでテキストエディタで参照することが可能です。
・SAM/BAM形式
SAM/BAM形式は、マッピング/アライメント後のデータ形式で、Sequence Alignment/Map,Binary Alinment/Map formatの頭文字をとったものです。SAMファイルはテキストファイル形式のためテキストエディタで参照することができます。ただし、FASTQファイルの数倍のサイズになり、データサイズが過大になる場合が多いため、一般的にはSAMファイルを圧縮してバイナリ形式にしたBAMファイルが用いられます。SAMファイルとBAMファイルが記載する情報は全く同じであり、互いに変換可能です。SAMファイルにはマッピングされたポジションだけではなく、SAMファイルが生成されたコメントの情報、リファレンス配列の情報などがヘッダーに記録され、個々のリードのマッピング情報として、ペアリードの状況やクリッピング・ギャップアライメントの情報が含まれています。
▽がんゲノム解析 FASTQ形式、SAM/BAM形式 のキーワード
▽次の記事、前の記事
サイトについて
このサイトは「健康診断・血液検査MAP」の新規記事を掲載しています。 過去の記事はこちらから閲覧できます。当サイトのRSS
新着アイテム
ジャンル
Copyright (C) 2008
by 健康診断・血液検査MAP2