ヒト全ゲノム・シーケンシングを実行すると、膨大な量のデータが得られます。それに伴い、これらデータを管理し保存し解析するための問題が新たに発生します。そのような問題に対処し、小規模や大規模なゲノム・シーケンシングプロジェクトの管理基盤を提供しようと、私たちはゲノミクス・データ処理施設を構築しました。私たちが独自に開発した再構成ソフトウェアは、先進的なデータ解析アルゴリズムや統計モデリング技術を採用しています。このソフトウエアを用いて、約20億種類の70塩基読み取り配列 (reads) から、ヒト全ゲノムの90%以上を正確に再構成することが可能です。ゲノム再構成が終了すると、解析ソフトウェアを用いて、それぞれのゲノムに固有な相違点または変異を同定しアノテーションを加えます。検出される変異には、SNPsやindels,ブロック置換 (block substitutions),コピー数変異 (CNVs: Copy Number Variants),構造変異 (SVs: Structural Variants) が含まれています。
私たちの解析ツールとデータ管理ソフトウェアを活用すれば、皆様のコンピュータ投資コストを劇的に削減することが可能です。私たちが皆様にお届けするのは、再構成とアノテーションが終了したゲノム配列データです。複数のフォーマットへ変換できるため、データ共有や比較解析も容易です。今までの研究では、シーケンシング試薬のコストが制限要因であり、いかに削減するかが課題でした。これからは、複雑なゲノムデータを解析し管理する費用が、ヒト全ゲノム解析に対する重大な制限要因となるでしょう。
Complete Genomics