GFFファイルは少し複雑な構造をしていますが、このアノテーションを利用するとfastaファイルから任意の配列を抜き出すことができます。 ここでは、試しにAGI(Arabidopsis Genome Initiative)コードのリストを元に、CDSと,full length genomicと,3kb-upstreamの配列を ...
生物情報の解析をしていると、NCBIで検索した遺伝子群の配列(mRNAやタンパク質)を一括で取得したいと思う場面がよくあります。 特に、「Send to → File」機能で得られる gene_result.txt のようなタブ区切りファイルから、自動的に配列を収集できたら便利です ...