咱們在之前說到過bam文件還有55G巨細,這樣的文件,在許多時分都不便利檢查和搬運。而有些時分,咱們只需求咱們的測序數據在全基因組的測序深度這一個值,並不需求詳細某條reads的鹼基序列,鹼基質量值。這樣就能夠把bam文件緊縮為bw格局啦!需求了解一些文件格局:wig、bigWig和bedgraph文件詳解。
bam文件格局
我就不多說了,便是sam的二進位緊縮版別,前面咱們也花費了很多的翰墨來描繪它,而
bw格局
全稱是
bigwig格局
,便是規則了全基因組數據的每個坐標區間的測序深度,規範釋義如下:
這3種文件格局都是UCSC規則的,所以它供給了系列東西進行相互轉化,
我這兒用deeptools這個軟體的bamCoverage東西來完結這個使命,指令如下:
bamCoverage -b P_jmzeng.final.bam -o P_jmzeng.final.bw
bamCoverage -b P_jmzeng.filter.rmdup.realgn.bam -o P_jmzeng.filter.rmdup.realgn.bw
關於這個軟體的用法及裝置辦法,見我博客:deeptools輔佐CHIP-seq數據剖析-可視化(http://www.bio-info-trainee.com/2136.html 仿製該地址到瀏覽器翻開)
在IGV裡邊翻開bam和bw文件,就知道這個軟體究竟做了什麼。
首要對bw文件來說,能夠在全基因組標準下看看測序深度的全體狀況,這樣能夠很明顯的看到某些染色體的某些區域是不是嚴峻的測序深度過低或許過高(我箭頭所指的區域是有問題的,測序深度特別高)。而對bam文件,需求zoom in到必定程度才幹看到比對的reads狀況。
經過bw的文件來定位反常區域,再zoom in去看詳細是怎麼回事,十分好用!能夠看到這些區域測序深度高達8萬!!!
文:Jimmy、吃瓜大眾
圖文修改:吃瓜大眾

Pin It