曙海教學優(yōu)勢
本課程,秉承二十一年積累的教學品質,以項目實現(xiàn)為導向,面向企事業(yè)項目實際需要,老師將會與您分享設計的全流程以及工具的綜合使用經(jīng)驗、技巧。課程可定制,線上/線下/上門皆可,熱線:4008699035。
曙海培訓的課程培養(yǎng)了大批受企業(yè)歡迎的工程師。大批企業(yè)和曙海
建立了良好的合作關系,合作企業(yè)30萬+。曙海培訓的課程在業(yè)內有著響亮的知名度。
培訓大綱:
一、Perl的基本語法
1.變量:標量,數(shù)組(一維數(shù)組和二維數(shù)組)和哈希
2.數(shù)據(jù)結構:循環(huán),條件
3.常用函數(shù)
二、文件與目錄操作
1.文件的讀入與輸出
2.文件測試
3.目錄操作
三、正則表達式
1.匹配操作符及修飾符
2.替換操作符及修飾符
3.轉換操作符
四、子函數(shù)、包和模塊
1.子函數(shù)
2.包
3.模塊
五、Bioperl簡介和常用的模塊
1.簡介
2. Bio::SeqIO
3.其他模塊簡介
六、在NGS中應用范例
主要通過實例講解文件的輸入與輸出,常用生物學格式的讀取與操作;文件的過濾與合并等。具體實例如下:
1.根據(jù)ID提取FASTA序列(數(shù)據(jù)篩選)
2.根據(jù)位置提取FASTA序列(函數(shù),包括反向互補等的實現(xiàn))
3.統(tǒng)計FASTA序列GC含量(哈希解決統(tǒng)計數(shù)目類問題)
4.統(tǒng)計大于指定長度的FASTA序列(數(shù)據(jù)篩選)
5.提取GFF3文件中多外顯子基因的注釋信息(二維數(shù)組與哈希)
6.FASTQ序列按照指定的Read數(shù)目進行切割(文件分割)
7.FASTA序列切割成一條序列一個文件,并用序列ID進行命名(文件操作)
8.提取有完整編碼框的(有起始密碼子和終止密碼子)CDS序列(正則)
9. GFF3與GTF互相轉換(格式轉換)
10.將DNA翻譯為蛋白質序列(正則)
11.提取指定基因的GFF3注釋信息(篩選)
12.將每一個樣本的FPKM值合并到一個文件中(文件合并)
13.根據(jù)Identity和Coverage篩選BLAST結果(過濾)
14.坐標轉換(數(shù)據(jù)轉換)
15.提取指定位置的基因注釋信息(提?。?br/>
七、CPAN簡介
?