国产6699视频在线观看_女人爽到喷水的视频大全_亚洲欧美日韩国产视频亚洲欧美综合日韩久久_中文字幕无码久久东京热_av电影中文一区

 
首頁 > 銀行 >
 
 

環(huán)球今頭條!五大生信技能研究分析,生命科學熱度來襲!深度學習基因組學+機器學習轉錄組學與表觀

2023-06-25 20:22:35  來源:嗶哩嗶哩

隨著高通量生物技術的發(fā)展,已經開發(fā)了多種組學技術來表征不同但互補的生物信息,包括基因組學、單細胞、表觀基因組學、轉錄組學、微生物組學和代謝組學等。

近年來,癌癥相關多組學技術的快速發(fā)展 一直是人工智能生物學分析探索新型抗癌靶點的最重要因素之一。下圖將這些技術分為五個方面:表觀遺傳學、基因組學、蛋白質組學、代謝組學和多組學整合分析。


(資料圖片)

人工智能整合多組學數據(例如表觀遺傳學、基因組學、蛋白質組學和代謝組學)以識別癌癥治療靶點。

最近的人工智能技術已經從“淺層”學習架構發(fā)展到“深度”學習架構。作為人工智能的一個重要分支,機器學習(ML)可以自動學習捕捉復雜的模式,并根據數據做出智能決策。ML在癌癥研究和臨床腫瘤學中有著非常廣泛的應用。特別是,在多組學數據快速增長的推動下,屬于ML子領域的基于深度學習(DL)的方法已成為生物醫(yī)學數據分析的強大工具

專題內容

專題一、深度學習基因組學

專題二、機器學習轉錄組學與表觀組學

專題三、深度學習單細胞

專題四、機器學習代謝組學

專題五、機器學習微生物組學

學習目標

【深度學習基因組學】通過基礎入門+應用案例實操演練的方式,從初學及應用研究的角度出發(fā),帶大家實戰(zhàn)演練多種深度學習模型在基因組學分析中的各種應用,深入剖析多篇高分文章代碼演示及文章復現,通過對這些深度學習在基因組學中的應用案例進行深度講解和實操,能夠掌握深度學習分析高維基因組學、轉錄組學、蛋白組學等多組學數據流程,系統學習深度學習及基因組學理論知識及熟悉軟件代碼實操,熟練掌握這些前沿的分析工具的使用以及研究創(chuàng)新深度學習算法解決生物學及臨床疾病問題與需求。

【學習轉錄組學與表觀組學】在Linux和R環(huán)境中進行數據分析的技能。如何處理和分析轉錄組和表觀組數據,并深入了解這兩個領域的關鍵概念和最新發(fā)展。內容包括Linux操作系統的基礎知識和常用命令行技巧,R編程語言的應用,轉錄組數據的預處理和差異表達分析,表觀組數據的分析方法,以及綜合應用和實際項目實踐。

【深度學習單細胞】通過高分文獻和代碼實操,解析單細胞深度的套路

【機器學習代謝組學】熟悉代謝組學和機器學習相關硬件和軟件;熟悉代謝組學從樣本處理到數據分析的全流程;能復現至少1篇CNS或子刊級別的代謝組學文章圖片。

【機器學習微生物組學】機器學習在微生物組數據分析流程,能夠快速運用到自己的科研項目上。

詳細內容

一、深度學習基因組學

第一天

理論部分

深度學習算法介紹

1.有監(jiān)督學習的神經網絡算法

1.1全連接深度神經網絡DNN在基因組學中的應用舉例

1.2卷積神經網絡CNN在基因組學中的應用舉例

1.3循環(huán)神經網絡RNN在基因組學中的應用舉例

1.4圖卷積神經網絡GCN在基因組學中的應用舉例

2.無監(jiān)督的神經網絡算法

2.1自動編碼器AE在基因組學中的應用舉例

2.2生成對抗網絡GAN在基因組學中的應用舉例

實操內容

1.Linux操作系統

1.1常用的Linux命令

1.2 Vim編輯器

1.3基因組數據文件管理, 修改文件權限

1.4查看探索基因組區(qū)域

2.Python語言基礎

2.1.Python包安裝和環(huán)境搭建

2.2.常見的數據結構和數據類型

第二天

理論部分

基因組學基礎

1.基因組數據庫

2.表觀基因組

3.轉錄基因組

4.蛋白質組

5.功能基因組

實操內容

基因組常用深度學習框架

1.安裝并介紹深度學習工具包tensorflow, keras,pytorch

2.在工具包中識別深度學習模型要素

2.1.數據表示

2.2.張量運算

2.3.神經網絡中的“層”

2.4.由層構成的模型

2.5.損失函數與優(yōu)化器

2.6.數據集分割

2.7.過擬合與欠擬合

3.基因組數據處理

3.1安裝并使用keras_dna處理各種基因序列數據如BED、 GFF、GTF、BIGWIG、BEDGRAPH、WG等

3.2使用keras_dna設計深度學習模型

3.3使用keras_dna分割訓練集、測試集

3.4使用keras_dna選取特定染色體的基因序列等

4.深度神經網絡DNN在識別基序特征中應用

4.1實現單層單過濾器DNN識別基序

4.2實現多層單過濾器DNN識別基序

4.3實現多層多過濾器DNN識別基序

第三天

理論部分

卷積神經網絡CNN在基因調控預測中的應用

1.Chip-Seq中識別基序特征G4,如DeepG4

2.Chip-Seq中預測DNA甲基化,DeepSEA

3.Chip-Seq中預測轉錄調控因子結合,DeepSEA

4.DNase-seq中預測染色體親和性,Basset

5.DNase-seq中預測基因表達eQTL,Enformer

實操內容

復現卷積神經網絡CNN識別基序特征DeepG4、非編碼基因突變DeepSEA,預測染色體親和性Basset,基因表達eQTL

1.復現DeepG4從Chip-Seq中識別G4特征

2.安裝selene_sdk,復現DeepSEA從Chip-Seq中預測DNA甲基化,非編碼基因突變

3.復現Basset,從Chip-Seq中預測染色體親和性

4.復現Enformer,從Chip-Seq中預測基因表達eQTL

第四天

理論部分

深度學習在識別拷貝數變異DeepCNV、調控因子DeepFactor上的應用

1.SNP微陣列中預測拷貝數變異CNV,DeepCNV

2.RNA-Seq中預測premiRNA,dnnMiRPre

3.從蛋白序列中預測調控因子蛋白質,DeepFactor

實操內容

1.復現DeepCNV利用SNP微陣列聯合圖像分析識別拷貝數變異

2.復現循環(huán)神經網絡RNN工具 dnnMiRPre,從RNA-Seq中預測premiRNA

3.復現DeepFactor,從蛋白序列中識別轉錄調控因子蛋白質

第五天

理論部分

深度學習在識別及疾病表型及生物標志物上的應用

1.從基因表達數據中識別乳腺癌分型的深度學習工具DeepType

2.從高維多組學數據中識別疾病表型,XOmiVAE

3.基因序列及蛋白質相互作用網絡中識別關鍵基因的深度學習工具DeepHE

實操內容

1.復現DeepType,從METABRIC乳腺癌數據中區(qū)分乳腺癌亞型

2.復現XOmiVAE,從TCGA多維數據庫中識別乳腺癌亞型

3.復現DeepHE利用基因序列及蛋白質相互作用網絡識別關鍵基因

第六天

理論部分

深度學習在預測藥物反應機制上的應用

1.聯合腫瘤基因標記及藥物分子結構預測藥物反應機制的深度學習工具SWnet

實操內容

1.預處理藥物分子結構信息

2.計算藥物相似性

3.在不同數據集上構建self-attention SWnet

4.評估self-attention SWnet

5.構建多任務的SWnet

6.構建單層SWnet

7.構建帶權值層的SWnet

案例圖片:

二、機器學習轉錄組學與表觀組學

第一天

理論部分

高通量測序原理

高通量測序基礎

測序方法及數據

二代測序數據分析流程

實操內容

R語言基礎

R(4.1.3)和Rstudio的安裝

R包安裝和環(huán)境搭建

數據結構和數據類型

R語言基本函數

數據下

數據讀入與輸出

第二天

理論部分

多組學基礎

常用生物組學實驗與分析方法

常用組學數據庫介紹

批量處理組學數據

生物功能分析

基于轉錄組學的差異基因篩選,疾病預測

組學數據可視化

實操內容

Linux操作系統

Linux操作系統的安裝與設置

網絡配置與服務進程管理

Linux的遠程登錄管理

常用的Linux命令

在Linux下獲取基因數據

利用Linux探索基因組區(qū)域

Shell script與Vim編輯器

基因組文件下載與上傳

Linux權限管理

文件的身份

修改文件的所有者和所屬組

修改文件權限

第三天

理論部分

介紹轉錄組學的基本概念和研究流程

RNA-seq數據的預處理和質量控制

序列比對和對齊評估

基因表達量估計和差異表達分析

實操內容

轉錄組測序數據質量控制

轉錄組數據比對

RNA-seq數據原始定量

主成分分析

原始定量結果差異分析

差異結果篩選及可視化

GO和KEGG通路富集分析

GSEA基因集富集分析

第四天

理論部分

表觀遺傳學的基本概念和技術介紹

DNA甲基化和組蛋白修飾的分析方法

表觀組數據的預處理和質量控制

差異甲基化和差異修飾分析

甲基化和修飾的功能注釋和富集分析

甲基化數據的整合分析和基因調控網絡構建

表觀組數據的可視化方法和工具

介紹其他表觀組學技術(如染色質構象捕獲)

實操內容

測序數據質量控制和檢查

數據比對和多匹配問題

計算結合峰位置

IGV中組學結果可視化

差異peaks分析

結合程度矩陣計算

富集熱圖和曲線圖繪制

第五天

理論部分

機器學習概述

線性模型

決策樹

支持向量機

集成學習

模型選擇與性能優(yōu)化

實操內容

決策樹算法實現

隨機森林算法實現

支持向量機(SVM)算法實現

樸素貝葉斯算法實現

Xgboost算法實現

聚類算法實現

DBSCAN算法實現

層次聚類算法實現

第六天

理論部分

基因功能注釋和富集分析

WGCNA(Weighted Gene Co-expression Network Analysis)網絡分析

轉錄因子分析和調控網絡構建

轉錄組數據的可視化方法和工具

轉錄水平預測蛋白翻譯水平

實操內容

創(chuàng)建Seurat對象

數據質控

測序深度差異及標準化

單細胞數據降維

批次效應去除

數據整合

亞群注釋

GSVA通路活性分析

單細胞富集分析

案例圖片:

三、深度學習單細胞

第一天

理論內容

1.單細胞組學研究簡介(包含單細胞轉錄組測序技術進展及其原 理)

2.單細胞主要數據庫介紹

2.1 CellMarker

2.2 CancerSEA

2.3 Tabula Muris

2.4 TISCH

3.單細組學在腫瘤、發(fā)育、免疫及其它領域的研究思路的介紹 4.單細胞測序分析在科研中的應

4.1 與 bulk 測序相較的優(yōu)勢

4.2 發(fā)現新細胞類型

4.3 識別細胞亞群轉錄差異

4.4 細胞互作預測

實操內容

1.R 語基礎

1.1 文件讀入

1.2 數值、字符串、向量

1.3 列表 矩陣 數據框

2.數據清洗

2.1 缺失值處理

2.2 數據篩選

2.3 數據合并

2.4 數據匹配

2.5 分類變量

2.6 條件函數

2.7 字符串的切分

2.8 重復值處理

3.R 語言基礎繪圖

3.1 箱式圖

3.2 小提琴圖

3.3 熱圖

第二天

理論內容

1.Seurat 對象

2.細胞質控

2.1 nFeature

2.2 nCount

2.3 percent.mt

3.特征選擇

3.1 高變基因

3.2 FindVariableFeatures

4.降維聚類

4.1 tsne

4.2 umap

4.3 線性降維 PCA

實操內容

1.數據讀入

1.1 10x 數據讀入

1.2 csv 數據讀入

1.3 txt 數據讀入

2. 多數據的整合

2.1 直接法

2.2 harmony 包

3.質控

4.歸一化

5.聚類

6.tSNE/UMAP 降維

7.細胞類型注釋

7.1 自動注釋法

7.2 marker 人工注釋法

8.細胞比例計算

9.基因集打分

9.1 ssGSEA

9.2 AUCel

10.單細胞 GSVA 富集分析

11.單細胞 GSEA 富集分析

第三天

理論內容

1.IF6+文獻解讀

2.單細胞常見圖表解讀

2.1 降維聚類圖

2.2 marker 氣泡圖/小提琴圖

2.3 細胞通訊圖

3.富集分析

3.1 基因 ID

3.2 弦表圖

3.3 和弦圖

4.細胞通訊基本原理

5.反卷積

5.1 系數表

5.2 bulk 轉錄組矩陣

實操內容(以 IF6+文獻文獻為例)

1.單細胞差異基因分析并繪制火山圖

2.GO/KEGG 富集分析并繪制氣泡圖、柱狀圖、弦表圖 3.iTALK 分析不同細胞的通訊情況

4.Cibersortx

4.1 單細胞數據處理

4.2 bulk 數據

4.3 推測 bulk 數據新細胞類型的比例)

第四天

理論內容

1.深度學習入門

1.1 基本概念

1.2 常用方法

1.3 科研應用

2.LASSO 的原理和作用

2.1 正則化

2.2 懲罰參數

2.3 變量收縮

3.Randomforest 的原理和作用

3.1 Bagging 思想

3.2 OOB error

3.3 Bagging 框架參數(n_estimators、oob_score、criterion)

3.4 決策樹參數

4.SVM 的原理和作用

4.1 最大間隔超平面

4.2 支持向量

4.3 SVM 最化問題

5.ROC 曲線的原理和作用

5.1 二分類

5.2 true negative;false negative

5.3 true positive;true negative

實操內容

1.LASSO 的應用

1.1 lambda 選擇

1.2 特征選擇

2.Randomforest 的應用

2.1 error 圖

2.2 氣泡圖

2.3 棒棒糖圖

3.SVM 的應用

4.ROC 曲線的應用

第五天

理論內容

1.深度學習結合單細胞的應用

1.1 細胞亞群

1.2 特征基因篩選

1.3 基因后續(xù)驗證的科研思路

2.解析深度學習結合單細胞的文獻(IF8+)

3.LASSO 與單細胞聯合

4.Randomforest 與單細胞聯合

5. SVM-RFE 與單細胞聯合

5.1 支持向量機

5.2 遞歸消除

6.人工神經網絡 ANN 與單細胞聯合

6.1 人工和生物神經網絡之間的相似性

6.2 神經元模型

6.3 神經網絡模型

6.4 前饋神經網絡

6.5 反饋神經網絡

6.6 M-P 模型

6.7 neuralnet

實操內容 (IF8+文獻為例)

1.單細胞分析(包括數據讀取、聚類降維、細胞注釋等)

2.LASSO 篩選特征基因并構建預后模型

3.生存曲線檢驗預后模型的效果

4.cox 森林圖驗證風險評分是否有臨床意義

5.列線表

6.免疫治療 TIDE 與風險評分的分析

7.免疫浸潤分析風險評分與免疫微環(huán)境的關系

8.neuralnet 的基礎案例實操

9.ANN 的單細胞特征基因篩

四、機器學習代謝組學

第一天

A1 代謝物及代謝組學的發(fā)展與應用

(1) 代謝生理功能;

(2) 代謝疾?。?/p>

(3) 非靶向與靶向代謝組學;

(4) 空間代謝組學與質譜成像(MSI);

(5) 代謝流與機制研究;

(6) 代謝組學與藥物和生物標志物。

A2 代謝組學實驗流程簡介

A3 色譜、質譜硬件原理

(1) 色譜分析原理;

(2) 色譜的氣相、液相和固相;

(3) 色譜儀和色譜柱的選擇;

(4) 質譜分析原理及動畫演示;

(5) 正、負離子電離模式;

(6) 色譜質譜聯用技術;

(7) LC-MS 的液相系統

A4 代謝通路及代謝數據庫

(1) 幾種經典代謝通路簡介;

(2) 能量代謝通路;

(3) 三大常見代謝物庫:HMDB、METLIN 和 KEGG;

(4) 代謝組學原始數據庫:Metabolomics Workbench 和Metabolights.

第二天

B1 代謝物樣本處理與抽提

(1)組織、血液和體液樣本的提取流程與注意事項;

(2)用 ACN 抽提代謝物的流程與注意事項;

(3)樣本及代謝物的運輸與保存問題;

B2 LC-MS數據質控與搜庫

(1)LC-MS 實驗過程中 QC 樣本的設置方法;

(2)LC-MS 上機過程的數據質控監(jiān)測和分析;

(3)XCMS 軟件數據轉換與提峰;

B3 R軟件基礎

(1)R 和 Rstudio 的安裝;

(2)Rstudio 的界面配置;

(3)R 的基本數據結構和語法;

(4)下載與加載包;

(5)函數調用和 debug;

B4 ggplot2

(1)安裝并使用 ggplot2

(2)ggplot2 的畫圖哲學;

(3)ggplot2 的配色系統;

(4)ggplot2 畫組合圖和火山圖;

第三天

機器學習

C1無監(jiān)督式機器學習在代謝組學數據處理中的應用

(1)大數據處理中的降維;

(2)PCA 分析作圖;

(3)三種常見的聚類分析:K-means、層次分析與 SOM

(4)熱圖和 hcluster 圖的 R 語言實現;

C2一組代謝組學數據的降維與聚類分析的 R 演練

(1)數據解析;

(2)演練與操作;

C3有監(jiān)督式機器學習在代謝組學數據處理中的應用

(1)數據用 PCA 降維處理后仍然無法找到差異怎么辦?

(2)PLS-DA 找出最可能影響差異的代謝物;

(3)VIP score 和 coef 的意義及選擇;

(4)分類算法:支持向量機,隨機森林

C4一組代謝組學數據的分類算法實現的 R 演練

(1)數據解讀;

(2)演練與操作;

第四天

D1 代謝組學數據清洗與 R 語言進階

(1)代謝組學中的 t、fold-change 和響應值;

(2)數據清洗流程;

(3)R 語言 tidyverse

(4)R 語言正則表達式;

(5)代謝組學數據過濾;

(6)代謝組學數據 Scaling 原理與 R 實現;

(7)代謝組學數據的 Normalization;

(8)代謝組學數據清洗演練;

D2在線代謝組分析網頁 Metaboanalyst 操作

(1)用 R 將數據清洗成網頁需要的格式;

(2)獨立組、配對組和多組的數據格式問題;

(3)Metaboanalyst 的 pipeline 和注意事項;

(4)Metaboanalyst 的結果查看和導出;

(5)Metaboanalyst 的數據編輯;

(6)全流程演練與操作

第五天

E1機器學習與代謝組學頂刊解讀(2-3 篇);

(1)Nature Communication 一篇代謝組學小鼠腦組織樣本 database 類型的文獻;

(2)Cell 一篇代謝組學患者血液樣本的機器學習與疾病判斷的文獻;

(3)1-2 篇代謝組學與轉錄組學和蛋白組學結合的文獻。

E2 文獻數據分析部分復現(1 篇)

(1)文獻深度解讀;

(2)實操:從原始數據下載到圖片復現;

(3) 學員實操。

案例圖片:

五、機器學習微生物組學

第一天

機器學習及微生物學簡介

1. 機器學習基本概念介紹

2. 常用機器學習模型介紹(GLM,BF,SVM,lasso,KNN等等)

3. 混淆矩陣

4. ROC曲線

5. 主成分分析(PCA)

6. 微生物學基本概念

7. 微生物學常用分析介紹

R語言簡介及實操

1.R語言概述

2.R軟件及R包安裝

3.R語言語法及數據類型

4.條件語句

5.循環(huán)

第二天

機器學習在微生物學中的應用案例分享

1.利用機器學習基于微生物組學數據預測宿主表

2.利用機器學習基于微生物組學數據預測疾病狀態(tài)

3.利用機器學習預測微生物風險

4.機器學習研究飲食對腸道微生物的影響

微生物學常用分析(實操)

1. 微生物豐度分析

2. α-diversity,β-diversity分析

3. 進化樹構建

4. 降維分析

5. 基于OTU的差異表達分析,熱圖,箱型圖繪制微生物biomarker鑒定

第三天(實操)

零代碼工具利用機器學習分析微生物組學數據

1. 加載數據及數據歸一化

2. 構建訓練模型(GLM, RF, SVM)

3. 模型參數優(yōu)化

4. 模型錯誤率曲線繪制

5. 混淆矩陣計算

6. 重要特征篩選

7. 模型驗證,ROC曲線繪制利用模型進行預測

第四天(實操)

利用機器學習基于微生物組學數據預測宿主表型(二分類變量以及連續(xù)變量)

1. 加載數據(三套數據)

2. 數據歸一化

3. OUT特征處理

4. 機器學習模型構建(RF, KNN, SVM, Lasso等9種機器學習方法)

5. 5倍交叉驗證

6. 繪制ROC 曲線,比較不同機器學習模型模型性能評估

第五天(實操)

利用機器學習預測微生物風險(多分類)

1.加載數據

2.機器學習模型構建(RF, gbm, SVM, LogitBoost等等)

3.10倍交叉驗證

4.模型性能評估

利用機器學習預測刺激前后腸道菌群變化

1.數據加載及預處理

2.α-diversity,β-diversity分析

3. RF模型構建(比較分別基于OUT,KO,phylum的模型效果)

4.10倍交叉驗證, 留一法驗證

5.特征篩選及重要特征可視化外部數據測試模型

案例圖片:

全國各大高校、企業(yè)、科研院所從事人工智能、生命科學、代謝工程、有機合成、天然產物、藥物、生物信息學、植物學,動物學、化學化工,醫(yī)學、基因組學、農業(yè)科學、植物學、動物學,臨床醫(yī)學、食品科學與工程、腫瘤免疫與靶向治療、 全基因組泛癌分析、人黏連蛋白折疊基因組機、病毒檢測、功能基因組、遺傳圖譜、基因挖掘變異、代謝組學、蛋白質組學、轉錄組學、生物醫(yī)學、癌癥、核酸、毒物學等研究科研人員及愛好者

深度學習在基因組學

2023.07.29----2023.07.30全天(上午 09.00-11.30 下午 13.30-17.00)

2023.07.30----2023.07.31晚上 (晚上 19.00-22.00)

2023.08.05----2023.08.06 全天(上午 09.00-11.30 下午 13.30-17.00)

2023.08.07----2023.08.08晚上 (晚上 19.00-22.00)

機器學習轉錄組學與表觀組學

2023.07.29----2023.07.30全天(上午 09.00-11.30 下午13.30-17.00)

2023.08.05-----2023.08.06全天(上午09.00-11.30下午13.30-17.00)

2023.08.12-----2023.08.13全天(上午09.00-11.30下午13.30-17.00)

深度學習單細胞

2023.08.05----2023.08.06全天(上午 09.00-11.30 下午13.30-17.00)

2023.08.08-----2023.08.09晚上(晚上19.00-22.00)

2023.08.14-----2023.08.15全天(上午09.00-11.30下午13.30-17.00)

機器學習代謝組學

2023.08.05----2023.08.06全天(上午 09.00-11.30 下午 13.30-17.00)

2023.08.08----2023.08.09晚上 (晚上 19.00-22.00)

2023.08.12----2023.08.13全天(上午 09.00-11.30 下午 13.30-17.00)

機器學習微生物時間

2023.08.05----2023.08.06全天(上午 09.00-11.30 下午 13.30-17.00)

2023.08.08----2023.08.09晚上 (晚上 19.00-22.00)

2023.08.12----2023.08.13全天(上午 09.00-11.30 下午 13.30-17.00

關鍵詞:

  
相關新聞
每日推薦
  • 滾動
  • 綜合
  • 房產