生物信息學

針對對生物信息學感興趣的研究人員,開發人員,學生,教師和最終用戶的問答

14
設計實驗室NGS文件數據庫架構
我是一家醫院學術實驗室的居民Bioinfo Geek,通常使用NGS以及CyTOF和其他大量數據生成技術。我討厭我們當前的元數據收集和與最終產品( 優秀的Excel工作表 和幾個設計不當的RedCap數據庫)關聯的 協議 。我想實現一個中央結構化...
  

16
了解DESeq2設計,對比和結果
我有一組高通量實驗,包含2個基因型( WT 和 prg1 )和3種處理( RT , HS30 和 HS30RT120 ),每個基因型都有2個重複基因型x治療組合。基因的讀取計數匯總在一個文件中,我在R中加載了以下文件:> counts_data <- read.table("path/...
    


14
將數百個小型BAM文件合併為一個BAM文件
我正在處理超過一百萬(長)的讀取,並將它們與大型基因組對齊。我正在考慮並行運行對齊作業,將其水平分佈在數百個節點上,而不是嘗試使用幾十個內核來運行單個作業。我想將排序後的BAM文件合併在一起,以進行進一步...
   

14
基於比對還是無參考(轉錄組分析)?
我想專注於轉錄組分析。我們知道有可能基於比對或k-mers分析RNA-Seq實驗。可能的對齊工作流程:將序列讀取與TopHat2對齊用Cufflinks量化基因表達可能的無參考工作流程:使用Kallisto無參考索引量化序列讀數兩種策略均生成基因表...
  

7
異質種群中的偽時間排序
從scRNAseq數據進行偽時間排序的最廣泛接受的工具是什麼?也沒有將基於 細胞同一性 或更準確地細胞類型命運發生的差異表達與由於處於不同階段分化的細胞而產生的差異分開的方法。更具體地說,可以說有一些細胞,其中一...
 

12
將藥品名稱映射到ATC代碼
我有興趣使用UK Biobank提供的藥物信息。為了使它們成為可用形式,我想將它們映射到ATC codes。由於數據展示中列出的許多藥物都包含劑量信息,因此在藥物名稱之間進行精確的字符串匹配不是很有效。我已經考慮過使用fuzzywuzzy...
  

Next page