生物信息學

針對對生物信息學感興趣的研究人員,開發人員,學生,教師和最終用戶的問答

0
在pdb中粘貼以下行時出錯
我使用OpenBabel將包含大約50,000種抗病毒代理的.sdf文件轉換為單個.pdb文件。但是,當我嘗試使用Autodock打開.pdb文件時,始終出現以下錯誤。您認為是什麼導致了錯誤。感謝您的時間和耐心。 錯誤消息: “ Error pasing the following lin...
   

0
從Python中的FASTA文件中刪除冗餘序列
我正在嘗試從Fasta文件(來自NCBI)中刪除冗餘序列。當我執行此代碼時,它返回點數,而不是序列數。(斑點數:408,293,序列數:40830)如果您運行的代碼可以刪除重複的想法或有任何想法/建議,請告訴我。非常感謝。from Bio im...
    

0
通過TCGA簽名對樣品進行分類
我有一些膠質母細胞瘤腫瘤的RNA-seq樣品,我現在正嘗試使用R根據特定的基因特徵(來自Verhaak等人,2010)進行分類。4個群集(https://api.gdc.cancer.gov/data/941f81a1-05d7-4f84-80ec-534b8dc1ebac)中的每個群集的特定質心。我想知道如何使用...
   

0
如何將Excel文件(.xlsx)轉換為.smi文件格式?
如何將Excel文件(.xlsx)轉換為.smi文件格式?我擁有的原始文件是一個包含27,000多個配體的Excel文件。我將使用Padel Descriptor軟件來計算配體的描述符,但是Padel Descriptor僅支持.smi文件。為了更加清晰起見,下面添加了excel文件的屏...
    


3
轉錄組中同工型和旁系同源物之間的區別?
我已經使用Trinity將RNAseq數據組裝成轉錄組。有一個選項可以使每個轉錄本只保留最長的異構體,這使我想知道它如何處理重複的基因(->轉錄本)。我沒有在原始文件中找到答案。儘管我認為旁系同源物和同工型是兩個不同的特...
    

1
輕鬆順序的Phylip格式轉換
我通常在BioPython中使用AlignIO來處理比對,並且在本文中,它從fasta格式轉換為phylip格式。許多系統發育包都接受寬鬆的(序列ID)和序列的(序列)葉狀格式。此格式易於使用,有助於仔細檢查對齊錯誤,並且可以是必不可少的...
   

0
問題:Bismark甲基化用於非唯一映射BS-seq讀
我正在尋找DNA甲基化,特別是在小RNA內部。piRNA。我正在用bismark在基因組上繪製BS-seq讀圖。從bismark的用戶指南中,它可以在基因組上唯一映射讀段,這意味著它報告具有最佳得分的第一個讀段,並丟棄其餘的比對;如果將讀段...
   

1
最新的細胞型RNA-Seq反捲積方法是什麼?
我想在大量RNA-Seq轉錄組數據中找到每種細胞類型的比例。我正在尋找有關以下方面的指導:什麼是最先進的方法?他們的假設是什麼?(例如,他們是否假定預先提供了細胞類型表達簽名?)...
   

1
如何設置神經網絡多次循環並求平均值?
我在R / RStudio中有一個腳本,該腳本可以創建二項式變量的隨機數據集,並通過神經網絡對其進行饋送,併計算其似然比統計和偏差。我希望腳本以seed遞增1的方式循環,並將每次運行的值收集到一個數據幀中,從中將這些值取...
    

2
樣品相關分析之前的RNA-Seq數據轉換
如果我從Deseq2歸一化計數開始,在使用R中的cor函數估算樣本相關性之前,應該對這些數據執行哪些預處理步驟?例如,對數據進行分位數歸一化是否有意義?...
   

2
如何使用bwa和samtools提取不匹配的讀取?
我需要閱讀一次博文(不配對),我需要完成Beauclair等人所述的工作流程。論文(這裡是https://rnajournal.cshlp.org/content/24/10/1285.long的免費版本),用於使用其DI檢測程序識別缺陷基因組。在材料和方法中,該過程描述如下: 工作...
     

0
無法對齊2個序列,(已殺死MAFFT)
我有2個.fa後綴,如:>some description of first... ACTGACTACGTACGACTACGATCTGACTACACGTAGATAGACTAGTCACTACG ACTGACTACGTACGACTGACTACATGACTGAC... > some description of second... ATCGATAGCTACGATCGATAGTAGATAG.... 這個文件是461mb(智人的1條染色體和泛蟲類的1條染色體),...
  

-2
嘗試在R中轉換基因名稱時合併數據出現問題
我一直在嘗試(用R編碼)一種將基因登錄號轉換成基因名稱的方法(來自RNAseq數據)。我已經查看了所有相關問題,並試圖修改我的代碼,但是由於某種原因,它仍然無法正常工作。這是我的代碼,其中charg是數據集resdata的基...
    


-2
將Array [Pair [X,Y]]輸出到WDL任務中的文件
如果我壓縮兩個數組,則會獲得Array [Pair [String,String]]變量。現在,如果我想輸出到文件Array [Array [String]],我可以使用write_tsv(),如果我要輸出到文件Map [String,String],我可以使用write_map()。但是WDL不允許我將Array [Pair [Stri...
 

0
從比對文件中刪除終止密碼子以進行dn / ds計算
這是與我的問題非常相似或與我的問題幾乎相同的question之一我用虛擬數據核苷酸alignment和氨基file進行了正常運行,我可以從phangorn運行dn / ds而沒有任何問題。但是當我運行數據核苷酸alignment和氨基file時,我確實收到了此警告In...
  

1
awk字段分隔器
我有一個像這樣的文件: ,我希望輸出為: 我嘗試使用awk:awk 'BEGIN { OFS=FS=" " } { sub("\\..*", "", $1); print }' 並打印第一個ID ENST。但是當我將其更改為:awk 'BEGIN { OFS=FS=" " } { sub("\\..*", ""...
 


0
如何匿名化bam文件
我有一個bam文件,例如RNA-Seq,該文件始終以單核苷酸多態性(SNP)的形式包含患者可識別的數據。我希望有一種技術來獲取此對齊的bam文件,並在等效位置將所有非參考鹼基替換為參考鹼基(在此過程中硬剪切任何軟剪切的鹼...
  

Next page