生物信息學

針對對生物信息學感興趣的研究人員,開發人員,學生,教師和最終用戶的問答

1
康達沒有安裝最新版本的snakemake
我想對配置文件使用--default-resources參數,該參數在snakemake的更高版本中可用。要安裝snakemake,我創建了一個新的conda環境: conda create -n snakemake -c conda-forge -c bioconda snakemake 當前安裝的版本列為5.14:$ conda activate snakemake (snakemake)$ ...
  

0
是否有用於DNA序列同義編碼的工具?
我有一個DNA序列,我想在整個序列中進行同義突變,從而保留了氨基酸序列。有誰知道實現這一目標的工具...
     

0
如何使用conda在snakemake中為amrfinder運行一次性"設置"步驟
我正在嘗試將在conda中運行的amrfinder添加到蛇形工作流程中,以出色的HPC工作。首次運行amrfinder時,必須運行amrfinder -u來更新/下載其搜索的基因/蛋白質數據庫。由於我使用的是snakemake的--use-conda標誌,因此我第一次運行工作流程...
   

1
VCF文件中沒有MQ標籤
要在我的Mtb序列中調用少數派變體,我正在使用管道fastq -> BWA MEM for mapping -> picard MarkDuplicates -> GATK3 for indel realignment and base recalibration -> lofreq for variant calling (https://csb5.github.io/lofreq/) 但是,生成的VCF文件沒有M...
     

1
當PDB列出具有相同結構的多種生物時,這意味著什麼?
我正在瀏覽在PDB上用Cryoem建模的核醣體,並為一個事實感到困惑,對於某些人,PDB或更確切地說是沉積物的作者,放置了來自不同生活領域的多種生物...一個人怎麼解釋?據我了解,金牛座是一頭母牛,而大腸桿菌是一種細菌。...
 


1
根據蛋白質形狀生成候選配體
使用機器學習(ML)和深度學習進行新藥設計的最新方法通常涉及生成數百種潛在的配體,這些配體隨後通過與靶蛋白對接並記錄產生的結合親和力進行測試。是否有可能通過首先將配體的生成過程限制為蛋白質的形狀從而限制...
   

1
從AWS下載SRA文件
我想下載作者已上傳到SRA的原始BAM文件。通常,我只使用sam-dump,但是文件存在似乎與this issue相關的問題。由於根據該條目,AWS S3還託管原始BAM文件,所以我認為我可以直接下載這些文件。 SRA條目示例 NCBI文檔暗示我無法直接...
    

1
RNA-Seq和SNP基因分型數據數據庫
我需要獲得一個隊列的公開可用的RNA-seq + SNP基因分型數據-理想情況下,該序列已從腦組織中測序出來。我發現CMC和GTEx足以滿足我的需求,但是從這兩個來源獲取數據的過程都非常漫長,它們要求我們也與他們共享我們的數據;...
    

1
查找序列比對列的區分位置
我沒有生物學的任何理論背景,因此,如果我的問題有點...,請原諒我。我正在嘗試使用蒙特卡洛方法來查找給定序列比對列的區別位置。因此,從本質上講,給定序列比對後,我想找到可以區分活躍構象和非活躍構象的位置。...
   

2
如何從GTEx下載RNAseq基因表達數據
我只想從肝臟下載GTEx的RNAseq基因表達數據。最好的方法是什麼?我嘗試了一些事情。我從GTEx網站(https://www.gtexportal.org/home/datasets, RNA-Seq數據 下)下載了幾個文件,但是遇到的問題是:不確定最好的文件是什麼: 基因讀取計...
    

0
不同物種之間的系統發育分析
希望每個人都很好。所以我被任命為一項任務,我需要一些指導。注意,給我任務的人可能沒有很清楚地解釋這一點。我將寫出他確切地詢問我的內容以及他給我的主要數據。因此,他給了我4個床單文件(人類基因組),並帶...
  

1
從註釋和基因組中獲取每個基因一個轉錄物的序列
我有一個基因組(data/genome/genome.fasta)和基於製動器的基因組註釋(data/genome/annotation.gff3),現在我想獲得每個基因一個轉錄本的序列(假設是最長的一個)。 Cufflinks有一個gffread程序,用於從基因組和註釋中提取轉錄組。像gffr...
   


1
群集上的Snakemake產生空的輸出文件
問題:當我在群集上運行Snakefile時,所有過程均成功完成。從日誌中可以看到我的Shell腳本正在正確運行,並聲稱已成功完成。在開始分析步驟的大約一半時,工作流程由於輸入文件為空而崩潰(這對於PLINK-1.9來說是正常的,不...
  

1
以編程方式提取自動對接的蛋白質-配體連接
我有2個晶體結構,一個是我的蛋白質,另一個是我的配體(我有幾個蛋白質-配體對)。我正在使用AutoDock Vina模擬對接,它會返回具有更新的3D坐標的配體的另一個文件。一切都是pdbqt格式,但是如果需要,我可以使用OpenBabel進...
   

0
上傳生物單位後,是否可以在PYMOL中保存完整的pdb文件?
pdb代碼:2obt pdb文件具有單體坐標。我已經使用以下命令生成程序集,或者換句話說,上傳一個以上的生物單位,以使該蛋白質成為二聚體:set assembly, fetch 2obt, asu, async=0 set assembly, 1 fetch 2obt, assembly1, async=0 在名稱為assembly1的...
 

2
SNPEFF基因組構建具有特定的密碼子用法
無法使用'codon.Mitochondrial'和Pt使用'codon.Bacterial_and_Plant_Plastid'用Mt建立我自己的擬南芥參考文獻,但是相同的命令在兩行都刪除了密碼子表的情況下也能很好地工作。 snpeff命令java -Xms24g -Xmx24g -jar /opt/biotools/snpEff/snpEff.jar build -gff3 -...
  

1
TEs是垂直轉移還是水平轉移?
預測並註釋所有可轉座元件後。為四個相關物種。現在我想找出在我的服裝庫中找到的這些預測候選人,無論是垂直轉移還是水平轉移?有什麼建議的方法嗎?...
 

1
程序集讀取尾部有其開頭的副本
我正在分析ID為SRR11140748的SARS-CoV-2裝配體的讀數。顯然,這些讀數是由Illumina和Oxford Nanopore Technologies通過平行測序獲得的。我發現這些讀物GGTAAGTATGTACAAATACCTACAACTTGTGCTAATGACCCTGTGGGTTTTACACTTAAAAACACAGTCTGTACCGTCTGCGGTATGTGGAAAGGTTATGGCTGTAGTTGTGATCAAC...
     

Next page