生物信息學

針對對生物信息學感興趣的研究人員,開發人員,學生,教師和最終用戶的問答

1
我如何獲得通往ENA研究的FTP鏈接?
如何在ENA中以編程方式獲取指向RNA seq fastq文件的ftp鏈接?這是我有興趣獲得的鏈接的示例: ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR824/000/SRR8240860/SRR8240860_1.fastq.gz 特別是,是否有一些工具可以給我BioProject ID(在此為PRJNA506829),以便為我...
   


0
顯示分數或圖形以可視化比對數據中每個殘基的保守程度
我想顯示一個分數或圖表,以可視化每個殘基從氨基酸比對數據中的保守程度。如果可能的話,我想提取得分高於特定水平的遊戲部分。是否有工具或源代碼(python)來做到這一點?對不起,我的英語不好... ...
  

1
查詢NCBI時太多請求錯誤
查詢NCBI SRA數據庫時,我始終收到 請求過多錯誤 ,即使我每秒運行少於10個請求,並且我有一個API密鑰,據說應該可以讓我每秒運行10個。這是我的(Python)代碼:import subprocess import concurrent.futures import time bioprojects = [ "PRJN...
  

0
查詢GEO時如何限制搜索空間?
我正在使用以下命令來檢索daf-2 c的GEO數據集條目。具有高通量測序功能的線蟲:esearch -db gds -query "daf-2" | efilter -query "expression profiling by high throughput sequencing [DataSet Type] AND Caenorhabditis elegans [organism]" 但是,在我得...
 

1
使用fastq-dump下載多個fastq文件
我想在Salmon中同時下載以下fastq文件: - SRR10611214 - SRR10611215 - SRR10611215 - SRR10611216 - SRR10611217 有沒有一種方法可以使用bash進行循環或fastq轉儲?或預取...
    

1
ls命令中未顯示在Conda環境中下載的軟件
我在Conda環境中安裝了gzip軟件包,然後為了確保該軟件在那裡,我使用了 ls 命令,該命令不在列表中。試圖再次安裝,系統提示所有軟件包都已安裝,為什麼?如何查看環境中安裝的軟件列表?謝謝!...
 

2
如何將基因組片段化成不同大小的非重疊序列?
我有細菌染色體/質粒,我已從refseq中下載了多個Fasta,我希望將它們片段化為1 kb和15 kb之間的非重疊片段。我嘗試使用Google搜索相關工具,但無濟於事。有誰知道我將如何實現這一目標?本文完成了一些非常相似的工作:https://l...
  

0
從multifasta文件計算等電點
我需要從multifasta文件計算等電點,是否有任何python代碼或網絡工具可讓我做到這一點?...
  


0
以編程方式從NCBI檢索登錄清單
我想以編程方式從NCBI page中檢索文件 登錄列表 。我正在運行firefox,所以我單擊文件,然後單擊Ctrl + Shift + E嘗試找出文件端點是什麼。但是我似乎無法弄清楚(我還沒有做太多,我只記得為上一個項目做過一次)。這樣做時,...
 

0
如何從Fasta文件或直接從Internet獲取重複區域
如果我去to ncbi site,則應用customize view -> Customize -> All features -> Update view,然後再應用ctrl + f : Alu,我可以從該染色體上獲得所有鋁重複區域的坐標。它看起來像: repeat_region complement(37490..37800) /note="AluY" ...
 

1
比較元基因組之間的基因豐度
到目前為止我的工作流程:在未組裝的基因組中查找標記基因的片段>下載並組裝後的基因組>恢復感興趣的基因鄰域/基因組現在,通過組裝的重疊群上的 深度 (我使用MEGAHIT進行組裝),我對這些基因的豐富程度有了一個粗略的...
   

1
用RUVSeq標準化後如何創建差異表達(DE)基因的列表?
我正在使用edgeR對一組RNA-seq數據樣本(2個對照組; 8種處理方法)進行差異表達(DE)分析。為了糾正批處理效果,我正在使用RUVSeq。我無需進行標準化即可獲得DE基因的列表:x <- as.factor(rep(c("Ctl","Inf"),c(2,8))) se...
     

1
比較對齊的氨基酸和密碼子
我有一組4個氨基酸,它們已經比對,但是我想將它們分別與改變密碼子水平的核苷酸序列進行比較。我有一個比對文件,我只想在C末端結構域區域中使用,只有CTD以氨基酸“NITNLC”開頭,直到以“HAPATV”結束,其餘序列我都不...
  

0
aov(glm模型)實際上在R中做什麼?
在R中的glm模型上使用aov()會發生什麼情況?普通glm模型sumamry(m1):Call: glm(formula = value ~ origin + variable, family = poisson(), data = comb_data) Deviance Residuals: Min 1Q Median 3Q Max -0.8227 -0.5547 -0.4385 -0.3038 2.5258 Coefficients: (1 not defined ...
  

1
BWA:檢測參考基因組和短讀序列之間的差異
我需要確定短讀序列中的所有基因座,在該位置上,微衛星重複的數目(即 AA , GTC 等的拷貝數)與參考基因組以及位置不同其中參考基因組和短讀序列的重複數相同。我使用了Burrows-Wheeler Aligner(BWA mem)將高覆蓋率的短讀序列...
     

1
多個輸入和輸出文件?
我試圖打印出每個.pdbqt文件的測量距離,然後使用.pdbqt文件的原始名稱作為新的.txt文件名,為每個.pdbqt編寫一個新的輸出文件。下面是腳本。我正在使用python3,並且正在嘗試通過Linux CLI進行此操作。from pymol import stored stored.a, st...
  

0
R即使位於正確的目錄中也無法找到文件
我對我要進行的有關健康學生研究的項目有疑問。儘管已將所有文件轉換為csv並位於正確的文件夾中,但是我無法通過read.csv或read.csv2導入csv文件。以下是命令行:setwd ("C:/Users/fek/Desktop/Analyse i-Share") getwd() TA<-read.csv2(fil...
 

1
差異基因表達熱圖上有紅色和綠色的"官方"標準用法嗎?
我最近發現自己製作了多個熱圖,以可視化在兩個實驗條件下重複實驗之間的差異基因表達結果。我使用顏色的繪圖軟件中的默認設置:基因上調->紅色基因下調->綠色不變的基因->黑色我的直覺尖叫,我認為這種配色方案是相反...
   

Next page