运行 BLAST (bl2seq) 而不创建序列文件
我有一个执行 BLAST 查询 (bl2seq) 的脚本 该脚本的工作原理如下: 获取序列a,序列b 将序列a写入文件a 将序列b写入文件b 运行命令“bl2seq -i filea …
从 pymol 中的笛卡尔坐标绘制彩色球体
我在 wiki 中查找如何将以下有关珠子、笛卡尔坐标 + 能量的信息转换为: 23.4 54.6 12.3 -123.5 54.5 23.1 9.45 -56.7 ....... 到 pymol 中的绘图,其…
如何从 XML NCBI BLAST 文件中提取第一个命中元素?
我试图从 NCBI xml BLAST 文件中仅提取第一个命中。接下来我只想得到第一个HSP。在最后阶段,我想根据最好成绩获得这些。 为了清楚起见,这里提供了 x…
是否有任何现有的解决方案可以通过网站前端创建通用 DNA 序列数据库?
我想为我工作的实验室创建一个带有网络前端的 rRNA 序列数据库。在生物学中,想要使用 BLAST 和 HMMER 等比对算法搜索大量序列似乎很常见,所以我想知…
是否存在酶促裂解的正则表达式?
是否存在用于(理论上)tryptic 裂解 蛋白质序列?胰蛋白酶的切割规则是:在 R 或 K 之后,但不在 P 之前。 示例: 序列 VGTKCCTKPESERMPCTEDYLSLILNR…
在 Python 中分割大文件以进行多处理的最佳方法是什么?
我遇到了很多“令人尴尬的并行”项目,我想使用 multiprocessing 模块进行并行化。然而,它们通常涉及读取大文件(大于 2GB),逐行处理它们,运行基…
快速评估损坏的 Affymetrix CEL 文件
我正在尝试使用 R 规范化大量 Affymetrix CEL 文件。但是,其中一些文件似乎被截断,因此在读取它们时我收到错误 Cel file xxx does not seem to have…
如何在 Perl 中从 DNA 序列中提取起始密码子和终止密码子?
我有下面的代码尝试识别给定 DNA 序列的起始密码子和终止密码子的位置。 我们将起始密码子定义为ATG序列,将结束密码子定义为TGA、TAA、TAG序列。 我…
使用 SED/AWK 将 FASTQ 转换为 FASTA
我的数据总是以四个为一组 采用以下格式(称为 FASTQ): @SRR018006.2016 GA2:6:1:20:650 length=36 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGN +SRR0180…