为什么 Perl 在生物学研究中应用如此广泛?
Closed. This question is opinion-based. It is not currently accepting answers. 想要改进这个问题?更新问题,以便可以通过编辑这篇文章用事实和…
在 MATLAB 中更改 seqlogo 图形的 x 轴
我正在制作大量 seqlogo 以编程方式。它们有数百列宽,因此运行 seqlogo 通常会创建太细而看不见的字母。我注意到我只关心其中的一些列(不一定是连续…
使用 R 分割字符串和计算字符的更快方法?
我正在寻找一种更快的方法来计算从 FASTA 文件读取的 DNA 字符串的 GC 含量。这归结为获取一个字符串并计算字母“G”或“C”出现的次数。我还想指定要…
在源代码中编码 Blosum62
我正在尝试使用“Needleman -Wunsch”的“全局对齐”算法来实现蛋白质成对序列对齐。 我不清楚如何在源代码中包含“Blosum62 Matrix”来进行评分或填…
运行 BLAST (bl2seq) 而不创建序列文件
我有一个执行 BLAST 查询 (bl2seq) 的脚本 该脚本的工作原理如下: 获取序列a,序列b 将序列a写入文件a 将序列b写入文件b 运行命令“bl2seq -i filea …
从 pymol 中的笛卡尔坐标绘制彩色球体
我在 wiki 中查找如何将以下有关珠子、笛卡尔坐标 + 能量的信息转换为: 23.4 54.6 12.3 -123.5 54.5 23.1 9.45 -56.7 ....... 到 pymol 中的绘图,其…
如何从 XML NCBI BLAST 文件中提取第一个命中元素?
我试图从 NCBI xml BLAST 文件中仅提取第一个命中。接下来我只想得到第一个HSP。在最后阶段,我想根据最好成绩获得这些。 为了清楚起见,这里提供了 x…
是否有任何现有的解决方案可以通过网站前端创建通用 DNA 序列数据库?
我想为我工作的实验室创建一个带有网络前端的 rRNA 序列数据库。在生物学中,想要使用 BLAST 和 HMMER 等比对算法搜索大量序列似乎很常见,所以我想知…
是否存在酶促裂解的正则表达式?
是否存在用于(理论上)tryptic 裂解 蛋白质序列?胰蛋白酶的切割规则是:在 R 或 K 之后,但不在 P 之前。 示例: 序列 VGTKCCTKPESERMPCTEDYLSLILNR…
在 Python 中分割大文件以进行多处理的最佳方法是什么?
我遇到了很多“令人尴尬的并行”项目,我想使用 multiprocessing 模块进行并行化。然而,它们通常涉及读取大文件(大于 2GB),逐行处理它们,运行基…
快速评估损坏的 Affymetrix CEL 文件
我正在尝试使用 R 规范化大量 Affymetrix CEL 文件。但是,其中一些文件似乎被截断,因此在读取它们时我收到错误 Cel file xxx does not seem to have…