改进迭代文本解析的 clojure lazy-seq 使用
我正在编写 此编码的 Clojure 实现挑战,尝试查找 Fasta 格式的序列记录的平均长度: >1 GATCGA GTC >2 GCA >3 AAAAA 有关更多背景信息,请参阅…
“fasta 文件中序列的平均长度”:你能改进这个 Erlang 代码吗?
我正在尝试使用 Erlangfasta 序列 的平均长度>。 fasta 文件看起来像这样, >title1 ATGACTAGCTAGCAGCGATCGACCGTCGTACGC ATCGATCGCATCGATGCTACGAT…
用于打开用户定义的链接并进行用户定义的表单下拉框选择的书签
我编写了一个书签来打开用户定义的网络链接,在本例中是 UCSC 基因组浏览器中的特定基因组位置。 javascript:d=""+(window.getSelection?window.getSe…
在 C# 中读取 FASTA 文件的最佳方法
Closed. This question is opinion-based. It is not currently accepting answers. 想要改进这个问题?更新问题,以便可以通过编辑这篇文章用事实和…
您认为生物信息学最好的语言是什么?
Closed. This question is opinion-based. It is not currently accepting answers. 想要改进这个问题?更新问题,以便可以通过编辑这篇文章用事实和…
使用脚本解析大型 XML 文件还是使用 BioPython API?
嘿伙计们,这是我的第一个问题。我正在尝试用 SQL 制作 UniprotKB 的本地副本。 UniprotKB 为 2.1GB,采用 XML 和 SwissProt 使用的特殊文本格式 以下…
是否有带有字符串键的矩阵的 Boost(或其他常见库)类型?
我有一个密集矩阵,其中索引对应于基因。虽然基因标识符通常是整数,但它们不是连续的整数。它们也可以是字符串。 我想我可以使用某种带有整数键的增…
精炼存储在 SQLite 中的数据 - 如何连接多个联系人?
我正在存储不同元素之间的联系。我想消除某种类型的元素并存储由消除的元素互连的元素的新联系人。 问题背景 想象一下这个问题。你有一个水分子与其他…
R 优化:在这种情况下如何避免 for 循环?
我正在尝试在 R 中做一个简单的基因组轨迹交叉,并遇到了主要的性能问题,可能与我使用 for 循环有关。 在这种情况下,我以 100bp 的间隔预定义了窗口…
为什么 Perl 在生物学研究中应用如此广泛?
Closed. This question is opinion-based. It is not currently accepting answers. 想要改进这个问题?更新问题,以便可以通过编辑这篇文章用事实和…
在 MATLAB 中更改 seqlogo 图形的 x 轴
我正在制作大量 seqlogo 以编程方式。它们有数百列宽,因此运行 seqlogo 通常会创建太细而看不见的字母。我注意到我只关心其中的一些列(不一定是连续…
使用 R 分割字符串和计算字符的更快方法?
我正在寻找一种更快的方法来计算从 FASTA 文件读取的 DNA 字符串的 GC 含量。这归结为获取一个字符串并计算字母“G”或“C”出现的次数。我还想指定要…
在源代码中编码 Blosum62
我正在尝试使用“Needleman -Wunsch”的“全局对齐”算法来实现蛋白质成对序列对齐。 我不清楚如何在源代码中包含“Blosum62 Matrix”来进行评分或填…