如果您的一条列有不均匀的行,如何在R中分开列?
我有一个.csv文件,其中我有一个列,每行25-30个字符。我需要将一列分为25列,每个列在每个列中都有自己的特征(或核苷酸)。因此,我将忽略每一行的…
BWA-MEM和SAMBAMBA读取小组线错误
这是一个分为两部分的问题: 帮助解释错误; 帮助编码。 我正在尝试运行 bwa-mem 和 sambamba 到Aling Raw读取到参考基因组并按位置进行排序。这些是…
SratoolKit:运行预摘要时错误:在虚拟文件系统模块中解析树时找不到路径
我一直在使用unix shell使用sratoolkit/2.8.2-1下载原始读取。 SRA文件来自NCBI数据库,例如“ https://www.ncbi.nlm.nih.gov/sra?term = srx1157907…
Python的一分子功能如何使用此元组作为参数?
这是我关注的有关基因组学课程引起的问题。我们目前正在处理搜索方法,特别是如何在更长的DNA序列( t ,还有一个字符串)。所讨论的方法涉及创建 has…
如何在r中进行文本字符串(UTF8)的多序列对齐
给定三个字符串: seq <- c("abcd", "bcde", "cdef", "af", "cdghi") 我想执行多个序列对齐,以便得到以下结果: abcd bcde cdef a f cd ghi 使用MSA…
计算氨基酸序列的平均
我有此代码用于使用Biopython计算FastA格式的序列。我得到了lenghts。 NP_418305.1 349 np_418306.1 469 np_418308.1 236 但是,现在我想计算整个序列…
计算Biojava中氨基酸的物理化学特性
需要计算我使用biojava从Uniprot获得的极性/非极性,脂肪/芳香族/芳香/杂环氨基酸的数量和百分比。 我 读取FASTA文件并实现此代码。但是我没有想法如…
更稳定/有效的笛卡尔产品功能,以确定所有长度的组合n
我正在研究 DNA 数据存储的纠错方法。它的工作原理是识别错误,然后快速将所有可能的碱基组合替换到错误位置,直到数据解码。我的代码正确识别错误并…
如果 FASTA 文件包含多路复用数据,如何将其上传到 R?
我希望使用seqinr方法上传fasta文件进行R进行分析。但是,它们是多重序列。 library(seqinr) dnafile <- system.file("sra_data-3.fasta", package = …
计算 n=1000 的样本比例以及 R 中样本比例的平均值
我想计算 AATAA 的 5-Mers 样本比例的平均值。但坚持从 NC_006620.3 的前 100,000 个核苷酸中获取 100 个样本,每个样本长度为 1000 个 5-MERS 样本比…
我可以使用哪些机器学习方法来预测 DNA 序列?
我有一个与 Covid-19 相关的 DNA 序列数据集,我只想根据现有序列预测未来可能的序列。 DNA 序列由 4 个字母和仅 4 个字母 A、G、T 和 C 组成。因此,…
反转 DNA 字符串序列并找到其互补序列
我很难为此编写 C 程序。我想使用 strrev 函数来反转字符串。然而,在求补时,它总是说“指针与整数之间的比较”。 请纠正我的 if else 语句。我非常…
在 python 中删除 .txt 中的行
Closed. This question needs details or clarity. It is not currently accepting answers. 想要改进这个问题?通过编辑这篇文章添加详细信息并澄清…
DNA 搜索序列正则表达式中存在多个不匹配
我编写了这个野蛮的脚本来创建字符串的排列,其中在字符串中所有可能的位置组合中包含 n 个(最多 n=4)个 $。我最终将 .replace('$','(\\w)') 用于 d…