计算 R 中两个基因序列之间的百分比差异

发布于 2024-12-02 22:55:34 字数 215 浏览 2 评论 0原文

我还没能在问题或 R 包中找到这个,希望很简单。

假设有两个基因序列:

Sequence A: ATG CGC AAC GTG GAG CAT
Sequence B: ATG GGC TAC GTG GAT CAA

我想要用 R 代码来生成两个序列之间单核苷酸的百分比差异(例如 15%)。

有什么想法吗?提前致谢。

I haven't been able to find this in the questions or an R package, hopefully straightforward.

Take two hypothetical genetic sequences:

Sequence A: ATG CGC AAC GTG GAG CAT
Sequence B: ATG GGC TAC GTG GAT CAA

I want to have R code to generate the percentage difference in single nucleotides between the two sequences (e.g. 15%).

Any thoughts? Thanks in advance.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

_蜘蛛 2024-12-09 22:55:34

如果我正确理解你的问题,那么你只需要做一个简单的字符串比较。例如,

R> seq1 = c("A", "T", "G", "C", "G", "C", 
            "A", "A", "C", "G", "T", "G", 
            "G", "A", "G", "C", "A", "T")
R> seq2 = c("A", "T", "G", "G", "G", "C", 
            "T", "A", "C", "G", "T", "G", 
            "G", "A", "G", "C", "A", "A")
R> seq1 != seq2
 [1] FALSE FALSE FALSE  TRUE FALSE FALSE  TRUE FALSE FALSE FALSE FALSE FALSE
[13] FALSE FALSE FALSE FALSE FALSE  TRUE
R> sum(seq1 != seq2)/length(seq1)*100
[1] 16.67

要获取上述格式的数据,请查看 strsplit 函数。

If I understand your question correctly, then you just need to do a simple string comparsion. For example,

R> seq1 = c("A", "T", "G", "C", "G", "C", 
            "A", "A", "C", "G", "T", "G", 
            "G", "A", "G", "C", "A", "T")
R> seq2 = c("A", "T", "G", "G", "G", "C", 
            "T", "A", "C", "G", "T", "G", 
            "G", "A", "G", "C", "A", "A")
R> seq1 != seq2
 [1] FALSE FALSE FALSE  TRUE FALSE FALSE  TRUE FALSE FALSE FALSE FALSE FALSE
[13] FALSE FALSE FALSE FALSE FALSE  TRUE
R> sum(seq1 != seq2)/length(seq1)*100
[1] 16.67

To get your data in the above format, have a look at the strsplit function.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文