使用 BioPython 运行 BLAST 查询
我想对
- 几个序列进行 BLAST
- 从每个查询中检索前 100 个命中左右
- 池化下载的序列
- 删除重复项
我如何在 BioPython 中执行此操作?
I would like to
- BLAST several sequences
- Retrieve the top 100 hits or so from each query
- Pool the downloaded sequences
- Remove duplicates
How I can do this in BioPython?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
上面的 myfasta 是您的自定义 seq 文件,它是为 internet BLAST 提供的,
您稍后可以根据需要使用 NCBIXML 来处理 result_handle(即获得前 100 个,删除重复项)
Above myfasta is your custom seq file which is provided for internet BLAST
you can later play with result_handle using NCBIXML as you wish to (ie to get top 100,remove duplicates)
当然可以 - 教程解释了如何在本地和使用 NCBI 运行 BLAST以及如何解析结果。我将把实际的实现留给您作为练习!
Sure can - the tutorial explains how to run BLAST locally and with the NCBI and how to parse the results. I'll leave the actual implementation as an exercise for you!