plink 的地图文件输出存在问题
我正在使用VCF文件(使用BCFTools生成),以使用PLINK软件创建地图文件。我正在使用的命令是
./plink --vcf sample.vcf --out sample --recode --allow-extra-chr
输出.map文件看起来像这样,
CM004562.1 . 0 1645
CM004562.1 . 0 4771
CM004562.1 . 0 4811
CM004562.1 . 0 4812
CM004562.1 . 0 5001
CM004562.1 . 0 5672
CM004562.1 . 0 5674
CM004562.1 . 0 5678
CM004562.1 . 0 5684
CM004562.1 . 0 5802
为什么它在第三列中输出零?以及如何修复?
I am working with the vcf file (generated using bcftools) to create a map file using plink software. The command i am using is
./plink --vcf sample.vcf --out sample --recode --allow-extra-chr
The output .map file looks like this
CM004562.1 . 0 1645
CM004562.1 . 0 4771
CM004562.1 . 0 4811
CM004562.1 . 0 4812
CM004562.1 . 0 5001
CM004562.1 . 0 5672
CM004562.1 . 0 5674
CM004562.1 . 0 5678
CM004562.1 . 0 5684
CM004562.1 . 0 5802
Why it outputs zero in the 3rd column?, and how to fix that?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
地图文件的第三列代表基于重组地图的变体的位置: https://www.cog-genomics.org/plink/1.9/formats#map
此字段是可选的,我假设您的输入VCF文件没有信息。
您可以从其他资源中获取重组图,例如1000基因组: https”> https:/ /mathgen.stats.ox.ac.uk/impute/1000gp_phase3.html
一旦拥有了选择的重组图,就可以使用Python/R将第三列替换为Centimorgans的位置。
The third column of the map file represents the position of the variants based on the recombination map: https://www.cog-genomics.org/plink/1.9/formats#map
This field is optional and I assume your input VCF file doesn't have the info.
You can get the recombination map from other resources, such as 1000 Genomes: https://mathgen.stats.ox.ac.uk/impute/1000GP_Phase3.html
Once you have the recombination map of your choice, you can use Python/R to replace the third column with the position in centimorgans.