如何使用 BigQuery 访问 PubMed 的数据库
从 BigQuery 访问 google_patents_research.publications
表时,我可以按 top_terms
列过滤结果。本专栏使用 Google 的机器学习算法来搜索专利内的文本并提取它认为最有意义的单词。
我想知道是否可以使用 BigQuery 在 PubMed 数据库上进行类似的搜索。
根据 NCBI 文档,有一个名为 nih-sra-datastore
的数据集,应该可以从 BigQuery 访问,但在 BigQuery 的控制台搜索框中搜索它时它不会显示。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
如果您参考本页所述的
nih-sra-datastore
国家生物技术信息中心看起来它引用的是项目 ID,而不是数据集本身。因此,为了访问它,您必须按照以下步骤操作(在 BigQuery 浏览器上):
+ADD DATA
Pin a Project
上,然后选择Enter a 项目名称
nih-sra-datastore
您将将此公共项目固定到您的 BigQuery 资源管理器。
If you are referring to
nih-sra-datastore
as explained on this page The National Center for Biotechnology Information it looks that its making reference to the project-id not the dataset as such.So in order to have access to it you have to follow these steps (on BigQuery explorer):
+ADD DATA
Pin a Project
and selectEnter a Project Name
nih-sra-datastore
You will pin this public project to your BigQuery explorer.
PubMed 不提供其所有记录的官方 BigQuery 数据集。但是,PMDB 是一个第三方数据库,可将 XML 版本转换为 BigQuery 表。
2021 年出版物 pmparser 和 PMDB:生物医学文献大规模开放研究资源。这是 BigQuery 链接 和 源代码。
PubMed does not provide an official BigQuery dataset of all its records. However, PMDB is a third-party database that converts the XML release to BigQuery tables.
It's described in the 2021 publication pmparser and PMDB: resources for large-scale, open studies of the biomedical literature. Here's the BigQuery link and the source code.