如何使用 BigQuery 访问 PubMed 的数据库

发布于 2025-01-09 18:07:20 字数 297 浏览 1 评论 0 原文

从 BigQuery 访问 google_patents_research.publications 表时,我可以按 top_terms 列过滤结果。本专栏使用 Google 的机器学习算法来搜索专利内​​的文本并提取它认为最有意义的单词。 我想知道是否可以使用 BigQuery 在 PubMed 数据库上进行类似的搜索。 根据 NCBI 文档,有一个名为 nih-sra-datastore 的数据集,应该可以从 BigQuery 访问,但在 BigQuery 的控制台搜索框中搜索它时它不会显示。

When accessing google_patents_research.publications table from BigQuery I can filter results by the top_terms column. This column uses Google's machine learning algo to search the text inside a patent and extract the words it finds most meaningful.
I was wondering if there is a similar search using BigQuery that can be done on PubMed's database.
According to NCBI docs there is a dataset called nih-sra-datastore which should be accessible from BigQuery, but it doesn't show up when searching for it in BigQuery's console search box.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

于我来说 2025-01-16 18:07:20

如果您参考本页所述的 nih-sra-datastore 国家生物技术信息中心看起来它引用的是项目 ID,而不是数据集本身。

因此,为了访问它,您必须按照以下步骤操作(在 BigQuery 浏览器上):

  • 点击 +ADD DATA
  • 将鼠标悬停在 Pin a Project 上,然后选择 Enter a 项目名称
  • 添加 nih-sra-datastore

您将将此公共项目固定到您的 BigQuery 资源管理器。

If you are referring to nih-sra-datastore as explained on this page The National Center for Biotechnology Information it looks that its making reference to the project-id not the dataset as such.

So in order to have access to it you have to follow these steps (on BigQuery explorer):

  • Click on +ADD DATA
  • Hover over Pin a Project and select Enter a Project Name
  • Add nih-sra-datastore

You will pin this public project to your BigQuery explorer.

羁〃客ぐ 2025-01-16 18:07:20

PubMed 不提供其所有记录的官方 BigQuery 数据集。但是,PMDB 是一个第三方数据库,可将 XML 版本转换为 BigQuery 表。

2021 年出版物 pmparser 和 PMDB:生物医学文献大规模开放研究资源。这是 BigQuery 链接源代码

PubMed does not provide an official BigQuery dataset of all its records. However, PMDB is a third-party database that converts the XML release to BigQuery tables.

It's described in the 2021 publication pmparser and PMDB: resources for large-scale, open studies of the biomedical literature. Here's the BigQuery link and the source code.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文