使用 Google App Engine 数据存储区进行数据建模

发布于 2024-09-26 21:23:20 字数 1275 浏览 3 评论 0原文

我目前正在用 Python 在 Google App Engine 上构建一个 Web 应用程序，以收集表单的赛马数据。基本数据结构是球场有很多会议有很多比赛有很多马匹有一名骑师和一名驯马师。到目前为止，我已经得到了以下模型（为了简洁起见，减少了字段数量）。

class Course(db.Model):
  course_number = db.IntegerProperty()     # course id (third party)
  course_description = db.StringProperty() # course name

class Meeting(db.Model):
  course = db.ReferenceProperty(Course)    # reference to course
  meeting_number = db.IntegerProperty()    # lifetime meeting number for course
  meeting_date = db.DateProperty()         # meeting date

class Race(db.Model):
  meeting = db.ReferenceProperty(Meeting)  # reference to meeting
  race_number = db.IntegerProperty()       # eg 1 for 1st race of meeting
  race_name = db.StringProperty()          # race name
  time_of_race = db.TimeProperty()         # race time

我无法弄清楚如何在数据存储中存储有关马匹、驯马师、骑师的数据。

我的应用程序将收集过去 2 年的数据，为此我将保存马匹、练马师、骑师的相关结果信息。练马师和骑师在该时间点的特定马匹结果信息是相同的。然而，随着时间的推移，一匹马可能会有不同的驯马师和不同的骑师。

当我意识到在分析中我可能需要查看马匹、骑师、练马师过去 10 场比赛的结果时，我的主要大脑疼痛就来了。可能无法存储的结果，因为结果发生在英国比赛之外（数据仍然可用），或者发生在我开始完整比赛存储的日期之前。

谁能告诉我如何优化马匹、骑师、练马师结果的存储，以便我能够适应这一点？

数据来源：http://form.horseracing.betfair.com/timeform 所有必需的数据都可以通过 JSON 请求轻松访问。

原文

I am currently building a web application on Google App Engine in Python to harvest horse racing data of the form. The basic data structure is Course has many Meetings has many Races has many Horses has one Jockey and had one Trainer. So far I have got the following models (reduced number of fields for sake of brevity).

class Course(db.Model):
  course_number = db.IntegerProperty()     # course id (third party)
  course_description = db.StringProperty() # course name

class Meeting(db.Model):
  course = db.ReferenceProperty(Course)    # reference to course
  meeting_number = db.IntegerProperty()    # lifetime meeting number for course
  meeting_date = db.DateProperty()         # meeting date

class Race(db.Model):
  meeting = db.ReferenceProperty(Meeting)  # reference to meeting
  race_number = db.IntegerProperty()       # eg 1 for 1st race of meeting
  race_name = db.StringProperty()          # race name
  time_of_race = db.TimeProperty()         # race time

I am having trouble working out how to store data on Horses, Trainers, Jockeys in the data store.

My application will be harvesting data for say the last 2 years, for this I will be saving relevant result information for Horse, Trainer, Jockey. The information on a particular horses result is the same for Trainer and Jockey at that time point. However over time a Horse can have different trainer and different jockey.

My main brain ache is coming when I realise that in analysis I may need to look at the result for the last 10 races for either Horse, Jockey, Trainer. Results which may not be stored either because the results occured outside of UK racing (data is still available) or happened before the date I start complete race storage.

Can anyone shed any light on how to optimise the storage of Horse, Jockey, Trainer results so that I can accomodate for this?

Source of data: http://form.horseracing.betfair.com/timeform
All required data can be easily accessed via JSON requests.

分享到QQ

分享到微博