使用GAE中的任务队列插入批量数据

发布于 2024-09-29 21:30:52 字数 649 浏览 10 评论 0原文

我正在使用 Google App Engine 创建一个网络应用程序。该应用程序有一个实体，用户将通过上传工具插入该实体的记录。用户最多可以选择 5K 行（对象）数据。我正在使用 DataNucleus 项目作为 JDO 实现。这是我将数据插入数据存储所采用的方法。

数据从 CSV 中读取并转换为实体对象并存储在列表中。
该列表分为较小的对象组，例如每组大约 300 个。
每个组都使用 memcache 进行序列化并存储在缓存中，并使用唯一的 id 作为键。
对于每个组，都会创建一个任务并将其与密钥一起插入队列中。每个任务调用一个 servlet，该 servlet 将此键作为输入参数，从内存中读取数据并将其插入到数据存储中，并从内存中删除数据。

队列的最大速率为 2/分钟，桶大小为 1。我面临的问题是任务无法将所有 300 条记录插入到数据存储中。在 300 个数据中，插入的最大值约为 50 个。从内存缓存读取数据后，我已经验证了数据，并且能够从内存中取回所有存储的数据。我正在使用 PersistenceManager 的 makepersistent 方法将数据保存到 ds。有人可以告诉我这可能是什么问题吗？

另外，我想知道是否有更好的方法来处理批量插入/更新记录。我使用过BulkInsert工具。但在这样的情况下，它就不能满足要求。

原文

分享到QQ

分享到微博