每次都不启动模型，在无需启动模型的情况下，使用gpu内部的模型

发布于 2025-02-10 07:04:43 字数 750 浏览 1 评论 0原文

每次我将变压器模型加载到GPU中时，都需要大约60秒。

因此，我想在不每次启动的情况下通过烧瓶请求访问GPU中的模型。

因此，我尝试将模型保存在BaseManager中，然后访问它。

from multiprocessing.managers import BaseManager

manager = BaseManager(('', 37844), b'password')
manager.connect()

generator = pipeline('text-generation', model=MODEL_NAME, device=1)
manager.register('generator', generator)

但是在尝试访问模型的同时和 generator = manager.generator（）

我获得以下错误

无法在分叉子过程中重新定位CUDA。要将CUDA与多处理一起使用，您必须使用'Spawn'start方法

，并且在进一步挖掘错误时，要求使用多处理器 in torch而不是没有BaseManager。

from torch.multiprocessing import Pool, Process, set_start_method

那么，如何在烧瓶中有效地使用模型？

原文

Each time I load a transformer model into GPU it takes ~60 seconds.

So, I want to access the model in GPU across flask requests without initiating it each time.

So, I tried to save the model in BaseManager and then access it.

from multiprocessing.managers import BaseManager

manager = BaseManager(('', 37844), b'password')
manager.connect()

generator = pipeline('text-generation', model=MODEL_NAME, device=1)
manager.register('generator', generator)

but while trying to access the model
with
generator = manager.generator()

I get the following error

Cannot re-initialize CUDA in forked subprocess. To use CUDA with multiprocessing, you must use the 'spawn' start method

and while digging further into the error it asked to use multiprocessor from torch instead but that doesn't have a BaseManager.

from torch.multiprocessing import Pool, Process, set_start_method

So, how does one efficiently use Models across requests in Flask?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

列表为空，暂无数据

关于作者

海夕

暂无简介

文章

28 人气

关注发私信

李珊平

文章 0 评论 0

关注

Quxin

文章 0 评论 0

关注

范无咎

文章 0 评论 0

关注

github_ZOJ2N8YxBm

文章 0 评论 0

关注

若言

文章 0 评论 0

关注

南…巷孤猫

文章 0 评论 0

友情链接

文江博客

每次都不启动模型，在无需启动模型的情况下，使用gpu内部的模型

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

关于作者

相关话题

热门标签

推荐作者

李珊平

Quxin

范无咎

github_ZOJ2N8YxBm

若言

南…巷孤猫

友情链接

每次都不启动模型，在无需启动模型的情况下，使用gpu内部的模型

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

关于作者

相关话题

热门标签

推荐作者

李珊平

Quxin

范无咎

github_ZOJ2N8YxBm

若言

南…巷孤猫

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。