用句子变压器模型可以作为摘要任务输入的令牌中的最大文本长度是多少
大多数BERT模型的最大输入长度为512代币。当我将句子变压器多qa-distilbert-COS-V1模型与bert-suttractive-summarizer用于摘要任务。该模型接受了具有…
如何在BERT主题建模中列出每个主题的所有文档/单词?
我阅读了文档,但是我可以看到主题仅显示每个主题的3或4个文档,而计数为2000+,我是否可以看到所有分配的文档,而不是每个主题的三个/四个文档? 例…
如何从语料库或查询中获取句句词词词汇?
我正在尝试 sendencetransformer 模型来自 sbert.net.net.net.net 我想知道它如何处理实体名称。它们是否被标记为未知 - 它们是否被令牌分解了,等等…
如何将从现有列得出的句子嵌入到新列中?
我有一个具有四个nw_data = ['qn_id','qn_context',qns','anwsers'的数据框。这就是我想在该数据集中添加第五列的样子 Qn_id | Qn_context | Qns |…
pytorch模型对象没有属性' predict'伯特
我曾使用Pytorch训练BertClassifier模型。创建了我的最佳状态后。否则,将其进行评估和冻结模型之后,我会使用.predict在样本上进行工作,但是我遇到…
Huggingface 预训练模型的分词器和模型对象具有不同的最大输入长度
我正在使用 Huggingface 的 symanto/sn-xlm-roberta-base-snli-mnli-anli-xnli 预训练模型。我的任务需要在相当大的文本上使用它,因此了解最大输入长…
如何知道一个词是否属于变压器模型?
我使用模型 roberta 和 flaubert ,我使用python库 ston_transformer 。 我使用余弦分数来计算相似性,但对某些话来说效果不佳。 这些单词似乎是模型…
如何使用句子转换器使用元数据进行文档检索?
我正在尝试使用 Sentence Transformers 和 Haystack 进行文档检索,重点是在文档文本之外的其他元数据上搜索文档。 我正在使用学术出版物标题的数据集…
在 keras 模型中使用 `sentence-transformers`
我想在更大的 Keras 模型中使用来自句子转换器的模型。 这是完整的示例: import tensorflow as tf from transformers import AutoTokenizer, TFAutoM…
单语言 Transformers 模型可以用于 NLP 任务中的其他语言吗?
我需要微调 Tr 语言的 Sentence Transformer 模型。我意识到一些预先训练的模型在不同语言中给出了相似的结果。 那么,我们可以用它来微调 ST 预训练…
RuntimeError:针对 API 版本 0xe 编译的模块,但导入句子转换器时此版本的 numpy 为 0xd
我想使用句子转换器。为此,我安装了句子转换器,如下所示: pip installentence-transformers 然后,我按如下方式进行导入: from句子_transformers …
Windows 上尝试 python 多处理编码时出现运行时错误
我正在尝试运行 python 多处理库来加速 csv 文件的编码。但是我遇到了这个错误: RuntimeError: An attempt has been made to start a new process be…
- 共 1 页
- 1