名称:name' data'未定义(Python)
我正在Python运行此代码,我不知道它总是错误的 import string import nltk from sklearn.pipeline import Pipeline import pandas as pd import nump…
ValueError:在拟合期间在第 2 列中发现未知类别 [nan]
import pandas as pd import matplotlib.pyplot as plt from sklearn.model_selection import train_test_split,cross_val_score from sklearn.tree i…
从现有的 Dataframe 创建一个新的 Dataframe
我有一个数据框,其中包含多个小时内不同患者的各种医学测量(在此示例2中)。例如,数据帧就是这样: patientid hour measurementx measurementy 1 1…
我转换了数据输入,并获得了神经网络模型的权重。如何将转换的权重倒数以获取原始值?
from sklearn.preprocessing import StandardScaler def transpose(m): n = len(m[0]) holder = [] for i in range(n): current = [] holder.append(c…
如何从文本文件中删除不需要的符号
我有一些带有不需要的符号的文本文件,例如 ?~, ?~@?, -?~, ?~H~Z, ?~@~S, ?~@~T, : ?~@~], ?, etc 实际文本: ~@~\SEPA for cards is the next logic…
无法从某些列中删除标点符号,而其他列则可以正常运行
我正在尝试使用标点符号删除函数,它对于某些列工作正常,但对于少数列,它只是将错误作为列名给出。 def remove_punctuations(text): for punctuatio…
如何解决 TypeError: iteration over a 0-d array 和 TypeError: Cannot use a string pattern on a bytes-like object
我正在尝试对我的数据应用预处理步骤。我有 6 个函数来预处理数据,我在预处理函数中调用这些函数。当我用例句一一尝试这些功能时,它就起作用了。 da…
交叉验证过程后 r2 分数下降是否正常? (线性回归模型)
汽车价格预测代码: # importing pandas import pandas as pd import numpy as np from sklearn.preprocessing import StandardScaler from sklearn.…
没有分配概率的 GENSIM LDA 主题
我正在使用 LDA 来发现 BOW 数据集中的主题。当我测试 GENSIM 库的安装时,我发现他们网站上的示例结果没有问题( https://radimrehurek.com/gensim/m…
如何在Python上从文本数据中分离特定数字
我有一个来自 pandas 的数据框: id adress 0 Jame Homie Street. N:60 5555242424 La 1 London. 2322325234243 Stw St. N 8 St.bridge 2 32424244234…
如何连接 +标记化 + TFX 预处理中填充字符串?
我想在 TensorFlow Extended 管道的转换步骤/组件中执行常见的文本预处理步骤。我的数据如下(独立特征中的字符串,标签列中的0/1整数): field1 fie…
如何从图像目录或 csv 文件形成 numpy 数组的元组?
我正在研究一个有关卷积神经网络的项目,但我对使用 Python 还很陌生。不同库的使用让我不知所措。 我将不同的训练图像存储在同一目录中,并创建了一…