宏观VS微观VS加权VS样本F1得分

问题描述在sklearn.metrics.f1_core中,F1分数有一个名为"Average"的参数。宏观、微观、加权和样本意味着什么?请详细说明,因为在文档中没有正确解释。或者只需回答以下问题:为什么Samples是多标签分类的最佳参数?为什么微观最适合不平衡的数据集?加权和

发布:2023-01-03 标签:pythonscikit-learnmachine-learningpython-3.xmetrics


如何在SKLEAR决策树中显示特征名称?

问题描述我目前有一个决策树,将功能名称显示为X[index],即X[0],X[1],X[2]等。fromsklearnimporttreefromsklearn.treeimportDecisionTreeClassifierdt=DecisionTreeClassifier()

发布:2023-01-03 标签:pythonscikit-learnmachine-learningpandasdecision-tree


使用CROSS_VALIFY生成混淆矩阵

问题描述我正在尝试找出如何使用CROSS_VALIDATE生成混淆矩阵。我可以用我目前掌握的代码打印出分数。#Instantiatingmodelmodel=DecisionTreeClassifier()#Scoresscoring={'accuracy':make_score

发布:2023-01-03 标签:pythonscikit-learnmachine-learningconfusion-matrixcross-validation


Lightgbm python数据集引用参数是什么意思?

问题描述我正在尝试找出如何用python中的lightgbm来训练gbdt分类器,但与theofficialwebsite中提供的示例混淆了。按照列出的步骤,我发现VALIDATION_DATA不知从何而来,并且不知道VALID_DATA的格式,也不知道使用或不使用它的训练模型的

发布:2023-01-03 标签:machine-learningcross-validationlightgbm


具有n次交叉验证的精度召回曲线显示标准偏差

问题描述我希望生成具有5倍交叉验证的精度-召回曲线,以显示exampleROCcurvecodehere中的标准偏差。下面的代码(改编自HowtoPlotPR-CurveOver10foldsofCrossValidationinScikit-Learn)给出了每一次交叉验证的P

发布:2023-01-03 标签:pythonscikit-learnmachine-learningcross-validationprecision-recall


如何在SkLearning上拆分均衡训练集和测试集上的数据

问题描述我正在使用skLearning执行多分类任务。我需要将所有数据拆分为Train_Set和TestSet。我想从每个班级随机抽取相同的样本号。实际上,我觉得这个功能很有趣X_train,X_test,y_train,y_test=cross_validation.train

发布:2023-01-03 标签:scikit-learnmachine-learningsvmcross-validation


如何在转换要素后使用交叉验证

问题描述我有包含类别值和非类别值的数据集。我对类别值应用了OneHotEncode,对连续值应用了StandardScaler。transformerVectoriser=ColumnTransformer(transformers=[('VectorCat',OneHotEnc

发布:2023-01-03 标签:pythonscikit-learnmachine-learningcross-validation


GridSearchCV没有为xgBoost选择最佳的超参数

问题描述我目前正在使用XgBoost开发一个回归模型。因为xgBoost有多个超参数,所以我用GridSearchCV()添加了交叉验证逻辑。作为试验,我设置了max_depth:[2,3]。我的python代码如下所示。fromsklearn.model_selectionim

发布:2023-01-03 标签:pythonscikit-learnmachine-learningxgboost


如果我使用不同数量的内核,XGBoost会产生相同的结果吗?

问题描述我在两台计算机上安装了完全相同的XGBoost(0.4)版本。这两台机器之间唯一的区别是内存和核心数量(8比16)。使用完全相同的数据,我不能重现相同的结果。它们略有不同(第四、第五位小数)。种子保留为默认值。推荐答案它是高度特定于实现的,但在一般的随机化算法中,并行RA

发布:2023-01-03 标签:pythonmachine-learningpython-2.7xgboost


使用xgBoost绘制要素重要性图

问题描述当我绘制要素重要性图时,我得到了这个杂乱的图。我有超过7000个变量。我知道内置函数只选择最重要的部分,尽管最终的图形不可读。以下是完整的代码:importnumpyasnpimportpandasaspddf=pd.read_csv('ricerice.csv')arr

发布:2023-01-03 标签:pythonmachine-learningmatplotlibxgboostfeature-selection