使用xgBoost绘制要素重要性图

问题描述当我绘制要素重要性图时,我得到了这个杂乱的图。我有超过7000个变量。我知道内置函数只选择最重要的部分,尽管最终的图形不可读。以下是完整的代码:importnumpyasnpimportpandasaspddf=pd.read_csv('ricerice.csv')arr

发布:2023-01-03 标签:pythonmachine-learningmatplotlibxgboostfeature-selection


标准化 SVM 的特征值

问题描述我一直在玩一些SVM实现,我想知道-将特征值标准化以适应一个范围的最佳方法是什么?(从0到1)I'vebeenplayingwithsomeSVMimplementationsandIamwondering-whatisthebestwaytonormalizefeatu

发布:2022-10-16 标签:rangemachine-learningsvmnormalizationfeature-selection


使用 Scikit-learn 计算信息增益

问题描述我正在使用Scikit-learn进行文本分类.我想针对(稀疏)文档项矩阵中的类计算每个属性的信息增益.IamusingScikit-learnfortextclassification.IwanttocalculatetheInformationGainforeacha

发布:2022-10-16 标签:pythonscikit-learnmachine-learningfeature-selectiontext-classification


scikit learn - 决策树中的特征重要性计算

问题描述我试图了解如何在sci-kitlearn中为决策树计算特征重要性.之前已经问过这个问题,但我无法重现算法提供的结果.例如:fromStringIOimportStringIO从sklearn.datasets导入load_iris从sklearn.tree导入Decisi

发布:2022-10-16 标签:pythonscikit-learndecision-treefeature-selection


最佳找到的 PCA 估计器,用作 RFECV 中的估计器

问题描述这有效(主要来自sklearn的演示示例):Thisworks(mostlyfromthedemosampleatsklearn):print(__doc__)#Codesource:GaëlVaroquaux#ModifiedfordocumentationbyJaqu

发布:2022-10-16 标签:scikit-learnregressionfeature-selectionfeature-extraction


使用嵌套在 GridSearchCV 中的 RFECV 时,如何避免使用 estimator_params?

问题描述我目前正在使用scikit-learn为基于树的方法在网格搜索(GridSearchCV)中进行递归特征消除(RFECV).为此,我使用了GitHub上的当前开发版本(0.17),它允许RFECV使用树方法中的特征重要性来选择要丢弃的特征.I'mcurrentlywork

发布:2022-10-16 标签:scikit-learnfeature-selectiongrid-search


使用 scikit-learn 进行递归特征消除和网格搜索

问题描述我想使用scikit-learn对每个特征子集进行嵌套网格搜索和交叉验证的递归特征消除.从RFECV文档看来,使用estimator_params参数支持这种类型的操作:Iwouldliketoperformrecursivefeatureeliminationwithn

发布:2022-10-16 标签:scikit-learnfeature-selection


在 Scikit Learn 中运行 SelectKBest 后获取特征名称的最简单方法

问题描述我想进行监督学习.直到现在我知道对所有特征进行监督学习.UntilnowIknowtodosupervisedlearningtoallfeatures.不过,我也想对K个最好的特征进行实验.However,Iwouldlikealsotoconductexperimen

发布:2022-10-16 标签:pythonscikit-learnpandasfeature-selection


如何确定 RandomForestClassifier 中的 feature_importances?

问题描述我有一个以时间序列作为数据输入的分类任务,其中每个属性(n=23)代表一个特定的时间点.除了绝对分类结果,我想找出哪些属性/日期对结果的贡献程度.因此,我只是使用feature_importances_,这对我来说效果很好.Ihaveaclassificationtask

发布:2022-10-16 标签:scikit-learnrandom-forestfeature-selection


使用 scikit-learn 进行特征选择

问题描述我是机器学习的新手.我正在准备使用ScikitLearnSVM进行分类的数据.为了选择最佳功能,我使用了以下方法:I'mnewinmachinelearning.I'mpreparingmydataforclassificationusingScikitLearnSVM.

发布:2022-10-16 标签:pythonscikit-learnmachine-learningchi-squaredfeature-selection