摘要
本说明书涉及机器学习技术领域,具体地公开了一种资源数据分配方法及装置,其中,该方法包括:获取具有用于表征对象风险特征的特征数据的样本集、及标签集;利用预设的特征选择算法计算样本集中对应的多个原始特征中各原始特征的特征权重,并根据各原始特征的特征权重筛选出目标特征集;基于目标特征集、样本集及标签集,构建分类器;各原始特征的特征权重是基于不同样本在各原始特征下的距离确定的;不同样本在各原始特征下的距离是基于内部距离和外部距离计算得到的,内部距离用于表征当前原始特征下两个样本之间的距离,外部距离用于表征其他原始特征对当前原始特征下两个样本之间的距离的影响。上述方法能够提高特征选择的效率和准确率。