单选题 (单选题,0.5分)下列选项中,关于KNN算法说法不正确是:( )。
A、 效率很高
B、 默认使用欧氏距离度量
C、 实现过程相对简单,但是可解释性不强
D、 能找出与待预测样本相近的K个样本
单选题 (单选题,0.5分)在误差逆传播算法中,隐含层节点的误差信息应当:
A、 根据所有输出层神经元的误差的均值计算
B、 根据自身下游神经元的误差的均值计算
C、 根据自身下游神经元的误差进行加权计算
D、 根据自身的期望输出和实际输出的差值计算
单选题 (单选题,0.5分)假设男生用1表示,女生用0表示,某人的性别未填,应该如何处理?
A、 填0
B、 可根据其它信息(如身高、体重)推测
C、 填1
D、 填均值0.5,必须的
单选题 (单选题,0.5分)某大一男生体检数据中体重值缺失,相对合理的填充值是:
A、 40公斤
B、 60公斤
C、 100公斤
D、 80公斤
单选题 (单选题,0.5分)用于分类与回归应用的主要算法有( )。
A、 K均值法、SOM神经网络
B、 Apriori算法、HotSpot算法
C、 决策树、BP神经网络、贝叶斯
D、 RBF神经网络、K均值法、决策树
单选题 (单选题,0.5分)下列应用场景不属于分类的是( )。
A、 医生根据患者的症状判断所患疾病类型
B、 推广新产品时预测已有客户是否对新产品感兴趣
C、 为了解用户特点,公司将客户分群
D、 对信用卡申请者判断其信誉高低
单选题 (单选题,0.5分)关于集成学习算法的说法正确的是:
A、 一类将已有算法进行整合的算法
B、 一种串行的算法框架
C、 一类全新的数据挖掘算法
D、 一种并行的算法框架
单选题 (单选题,0.5分)在随机森林中,由于采用了Bootstrap采样,因此理论上有多少原始样本没有被选入训练集?
A、 1/4
B、 1/3
C、 1/2
D、 3/4