单选题 数据离散化的常见方法不包括:
A、分箱
B、聚类分析
C、独热编码
D、直方图分析
单选题 以下哪种可视化方法最适合展示两个数值变量之间的关系?
单选题 两个数值型属性的相异性度量最适合使用:
A、Jaccard系数
B、余弦相似度
C、欧氏距离
D、简单匹配系数
单选题 处理缺失值时,以下哪种方法属于确定性填充?
A、删除包含缺失值的记录
B、用属性的均值填充
C、使用回归模型预测填充
D、使用EM算法估计填充
单选题 下列哪种数据属性类型不具备顺序和数学运算性质?
A、标称属性
B、序数属性
C、区间属性
D、比率属性
单选题 箱线图(Box plot)不能反映以下哪种数据特征?
A、数据分布偏态
B、离群点
C、众数位置
D、数据分散程度
单选题 在计算相似度时,对于二元属性中的非对称情况,应使用:
A、简单匹配系数
B、Jaccard系数
C、余弦相似度
D、曼哈顿距离