单选题 关于大数据和数据科学概念混淆的原因,以下哪项最能体现核心问题?
A、高科技企业垄断了数据科学的应用场景
B、基础术语缺乏严格定义和共识
C、统计学方法在科技界的简单移植
D、机器学习算法的快速迭代发展
单选题 统计模型在数据挖掘中的核心作用是什么?
A、直接替代数据挖掘算法完成分类任务
B、通过概率分布刻画数据行为以识别噪声和缺失值
C、仅用于可视化数据分布而不参与建模过程
D、强制要求所有数据必须符合正态分布
单选题 为何Logistic回归系数需要进行反向变换才能解释业务关系?
A、模型假设违反独立同分布条件
B、回归系数采用最小绝对偏差法计算
C、因变量经历了对数变换导致解释复杂化
D、最大似然估计不满足无偏性要求
单选题 关于完全随机缺失(MCAR)的描述,以下哪项是正确的?
A、MCAR的缺失比例通常超过50%
B、MCAR的缺失机制与变量自身或其他变量均无关
C、MCAR必须使用多重插补法进行填补
D、MCAR的备择假设是数据完全随机缺失
单选题 当异常指标作为因变量进行分析时,以下哪项是其核心价值?
A、消除变量共线性影响
B、发现数据分布拐点
C、揭示影响因素与异常的关联关系
D、生成标准化异常评估指数
单选题 时间序列分析中,以下哪项要素描述的是'非固定周期的交替波动'?
A、趋势
B、季节变动
C、循环波动
D、不规则波动
单选题 广义线性模型允许因变量采用哪些测量类型?
A、仅连续型变量
B、仅二分类变量
C、仅计数型变量
D、包含连续、二分类、有序分类、无序分类、计数等多种类型
单选题 后向传播算法属于哪种类型的学习方法?
A、符号主义学习
B、连接主义学习
C、行为主义学习
D、贝叶斯学习