单选题 在强化学习中,智能体(Agent)的目标是?

A、 最大化累积奖励
B、 最小化累积奖励
C、 最大化即时奖励
D、 最小化即时奖励
下载APP答题
由4l***4o提供 分享 举报 纠错

相关试题

单选题 支持向量机(SVM)通过什么将数据划分为不同的类别?

A、寻找最优的线性边界(超平面)
B、构建决策树
C、聚类中心
D、最近的邻居

单选题 以下哪个是循环神经网络(RNN)的主要问题?

A、难以处理长序列
B、计算复杂度高
C、无法处理文本数据
D、模型结构过于简单

单选题 在机器学习中,过拟合现象指的是?

A、模型对训练数据拟合得很好,但对新数据泛化能力差
B、模型对训练数据拟合得不好
C、训练数据量过少
D、模型参数过多

单选题 监督学习与无监督学习的主要区别在于:

A、监督学习需要标签数据,无监督学习不需要
B、监督学习使用神经网络,无监督学习使用决策树
C、监督学习处理分类问题,无监督学习处理回归问题
D、监督学习适用于小数据,无监督学习适用于大数据

单选题 当使用决策树进行分类时,以下哪种指标可用于选择最优的划分特征?

A、信息增益
B、均方误差
C、余弦相似度
D、欧氏距离

单选题 在提供对抗网络(GAN)中,包含哪两个主要的网络?

A、提供器和判别器
B、编码器和解码器
C、前馈网络和反馈网络
D、卷积网络和循环网络

单选题 决策树算法是一种什么类型的机器学习算法?

A、监督学习算法
B、无监督学习算法
C、强化学习算法
D、半监督学习算法

单选题 在K近邻(KNN)算法中,K值的选择对模型性能有重要影响。当K值较小时,模型

A、容易过拟合
B、容易欠拟合
C、对噪声不敏感
D、泛化能力强