在强化学习中，智能体（Agent）的目标是？ - 考试宝

单选题在强化学习中，智能体（Agent）的目标是？

A、最大化累积奖励

B、最小化累积奖励

C、最大化即时奖励

D、最小化即时奖励

下载APP答题

由4l***4o提供分享举报纠错

相关试题

单选题支持向量机（SVM）通过什么将数据划分为不同的类别？

A、寻找最优的线性边界(超平面)

B、构建决策树

C、聚类中心

D、最近的邻居

单选题以下哪个是循环神经网络（RNN）的主要问题？

A、难以处理长序列

B、计算复杂度高

C、无法处理文本数据

D、模型结构过于简单

单选题在机器学习中，过拟合现象指的是？

A、模型对训练数据拟合得很好,但对新数据泛化能力差

B、模型对训练数据拟合得不好

C、训练数据量过少

D、模型参数过多

单选题监督学习与无监督学习的主要区别在于：

A、监督学习需要标签数据,无监督学习不需要

B、监督学习使用神经网络,无监督学习使用决策树

C、监督学习处理分类问题,无监督学习处理回归问题

D、监督学习适用于小数据,无监督学习适用于大数据

单选题当使用决策树进行分类时，以下哪种指标可用于选择最优的划分特征？

A、信息增益

B、均方误差

C、余弦相似度

D、欧氏距离

单选题在提供对抗网络（GAN）中，包含哪两个主要的网络？

A、提供器和判别器

B、编码器和解码器

C、前馈网络和反馈网络

D、卷积网络和循环网络

单选题决策树算法是一种什么类型的机器学习算法？

A、监督学习算法

B、无监督学习算法

C、强化学习算法

D、半监督学习算法

单选题在K近邻（KNN）算法中，K值的选择对模型性能有重要影响。当K值较小时，模型

A、容易过拟合

B、容易欠拟合

C、对噪声不敏感

D、泛化能力强