多选题 以下关于大模型和小模型的对比描述正确的有哪些选项

A、 使用大模型的数据集训练小模型,小模型也会产生涌现
B、 小模型可以使用思维链技术来提升准确度
C、 行业大模型通常使用微调的方式训练
D、 小模型在部署和使用上更加灵活
下载APP答题
由4l***lc提供 分享 举报 纠错

相关试题

单选题 “从有标签的历史数据中来预测下季度的商铺营收额”,这是一个什么问题?

A、聚类问题
B、回归问题
C、规则问题
D、分类问题

单选题 以下哪一项是张量[[1.21.34][1,5,6 [7.8] [[9.10] [11,12]]]的正确形状?

A、[2,2,3]
B、[3,2,2]
C、[3,2,3]
D、[2,3,2]

单选题 全局梯度下降算法、随机梯度下降算法和批量梯度下降算法均属于梯度下降算法,关于其优缺点,以下哪项描述是错误的

A、全局梯度算法单步计算过程比较耗时
B、随机梯度算法可以找到损失函数的最小值
C、批量梯度算法可以达到局部最优
D、全局梯度算法可能无法找到损失函数的最小值

单选题 在卷积神经网络中,ReLU函数的作用是什么?

A、减少特征图尺寸
B、降低参数量
C、提取图像边缘
D、引入非线性元素

单选题 以下关于机器学习整体流程描述正确的是哪一项?

A、数据收集->数据清洗->特征提取与选择->模型训练->模型评估测试->模型部署与整合
B、数据收集->数据清洗->模型训练->特征提取与选择->模型评估测试->模型部署与整合
C、数据收集->特征提取与选择->数据清洗->模型训练->模型评估测试->模型部署与整合
D、数据收集->数据清洗->特征提取与选择->模型训练->模型部与整合->模型评估测试

单选题 某工程师在学习了深度学习知识后,对DeepSeekV3的模型结构有以下认知,其中错误的是哪一项?

A、MoE结构可以提升推理速度
B、强化学习微调可以对齐人类偏好
C、transformerblock可以提取数据特征
D、位置编码的作用是限制输出序列长度

单选题 以下哪个特性是动态计算图相比静态计算图的主要优势之一?

A、更好的可移植性
B、更高的执行效率
C、更低的内存占用
D、更高的灵活性

单选题 输入一个32x32的图像,用大小为5x5的卷积核进行做步长为一的卷积计算,输出的图像尺寸为以下哪个选项

A、28x23
B、23x23
C、28x28
D、29x29