更新时间: 试题数量: 购买人数: 提供作者:

有效期: 个月

章节介绍: 共有个章节

收藏
搜索
题库预览
某医疗机构计划引入智能医疗系统,以提升诊断效率和准确性。通过分析患者的历史数据,使用机器学习算法预测患者的健康风险,从而辅助医生进行诊断和治疗。为此,该机构需要设计一套全面的业务数据处理流程,确保数据处理的高效性和准确性,为人工智能模型提供可靠的输入数据。 我们提供一个患者数据集(patient_data.csv),包含以下字段: - PatientID: 患者ID - Age: 年龄 - BMI: 体重指数 - BloodPressure: 血压 - Cholesterol: 胆固醇水平 - DaysInHospital: 住院天数 你作为人工智能训练师,根据提供的数据集和Python代码框架(1.1.1.ipynb),完成以下数据的统计和分析,为智能医疗系统提供可靠的数据支持。 (1)通过补全并运行Python代码(1.1.1.ipynb)分别统计住院天数超过7天的患者数量以及其占比。这类患者被定义为高风险患者,反之为低风险患者。将上述统计结果截图以JPG的格式保存,命名为“1.1.1-1”。 (2)通过补全并运行Python代码(1.1.1.ipynb)统计不同BMI区间中高风险患者的比例和统计不同BMI区间中的患者数。BMI区间分类设置为:偏瘦(低于18.5),正常(18.5~23.9),超重(24.0~27.9),肥胖(28.0及以上),将上述统计结果截图以JPG的格式保存,命名为“1.1.1-2”。 (3)通过补全并运行Python代码(1.1.1.ipynb)统计不同年龄区间中高风险患者的比例和统计不同年龄区间中的患者数。年龄区间分类设置为:≤25岁,26-35岁,36-45岁,46-55岁,56-65岁,>65岁,将上述统计结果截图以JPG的格式保存,命名为“1.1.1-3”。 所有结果文件储存在桌面新建的考生文件夹中,文件夹命名为“准考证号+身份证号后六位”。 3.技能要求 (1)能结合人工智能技术要求和业务特征,设计整套业务数据处理流程; 4.质量指标 (1)设计出的业务数据底层逻辑清晰,有效合理。 (含图)(含图)
智能农业系统中的业务数据采集和处理流程设计 考核时间:30min 场地设备要求:人工智能训练师主机:CPU(intel i5及以上)、内存(不少于16GB)、操作系统(windows10)、支持深度学习训练。 工作任务:某农业公司计划引入智能农业系统,通过安装在农田中的各种传感器(如温度传感器、湿度传感器、土壤传感器等)实时监控农田环境,收集数据并进行分析,以优化作物管理和提高产量。为此,公司需要设计并实现一套数据采集和处理流程,确保数据的高效采集、传输和处理,为智能分析提供可靠的数据支持。 我们提供一个传感器数据集(sensor_data.csv),包含以下字段: ● SensorID:传感器ID ● Timestamp:时间戳 ● SensorType:传感器类型(Temperature温度,Humidity湿度,SoilMoisture土壤水分,SoilPH土壤酸碱度,Light光传感器) ● Value:传感器读数 ● Location:传感器安装位置: 你作为智能农业系统的人工智能训练师,根据提供的sensor_data.csv数据集和Python代码框架(1.1.2.ipynb),完成以下数据的采集和处理任务,为智能农业系统提供可靠的数据支持。请按照以下要求完成任务,确保结果准确并保存相应的截图。 (1)传感器数据统计: 通过补全并运行Python代码(1.1.2.ipynb)分别统计每种传感器的数据数量和平均值。将上述统计结果截图以JPG的格式保存,命名为“1.1.2-1”。 (2)按位置统计温度和湿度数据: 通过补全并运行Python代码(1.1.2.ipynb)统计每个位置的温度和湿度传感器数据的平均值。将上述统计结果截图以JPG的格式保存,命名为“1.1.2-2”。 (3)数据清洗和异常值处理: 通过补全并运行Python代码(1.1.2.ipynb)对数据进行清洗,处理异常值。具体要求如下: ➢ 将明显异常的温度(< -10或> 50)和湿度(< 0或> 100)数据进行标记并统计。 ➢ 对缺失值使用前面数据的值(如果前面值没有采用后面数据的值)进行填补。 ➢ 将清洗后的数据保存为新文件cleaned_sensor_data.csv。 所有结果文件储存在桌面新建的考生文件夹中,文件夹命名为“准考证号+身份证号后六位”。 技能要求: (1)能结合人工智能技术要求和业务特征,设计整套业务数据采集流程 (2)能结合人工智能技术要求和业务特征,设计整套业务数据处理流程 质量指标: (1)设计出的业务数据底层逻辑清晰,有效合理。 (2)数据完整性:每个传感器数据记录数应完整,缺失值尽量少。 (3)数据准确性:传感器数据应合理,与参考数据偏差小。 【缺少答案,请补充】(含图)(含图)
请完成智能农业系统中的业务数据采集和处理流程设计,具体要求如下: (1)按传感器类型统计数据数量和平均值: 通过补全并运行Python代码(1.1.2.ipynb)对传感器类型的数据进行分组,计算每个组的数据数量和平均值。将上述统计结果截图以JPG的格式保存,命名为“1.1.2-1”。 (2)按位置统计温度和湿度数据: 通过补全并运行Python代码(1.1.2.ipynb)统计每个位置的温度和湿度传感器数据的平均值。将上述统计结果截图以JPG的格式保存,命名为“1.1.2-2”。 (3)数据清洗和异常值处理: 通过补全并运行Python代码(1.1.2.ipynb)对数据进行清洗,处理异常值。具体要求如下: ➢ 将明显异常的温度(< -10 或 > 50)和湿度(< 0 或 > 100)数据进行标记并统计。 ➢ 对缺失值使用前面数据的值(如果前面值没有采用后面数据的值)进行填补。 ➢ 将清洗后的数据保存为新文件cleaned_sensor_data.csv。 所有结果文件储存在桌面新建的考生文件夹中,文件夹命名为“准考证号+身份证号后六位”。 3.技能要求 (1)能结合人工智能技术要求和业务特征,设计整套业务数据采集流程 (2)能结合人工智能技术要求和业务特征,设计整套业务数据处理流程 4.质量指标 (1)设计出的业务数据底层逻辑清晰,有效合理。 (2)数据完整性:每个传感器数据记录数应完整,缺失值尽量少。 (3)数据准确性:传感器数据应合理,与参考数据偏差小。(含图)(含图)(含图)
请完成金融机构信用评估系统中的业务数据审核流程设计,具体要求如下: 某金融机构计划引入智能信用评估系统,通过分析客户的历史交易数据和信用记录,使用机器学习算法预测客户的信用风险等级,从而辅助贷款审批和风险控制。为了确保数据的准确性和可靠性,该机构需要设计并实现一套全面的业务数据审核流程,确保数据在进入信用评估系统之前经过严格的审核和清洗。 我们提供一个客户信用数据集(credit_data.csv),包含以下字段: ● CustomerID: 客户ID ● Name: 客户姓名 ● Age: 年龄 ● Income: 收入 ● LoanAmount: 贷款金额 ● LoanTerm: 贷款期限(月) ● CreditScore: 信用评分 ● Default: 是否违约(0: 否,1: 是) ● TransactionHistory: 历史交易记录(JSON格式) 你作为人工智能训练师,根据提供的credit_data.csv数据集和Python代码框架(1.1.3.ipynb),完成以下数据的审核和处理任务,确保数据的准确性和可靠性。请按照以下要求完成: 1. 审核数据完整性:检查是否存在缺失值,对缺失值进行填补。 2. 审核数据准确性:检查是否存在异常值,对异常值进行标记和处理。 3. 审核数据一致性:检查是否存在数据格式不一致的问题,对格式不一致的数据进行标准化处理。 4. 保存审核后的数据:将审核后的数据保存为新的CSV文件,文件名为“审核后_credit_data.csv”。 5. 输出审核结果:输出审核过程中发现的问题和处理结果。
试题名称:电商平台用户行为分析系统的数据采集与处理流程设计 考核时间:30min 1.场地设备要求 人工智能训练师主机:CPU(intel i5及以上)、内存(不少于16GB)、操作系统(windows10)、支持深度学习训练; 2.工作任务 某电商平台希望通过用户行为数据分析,了解用户购物习惯、购买倾向等,从而优化产品推荐系统,提高用户满意度和销售额。作为数据分析师,您需要设计一套全面的业务数据采集与处理流程,确保数据在进入用户行为分析系统之前经过严格的采集、清洗和预处理。 我们提供一个用户行为数据集(user_behavior_data.csv),包含以下字段: ● UserID: 用户ID ● UserName: 用户名 ● Age: 年龄 ● Gender: 性别(Male/Female) ● Location: 位置 ● LastLogin: 上次登录时间 ● PurchaseAmount: 购买金额 ● PurchaseCategory: 购买类别(例如,电子产品、服装、食品等) ● ReviewScore: 用户评价评分(1-5) ● LoginFrequency: 登录频率(每日、每周、每月) 你作为人工智能训练师,根据提供的user_behavior_data.csv数据集和Python代码框架(1.1.4.ipynb),完成以下数据的采集与处理任务,确保数据的准确性和可靠性。请按照以下要求完成任务,确保结果准确并保存相应的截图。 (1)数据采集: 通过运行Python代码(1.1.4.ipynb),从本地文件user_behavior_data.csv中读取数据,并将数据加载到DataFrame中。打印前5条数据。 (2)数据清洗与预处理: 通过运行Python代码(1.1.4.ipynb)对数据进行清洗和预处理,具体要求如下: ● 处理缺失值:对缺失值进行填充或删除。 ● 数据类型转换:确保每个字段的数据类型正确。 ● 处理异常值:删除不合理的年龄、购买金额和评价评分。 ● 数据标准化:对购买金额和评价评分进行标准化处理。 清洗后的数据保存为新文件cleaned_user_behavior_data.csv。 (3)数据统计: 通过运行Python代码(1.1.4.ipynb),完成以下数据统计任务: ● 统计每个购买类别的用户数。 ● 统计不同性别的平均购买金额。 ● 统计不同年龄段的用户数(18-25岁、26-35岁、36-45岁、46-55岁、56-65岁、65岁以上)。 将统计结果分别截图以JPG的格式保存,分别命名为“1.1.4-1”、“1.1.4-2”、“1.1.4-3”。 所有结果文件储存在桌面新建的考生文件夹中,文件夹命名为“准考证号+身份证号后六位”。 3.技能要求 (1)能结合人工智能技术要求和业务特征,设计整套业务数据采集流程 (2)能结合人工智能技术要求和业务特征,设计整套业务数据处理流程 4.质量指标 (1)完整性指标:数据集中无缺失值和重复记录。 (2)合理性指标:所有数据点符合业务规则,无异常值存在。 (3)清洗效果指标:清洗后的数据集完整、合理,且适于建模分析。 (缺图)
某智能交通系统希望通过车辆的行驶数据,利用人工智能技术进行交通流量预测和拥堵预警。你作为人工智能训练师,需要设计一套全面的业务数据采集、处理和审核流程,确保数据在进入交通流量分析系统之前经过严格的采集、清洗、审核和预处理。这里提供一个车辆行驶数据集(vehicle_traffic_data.csv),包含以下字段: ● VehicleID: 车辆ID ● DriverName: 驾驶员姓名 ● Age: 年龄 ● Gender: 性别(Male/Female) ● Speed: 车速(km/h) ● TravelDistance: 行驶距离(km) ● TravelTime: 行驶时间(min) ● TrafficEvent: 交通事件(Normal, Accident, Traffic Jam, Breakdown) 你作为人工智能训练师,根据提供的vehicle_traffic_data.csv数据集和Python代码框架(1.1.5.ipynb),完成以下数据的采集、处理和审核任务,确保数据的准确性和可靠性。请按照以下要求完成任务,确保结果准确并保存相应的截图。 (1)数据采集: 通过运行Python代码(1.1.5.ipynb),从本地文件vehicle_traffic_data.csv中读取数据,并将数据加载到DataFrame中。显示前5行数据截图以JPG的格式保存,命名为“1.1.5-1”。 (2)数据清洗与预处理: 通过运行Python代码(1.1.5.ipynb)对数据进行清洗和预处理,具体要求如下: ● 处理缺失值:对缺失值进行删除。 ● 数据类型转换:确保每个字段的数据类型正确。 ● 处理异常值:删除不合理的年龄、车速、行驶距离和行驶时间。 清洗后的数据保存为新文件cleaned_vehicle_traffic_data.csv。 (3)数据合理性审核:通过运行Python代码审核以下字段的合理性: ● 年龄:应在18到70岁之间。 ● 车速:应在0到200 km/h之间。 ● 行驶距离:应在1到1000 km之间。 ● 行驶时间:应在1到1440分钟(24小时)之间。 对不合理的数据进行标记,并将审核结果截图以JPG的格式保存,命名为“1.1.5-2”。 (4)数据统计: 通过运行Python代码(1.1.5.ipynb),完成以下数据统计任务: ● 统计每种交通事件的发生次数。 ● 统计不同性别的平均车速、行驶距离和行驶时间。 ● 统计不同年龄段的驾驶员数(18-25岁、26-35岁、36-45岁、46-55岁、56-65岁、65岁以上)。 将统计结果分别截图以JPG的格式保存,分别命名为“1.1.5-3”、“1.1.5-4”、“1.1.5-5”。 所有结果文件储存在桌面新建的考生文件夹中,文件夹命名为“准考证号+身份证号后六位”。 3.技能要求 (1)能结合人工智能技术要求和业务特征,设计整套业务数据采集流程; (2)能结合人工智能技术要求和业务特征,设计整套业务数据处理流程; (3)能结合人工智能技术要求和业务特征,设计整套业务数据审核流程; 4.质量指标 (1)数据完整性:数据无缺失,每项记录完整。 (2)数据合理性:所有数值在合理范围内,无异常点。 (3)数据一致性:字段类型正确,数据格式统一。 (4)分析准确性:统计结果反映真实数据分布,无偏差。 (缺图)
智慧交通中燃油效率模型的数据清洗和标注流程设计 考核时间:20min 1.场地设备要求 (1)人工智能训练师主机 1 台; (2)Python 编译环境; (3)汽车燃油效率数据集(auto-mpg.csv); 2.工作任务 在现代交通中,燃油效率(MPG)是衡量汽车性能和交通系统优化的重要指标之一。高效的燃油利用不仅能够降低车辆运营成本,还能减少碳排放,促进环保。开发一个用于预测汽车燃油效率的模型可以帮助智慧交通系统优化路线规划和车辆调度,从而提升整体交通效率和减少能源消耗。此外,这样的模型还可以帮助消费者做出更明智的购车决策,并帮助厂商优化汽车设计。 现要求根据提供的汽车燃油效率数据集,补全2.1.1.ipynb代码。选择合适的特征,开发一个燃油效率预测模型。在开发预测模型之前,首先要对数据进行数据清洗和标注,请完成下面的数据预处理任务,并设计一套标注流程规范: (1)正确加载数据集,并显示前五行的数据及数据类型。 (2)检查数据集中的缺失值并删除缺失值所在的行。 (3)将“horsepower”列转换为数值类型,并处理转换中的异常值。 (4)对数值型数据进行标准化处理,确保数据在同一量纲下进行分析。 (5)根据业务需求和数据特性,选择对燃油效率预测最有用的特征:选择以下特征:'cylinders'、'displacement'、'horsepower'、'weight'、'acceleration'、'model year'、'origin' (6)将“mpg”设为目标变量并标注; (7)对数据进行标注和划分;
智慧交通中燃油效率模型的数据清洗和标注流程设计 1. 场地设备要求 (1) 人工智能训练师主机 1 台; (2) Python 编译环境; (3) 汽车燃油效率数据集(auto-mpg.csv); 2. 工作任务 在现代交通中,燃油效率(MPG)是衡量汽车性能和交通系统优化的重要指标之一。高效的燃油利用不仅能够降低车辆运营成本,还能减少碳排放,促进环保。开发一个用于预测汽车燃油效率的模型可以帮助智慧交通系统优化路线规划和车辆调度,从而提升整体交通效率和减少能源消耗。此外,这样的模型还可以帮助消费者做出更明智的购车决策,并帮助厂商优化汽车设计。 现要求根据提供的汽车燃油效率数据集,补全2.1.1.ipynb代码。选择合适的特征,开发一个燃油效率预测模型。在开发预测模型之前,首先要对数据进行数据清洗和标注,请完成下面的数据预处理任务,并设计一套标注流程规范: (1) 正确加载数据集,并显示前五行的数据及数据类型。 (2) 检查数据集中的缺失值并删除缺失值所在的行。 (3) 将“horsepower”列转换为数值类型,并处理转换中的异常值。 (4) 对数值型数据进行标准化处理,确保数据在同一量纲下进行分析。 (5) 根据业务需求和数据特性,选择对燃油效率预测最有用的特征:选择以下特征:'cylinders'、'displacement'、'horsepower'、'weight'、'acceleration'、'model year'、'origin' (6) 将“mpg”设为目标变量并标注; (7) 对数据进行标注和划分; (8) 保存处理后的数据,并命名为:2.1.1_cleaned_data.csv,保存到考生文件夹; (9) 制定数据清洗和标注规范,将答案写到答题卷文件中,答题卷文件命名为“2.1.1.docx”,保存到考生文件夹; (10) 将以上代码以及运行结果,以html格式保存并命名为2.1.1.html,保存到考生文件夹,考生文件夹命名为“准考证号+身份证后6位”。 3. 技能要求 (1)能结合人工智能技术要求和业务特征,设计数据清洗和标注流程; (2)能结合人工智能技术要求和业务特征,制定数据清洗和标注规范。 4. 质量指标 (1)深入理解业务,训练符合业务需求的模型(含图)(含图)(含图)(含图)(含图)
在应对气候变化的背景下,了解和促进低碳生活行为变得越来越重要。现要求根据提供的“大学生低碳生活行为的影响因素数据集”,选择合适的特征,开发一个预测大学生低碳生活行为的模型。提供的数据集样本数据包含300多个关于大学生低碳生活行为的自变量和因变量。自变量为主观规范、知觉行为控制、低碳行为态度,中介变量为行为意愿,因变量为低碳生活行为。同时,性别、生源地、月生活费作为控制变量进行研究。在开发预测模型之前,首先要对数据进行数据清洗和标注。补全2.1.2.ipynb代码。完成下面的数据预处理任务,并设计一套标注流程规范: (1)正确加载数据集,并显示前五行的数据; (2)检查数据集中的缺失值,使用删除包含缺失值的行的办法处理,记录缺失值处理后的数据行数; (3)检查数据集中的重复值并删除所有重复值,并记录删除的行数; (4)对数值型数据进行标准化处理,确保数据在同一量纲下进行分析; (5)根据业务需求和数据特性,选择对低碳生活行为预测最有用的特征,将“低碳行为积极性”设为目标变量并标注。选择以下特征: 1.您的性别○男性 ○女性 2.您的年级○大一 ○大二 ○大三 ○大四 3.您的生源地○农村 ○城镇(乡镇) ○地县级城市 ○省会城市及直辖市 4.您的月生活费○≤1,000元 ○1,001-2,000元 ○2,001-3,000元 ○≥3,001元 5.您进行过绿色低碳的相关生活方式吗? 6.您觉得“低碳”,与你的生活关系密切吗? 7.低碳生活是否会成为未来的主流生活方式? 8.您是否认为低碳生活会提高您的生活质量? (6)对数据进行划分(8:2); (7)保存处理后的数据,并命名为:2.1.2_cleaned_data.csv,保存到考生文件夹; (8)制定数据清洗和标注规范,将答案写到答题卷文件中,答题卷文件命名为“2.1.2.docx”,保存到考生文件夹; (9)将以上代码以及运行结果,以html格式保存并命名为2.1.2.html,保存到考生文件夹,考生文件夹命名为“准考证号+身份证后6位”。 (缺图)
请完成信用评分模型数据清洗和标注流程设计,需满足以下要求: 1. 场地设备要求: (1)人工智能训练师主机1台; (2)Python编译环境; (3)Finance数据集。 2. 工作任务: 互联网金融飞速发展,使得个人金融理财变得越来越容易。而其中信用评分技术是一种对贷款申请人(信用卡申请人)做风险评估分值的统计模型,可以根据客户提供的资料、客户的历史数据、第三方平台数据(芝麻分、京东、微信等),对客户的信用进行评估。现要求根据提供的Finance数据集,选择合适的特征,开发一个申请的评分模型,对未来一段时间内借贷人出现违约的概率进行预测,对客户信用进行评估打分。提供的数据集样本数据一共15000条,10个自变量,1个因变量(SeriousDlqin2yrs)。在开发评分模型之前,首先要对数据进行数据清洗,请补全2.1.3.ipynb代码完成下面的数据预处理任务,并设计一套标注流程规范: (1)正确加载数据集,并显示前五行的数据; (2)检查数据集中的异常值并处理异常值,使用箱线图检测异常值,使用IQR方法处理异常值;设置图像的尺寸为12英寸宽和8英寸高;将画布分成3行4列,总共可以容纳12个子图; (3)检查数据集中的重复值并删除所有重复值,并记录删除的行数; (4)对数据进行归一化处理; (5)创建新的特征IncomeToDebtRatio,MonthlyIncome,并添加到数据集中; (6)将SeriousDlqin2yrs设为目标变量并标注; (7)对数据进行划分; (8)保存处理后的数据,并命名为:2.1.3_cleaned_data.csv,保存到考生文件夹; (9)制定数据清洗和特征工程规范,将答案写到答题卷文件中,答题卷文件命名为“2.1.3.docx”,保存到考生文件夹; (10)将以上代码以及运行结果,以html格式保存并命名为2.1.3.html,保存到考生文件夹,考生文件夹命名为“准考证号+身份证后6位”。 3. 技能要求: (1)能进行数据清洗和特征工程,包括缺失值处理、异常值处理、数据标准化和特征创建; (2)能使用Python编程实现上述数据预处理和特征工程步骤。 4. 质量指标: (1)数据预处理步骤完整,方法选择合理。 (2)代码实现正确,结果符合预期 【缺少答案,请补充】(含图)
随着医学技术的进步和医疗资源的丰富,医疗研究在改善患者治疗效果、提升医疗服务质量方面起到了重要作用。研究人员通过分析大量患者的治疗数据,能够评估不同治疗方案的效果,发现潜在的健康问题,并提出针对性的治疗建议。这不仅可以帮助患者获得更好的治疗效果,还能为医疗机构优化资源配置、提升服务水平提供重要依据。 现提供一份医疗研究数据集,训练集样本数据一共5441条记录。请补全2.1.4.ipynb代码,完成下面的数据预处理任务: 1、加载数据集,查看表的数据类型,表结构和显示每一列的空缺值数量; 2、将“就诊日期”和“诊断日期”规范为“yyyy-mm-dd”格式,并将“病人ID”列名改为“患者ID”,显示修改后的表结构; 3、增加“诊断延迟”(诊断日期-就诊日期)和“病程”(当前日期-诊断日期)两列,删除不合理数据(如负数,年龄为几百岁等); 4、检查数据集中的重复值并删除所有重复值,并记录删除的行数; 5、对数据段[年龄,体重,身高]进行归一化处理; 6、统计不同疾病类型的治疗结果分布,并画出柱状图; 7、分析年龄和疾病严重程度的关系,绘制出散点图; 8、保存处理后的数据,并命名为:2.1.4_cleaned_data.csv,保存到考生文件夹; 9、制定数据清洗和数据标注规范,将答案写到答题卷文件中,答题卷文件命名为“2.1.4.docx”,保存到考生文件夹; 10、将以上代码以及运行结果,以html格式保存并命名为2.1.4.html,保存到考生文件夹,考生文件夹命名为“准考证号+身份证后6位”。 技能要求: (1)能结合人工智能技术要求和业务特征,设计数据清洗和标注流程; (2)能结合人工智能技术要求和业务特征,制定数据清洗和标注规范。 质量指标: (1)深入理解业务,训练符合业务需求的模型。 【缺少答案,请补充】(含图)(含图)