2025年泰迪杯数据发掘角逐B题论文首发+题目一二三四代码分享

[复制链接]
发表于 2025-9-23 02:22:07 | 显示全部楼层 |阅读模式



基于穿着装备的身材运动监测

择要
随着科技的进步,加速率计,可以大概及时、准确地捕捉人体的动态变化,成为医学应用中的一个重要工具。本文将基于题目网络数据举行干系研究。
针对题目给出的数据集,我们起首举行数据洗濯工作。起首使用df[df.isna().any(axis=1)]筛选含缺失值的行,并对所在行举行删除处置处罚。对于处置处罚后的结果,我们使用通过文献查询的理论存在极值,设定阈值举行非常值判定并删除其所在行。
针对题目一,单一使用时间差计算连续时间消耗资源太大,这里通太过析数据可以看出数据的采样率为100 Hz。因此,我们对末了MET值中不同范例举行计频处置处罚。根据频数推算连续各状态的连续时间。
针对题目二,将处置处罚后的数据集,举行归并为一个完备的数据集作为训练数据集,性别 (Sex)和年岁(Age)为种别变量,加速率计数据作为输入数据,MET值作为输出数据,引入随机丛林回归器、随机丛林、支持向量机、多层感知机、GBDT举行训练模子,并使用RMSE对模子精度举行评估。则取精度最高的模子举行推测。基于得到的结果使用题目二中频数方式计算连续时长。
对于题目三,基于可穿着装备收罗的加速率计数据,旨在对个体就寝状态举行阶段性识别。将所有数据举行汇总,并从中筛选出MET<1.0的数值,包管选取的数据会合包含与就寝干系的丈量。聚类模子对个体就寝阶段举行智能识别,使用肘部法则自动寻优。构建智能识别模子,并举行应用。
针对题目四,基于加速率计数据的久坐举动康健预警方法。以附件2中志愿者加速率计数据作为输入,此中每条记录包含时间戳和经推测得到的MET值(MET_Pred)。通过计算相邻记录推测值的变化量来分别“段”(segment)。设置为清除短时的静止状态,仅思量连续超过30分钟的举动段;久坐状态对应的MET值区间设定为[1.0,1.6]。并提取时域特性对于每个志愿者数据集,依照上述分段和久坐判定规则,识别出所有符合条件的一连久坐段。
关键词:近地小行星轨道推测、开普勒定律、最小二乘法、
5.1 数据预处置处罚

针对题目给出的数据集,我们起首举行数据洗濯工作。起首使用df[df.isna().any(axis=1)]筛选含缺失值的行,并对所在行举行删除处置处罚。对于处置处罚后的结果,我们使用通过文献查询的理论存在极值,设定阈值举行非常值判定并删除其所在行。

5.1.1 形貌性分析


起首,我们使用给出的数据,举行给出数据特性的初步选择。


从图表来看,X、Y和Z轴的颠簸水平有所不同,这大概与志愿者在该时段举行的不同运动范例干系。比方,较大的颠簸通常意味着较为剧烈的运动,而较小的颠簸则大概表明志愿者处于较为静止的状态。
5.1.2 缺失值处置处罚

在本研究中,我们使用可穿着装备收罗的加速率计数据,旨在实现对个体运动状态的及时监测和后续康健举动分析。原始数据存储于CSV格式文件中,此中记录了时间戳和对应的三轴加速率值(X,Y,Z轴),这些数据反映了个体在空间中各个方向上的加速率信息。为包管数据处置处罚的准确性和后续模子的鲁棒性,起首对数据举行预处置处罚。预处置处罚重要包罗:
1.缺失值查抄与洗濯
由于实际收罗过程中大概存在数据丢失或非常情况,通过统计每个变量(time, )的缺失值个数,确定命据中存在缺失的记录。对于出现缺失值的行,采取剔除计谋确保分析数据均为有用观测值。数学上,颠末缺失值处置处罚的数据集记为


2.数据采样
思量到一连收罗的数据样本量巨大,为了降低可视化绘图与后续数据分析的计算本钱,在包管数据团体趋势不丢失的条件下,采取匀称采样计谋。具体方法为每隔固定步长(比方每100个样本取一个数据点),构造采样数据集:



5.1.3 非常值处置处罚

阈值处置处罚:查阅文献,找到理论存在X Y Z方向加速率最大值,将该值设定为阈值超过该数据的认定为非常数据,方便起见直接删除处置处罚。
                       
传感度量程

                       
                       
最大可记录加速率(每轴)

                       
                       
±2g

                       
                       
约 ±2 × 9.8 = ±19.6 m/s²

                       
                       
±4g

                       
                       
约 ±4 × 9.8 = ±39.2 m/s²

                       
                       
±8g

                       
                       
约 ±8 × 9.8 = ±78.4 m/s²

                       
                       
±16g

                       
                       
约 ±16 × 9.8 = ±156.8 m/s²

                       
理论上,根据牛顿第二定律以及地球重力加速率的参考值,常见的加速率值应落于合理范围内。在本研究中,将 
 作为加速率的理论上界(约为 2 倍尺度重力加速率,即 ),以此为阈值检测非常数据。对于任一数据点,当任一方向上的加速率满足:

5.2 统计分析模子

对于题目一,单一使用时间差计算连续时间消耗资源太大,这里通太过析数据可以看出数据的采样率为100 Hz。因此,我们对末了MET值中不同范例举行计频处置处罚。根据频数推算连续各状态的连续时间。
5.2.1 运动时长计量

针对每个志愿者(标识为P001至P100)的数据文件,本研究起首使用数据读取工具导入CSV数据,此中至少包含一个形貌运动范例的"annotation"列。借助正则表达式提取每条记录中的MET数值,确保后续分类操纵的准确性。
在分析过程中,将每个运动注解的出现频次视为该运动连续的时间片断。假定命据的采样率为 100 Hz ,即每 100 个一连记录视为 1 秒内的采样(或换算后为固定的时间长度),从而每个运动范例的频次累计可用于估算总连续时间。用数学表达式表现,若设对某一特定运动范例 
 的出现次数为 
 ,则运动连续时间(单位为秒)为:


                       
范例名称

                       
                       
出现次数

                       
                       
7030 sleeping;MET 0.95

                       
                       
3810002 次

                       
                       
home activity;eating;13030 eating sitting alone or with someone;MET 1.5

                       
                       
74004 次

                       
                       
home activity;household chores;preparing meals/cooking/washing dishes;5035 kitchen activity general cooking/washing/dishes/cleaning up;MET 3.3

                       
                       
954511 次

                       
                       
home activity;miscellaneous;sitting;11580 office work such as writing and typing (with or without eating at the same time);MET 1.5

                       
                       
144105 次

                       
                       
home activity;miscellaneous;sitting;9055 sitting/lying talking in person/using a mobile phone/smartphone/tablet or talking on the phone/computer (skype chatting);MET 1.5

                       
                       
308709 次

                       
                       
home activity;miscellaneous;sitting;9060 sitting/lying reading or without observable/identifiable activities;MET 1.3

                       
                       
338112 次

                       
                       
home activity;miscellaneous;standing;9050 standing talking in person on the phone/computer (skype chatting) or using a mobileo phone/smartphone/tablet;MET 1.8

                       
                       
7501 次

                       
                       
home activity;miscellaneous;standing;9050 standing talking in person/on the phone/computer (skype chatting) or using a mobile phone/smartphone/tablet;MET 1.8

                       
                       
49103 次

                       
                       
ID

                       
                       
TotalTime

                       
                       
SleepTime

                       
                       
HighIntensityTime

                       
                       
ModerateIntensityTime

                       
                       
LowIntensityTime

                       
                       
StaticActivityTime

                       
                       
P001

                       
                       
24.7159

                       
                       
10.5833

                       
                       
0

                       
                       
3.7303

                       
                       
3.0009

                       
                       
7.4013

                       
                       
P002

                       
                       
16.1406

                       
                       
6.25

                       
                       
0.3567

                       
                       
1.1702

                       
                       
1.8108

                       
                       
6.5529

                       
                       
P003

                       
                       
20.5242

                       
                       
6.6667

                       
                       
0

                       
                       
6.7723

                       
                       
2.7376

                       
                       
4.3476

                       
                       
P004

                       
                       
18.9362

                       
                       
6.5

                       
                       
0

                       
                       
2.5809

                       
                       
3.1359

                       
                       
6.7194

                       
                       
P005

                       
                       
17.0661

                       
                       
4.3333

                       
                       
0

                       
                       
1.8884

                       
                       
3.9005

                       
                       
6.9439

                       



可以直观地看出各个受试者或各个时间段之间的MET差别。下方的柱状图则展示了不同强度运动时长的对比情况,橙色、赤色、蓝色等不同颜色柱状分别代表高强度、中强度、低强度、静态或就寝等种别,由此可以观察每个受试者或不同时间段内各运动范例所占用的时间比例,
5.3 MET 值估计模子

将处置处罚后的数据集,举行归并为一个完备的数据集作为训练数据集,性别 (Sex)和年岁(Age)为种别变量,加速率计数据作为输入数据,MET值作为输出数据,引入随机丛林回归器、随机丛林、支持向量机、多层感知机、GBDT举行训练模子,并使用RMSE对模子精度举行评估。则取精度最高的模子举行推测。基于得到的结果使用题目二中频数方式计算连续时长。





免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

×
登录参与点评抽奖,加入IT实名职场社区
去登录
快速回复 返回顶部 返回列表