• 2024-3-2公告: 重要公告:用户发帖权限更新 气象互助社 2024-3-2
  • 机器学习-随机森林回归(上)

    作者:第八星系-李智 邮箱:lizhi258147369@163.com 1.引言 作者说:鸽了很久的机器学习终于要开始了。由于篇幅、时间和精力等原因,逐句详解版还需要过几天才能制作好。 回归分析属于监督学习方法的一种,主要用于预测连续型目标变量,可以预测、计算趋势以及确定变量之间的关系等。 随机森林回归是一种将多颗决策树 ...

    680
    8
    0
    机器学习-随机森林回归(下)  ...2

    作者:第八星系-李智 邮箱:lizhi258147369@163.com 4.训练模型 首先我们将6个气象要素设置成预测(解释)变量,或者叫特征。 臭氧设置为响应变量,或者叫目标变量。 然后拆分数据集,前70%的数据作为训练集,后30%作为测试集。 接下来,我们查看数据是否符合正态分布。 我们开始训练模型,并查看其平均绝对误差 ...

    1214
    12
    2
    机器学习|数据预处理(一)处理缺失值——以臭氧与气象要素为例  ...2

    作者:第八星系-李智 邮箱:lizhi258147369@163.com 数据的质量及其包含信息的质量是决定机器学习算法学习效果的关键因素。因此有必要对原始数据进行检查与预处理。 当我们用观测数据去构建模型时,不可避免地会遇到缺测数据。简单地忽略这些缺失值,会产生不可预知的后果。因此,在进一步分析数据之前,必须先处理这些 ...

    981
    15
    2
    机器学习|数据预处理(二)将数据集划分为训练集与测试集​——以臭氧与气象要素为例  ...234

    作者:第八星系-李智 邮箱:lizhi258147369@163.com 我们这次使用无缺失值的数据集做演示。 本文使用scikit-learn的model_selection子包中的train_test_split函数将数据集随机划分为独立的训练集与测试集。 01.读入数据 02.检查缺失值 03.最后划分数据集 首先,把数据第1列到第 5 列存储到 NumPy 数组X中,把代表臭 ...

    1466
    38
    2
    机器学习|数据预处理(三)用随机森林评估特征重要性——以臭氧与气象要素为例  ...23456..14

    作者:第八星系-李智 邮箱:lizhi258147369@163.com 我们这次使用无缺失值的数据集做演示。 使用随机森林是一种有用的特征选择方法。随机森林也是一种集成方法。 在随机森林算法中,每棵决策树中都利用特征计算样本切分后的杂质度。计算一个特征在所有决策树上杂质度的平均,根据平均杂质度衡量特征的重要性,并据此删 ...

    5357
    132
    9
    机器学习|梯度提升树预测臭氧  ...2345

    作者:第八星系-李智 邮箱:lizhi258147369@163.com 注:因为是自己捏造的数据,所以不符合正态分布。 注:数据量少且不符合正态分布,得到这个结果很正常。用实际的数据效果就好了。 微信搜索“第八星系人造大气理论爱好者”公众号,关注获取文章数据 ...

    4966
    45
    1
    机器学习|模型评估和超参数调优(一)使用pipeline方法简化工作流程 ——以臭氧与气象  ...23456..88

    作者:第八星系-李智 邮箱:lizhi258147369@163.com 无论是用于特征缩放的数据标准化,还是用于数据压缩的主成分分析。必须使用在训练数据拟合期间获得的参数来缩放和压缩新数据,比如测试数据集中的样本。 本文将介绍一种非常好用的工具,即 Scikit-Learn中的 Pipeline类。使用 pipeline 类可以拟合一个包含任意数量变 ...

    24251
    876
    0
    ECMWF机器学习路线图2021-2030

    ECMWF 于 2021 年 2 月发布未来十年的机器学习路线图。 Düben, P, Modigliani, U, Geer, A, Siemen, S, Pappenberger, F, Bauer, P, Brown, A, Palkovic, M, Raoult, B, Wedi, N, Baousis, V, 2021, Machine learning at ECMWF: A roadmap for the next 10 years, ECMWF Technical memorandum 878, doi: 10.21957/ge7ckgm ...

    459
    2
    0
    如何在批处理中给文件动态命名  ...23456..12

    前言 很多小伙伴会在批处理中为文件命名发愁 那么 介绍几种简单命名方法以拓展思路 假设我们以日期为文件名字 In [3]: 2023-01-01 2023-01-02 2023-01-03 2023-01-04 2023-01-05 2023-01-06 2023-01-07 2023-01-08 2023-01-09 2023-01-10 方法一 f-string In [4]: 方法二 .format() In [5]: 方法三 % 格式化 In [6]: ...

    气ython风雨 | 2024-4-24
    8246
    110
    0

    QQ|小黑屋|气象互助社 ( 陇ICP备2023004290号|陇ICP备2023004290号 )|网站地图

    Powered by Discuz! X3.5 Licensed© 2001-2024 Discuz! Team.

    返回顶部 返回版块