人工智能和机器学习改变天气预报的速度远超人们的预期。过去需要运行数小时的数值天气预报(NWP)模型,现在已经有了机器学习天气预报(MLWP)模型的加入,可以在几分钟内生成全球预报。然而,在人工智能预报时代,观测数据的重要性反而更胜以往。即使是最先进的模型,其能力也受到所获取数据的限制。
我们可能会以为更智能的算法能减少对观测的依赖,事实上,人工智能并不能取代高质量观测的需求,反而使其变得更加关键。
高质量的预报离不开高质量的观测
除了依赖于数值天气预报模型分析初始状态的机器学习天气预报模型外,直接观测预测(DOP)模型也成为研究的热点。这类直接观测预测模型无需数据同化或物理机制。仅基于训练数据中观测要素的特征,即可学习并预测大气未来的观测状态。
过去常说“垃圾进,垃圾出”,现在可能要改成:“如果训练目标是垃圾,模型输出的也是垃圾。”要训练一个基于机器学习的天气模型(无论是MLWP还是DOP),其训练目标(即再分析场或观测数据)须具备气象学意义,且质量需达到预报预期标准。
AI 预测中观测的角色正在转变
基于机器学习的气象预报技术的兴起改变了观测数据的使用方式。这些数据如今承担着三大关键功能:
- 训练目标数据. 目标数据的质量和代表性直接决定了机器学习预报所能达到的质量上限。再精妙的模型架构也无法弥补训练目标的缺陷。在机器学习天气预报中,观测数据是再分析数据集的核心成分;而在直接观测预报中,观测数据则直接被用作训练目标。
- 预报因子与推理数据. 在 DOP 模型的训练和业务运行过程中,观测数据必须全面描述大气状态。任何机器学习模型都无法弥补输入数据中缺失的大气特征。在选择合适的数据以最大化其表征能力时,气象专业知识依然不可或缺。
- 验证. 必须将模型输出与相关气象观测数据(如地面观测站数据或无线电探空仪数据)进行比对,以评估预报系统的性能。
速度让实时观测变得至关重要
机器学习模型生成预报的速度远超传统的数值天气预报。例如, 美国国家海洋和大气管理局(NOAA) 新推出的AI驱动全球预报系统AIGFS 仅用0.3%的传统模型计算资源,就能在约40分钟内完成16天的预报。 而欧洲中期天气预报中心(ECMWF)的 AIFS 模型,其计算时间主要消耗在基于数值天气预报的数据同化环节。这些模型都属于机器学习天气预报模型。
由于直接观测预测 模型不包含任何基于数值预报的数据同化过程(这类过程在超级计算机上通常需要运行 40 分钟甚至一小时),整个端到端的预报流程可以在几分钟内完成。这意味着预报的延迟时间不再取决于超级计算机的处理时长,而是取决于观测数据传送至直接观测预测计算过程的延迟。因此,观测·数据的传输速度因此变得比以往更为关键。
我们的观测网络准备好了吗?
随着机器学习模型的发展加速,定期使用新数据和新架构进行再训练将成为常态。这引发了一个关键问题:当前的气象观测网络是否足以满足未来模型的需求?
基于机器学习的天气预报的可靠性直接取决于训练和验证数据集的质量与全面性。为了超越传统数值天气预报的能力,这些数据集必须为模型训练提供可靠且全面的目标数据,并为性能评估提供稳健的基准。
更好的观测,更智能的 AI
核心观点非常明确:人工智能并不会减少对精准观测数据的需求,反而强化了这种需求。虽然保持物理观测的可追溯性仍然是基础,但通过监管良好的人工智能方法,可以最大程度地发挥观测数据在传统数值预报和基于机器学习的天气预报模型中的效用。
人工智能正在加速变革天气预报的方式。而这场变革的根基在于精准的观测能力。我们的观测越精准,人工智能对大气的理解就越深刻;而人工智能对大气的理解越深刻,就越能通过更准确、更及时的预报,更好地保障生命财产安全。
请参阅美国气象学会(AMS)年会上的海报,了解更多详情。: Maximizing the Value of Meteorological Observations in the Age of Artificial Intelligence for Weather Prediction
请阅读我们发表在《国际气象技术》上的最新文章,深入了解这一主题: Smarter forecasts, smarter choices