2024年1月3日至1月7日,复杂时间序列分析(高维性、变点、预报与因果性)研讨会在海南省三亚市清华三亚国际数学论坛举办。本次研讨会由清华大学统计学研究中心的李东、加州大学洛杉矶分校的George Michailidis、伦敦政治经济学院的乔兴昊和姚琦伟组织举办。上海社会科学院数量经济研究中心主任朱平芳研究员和纪园园副研究员受邀参加此次会议,中心青年教师及博士研究生一同参加。
本次研讨会主要在统一的框架下,交流最新研究成果的论坛,涵盖以下领域:涵盖高维时间序列分析、时间序列的变点检测、大规模复杂时间序列的预报以及时间序列因果性分析等四个相互关联的领域。此外,它还将作为一个平台,回顾和探索那些通常设计用于独立数据的机器学习技术的应用和/或适应性。
以下是会议摘要:
近年来,数据爆炸式增长给复杂时间序列大数据的现代化统计分析带来了重大挑战,其中包括多重记录、网络序列、树状结构、图像和时变空间数据等。大数据的一个共同特征是异质性,这可能是由随时间和/或空间结构的变化,或来自多个来源的数据而引起的。这类数据的一个自然建模范式假设数据的不同子集(聚类或分段)是同质的,并且子集内的变异可以通过相对简单和稳定的统计模型来描述。分析的挑战在于同质数据子集是未观测到的。这种建模范式具有计算效率高的优势,因为数据子集的模型是可处理的,并且具有灵活性,因为它允许为不同的子集使用不同的模型。此外,它自然地关注于识别数据中最重要的变化和特征。需要面对的挑战包括高维性(因为每个段内的观测次数相对于每个时间点采取的记录数而言相对较小)和变点检测。这两个问题都非常重要,并且由于它们在大数据应用中的重要性,近年来引起了兴趣的快速增长。
近年来,对于大规模和复杂时间序列进行预报也日益显得重要。针对这样的数据,有效的预报技术对于决策、 配置、风险管理和战略规划至关重要。能够预报未来的趋势、识别异常情况、估计大规模复杂时间序列中的不确定事件的能力,可以提供宝贵的洞察力,使组织能够优化运营、降低风险,并提升整体表现。因此,发展传统的基于模型的技术和现代机器学习方法,用于预报大规模复杂时间序列,已成为一个具有深远实际影响的紧迫研究领域。
另一个在大数据领域具有战略意义的研究前沿是因果分析。其目标是识别潜在的导致观察结果的原因,或者生成关于变量之间关系性质的假设。这与相关性分析不同,后者仅识别两个变量之间的关系,而不试图推断因果联系。尽管大多数因果分析工作侧重于独立观察,但因果关系最自然地在时间滞后框架内进行阐述,而对于时间序列的因果分析则涉及初步尝试。应该注意到,这与著名的Granger因果关系不同,后者用于确定一个时间序列是否有助于预报另一个时间序列。
本次研讨会将是交流最新研究成果的论坛,涵盖以下领域:高维与复杂时间序列的建模与预报、时间序列中的变点检测、非欧几里德过程、非平稳空间和/或时间过程、因果时间序列分析。此外,它还将作为一个平台,回顾和探索那些通常设计用于独立数据的机器学习技术的应用和/或适应性。