上海财经大学成功举办“2025 FAIC 人工智能基础大会”

发布者：严继臧发布时间：2025-12-15浏览次数：12

2025年12月13日至14日，上海财经大学统计与数据科学学院顺利举办了“2025 FAIC人工智能基础大会”。本届大会由上海财经大学统计与数据科学学院、上海财经大学大数据研究院与统计之都联合主办。会议汇聚了近一百位来自清华大学、北京大学、上海交通大学、复旦大学、中国人民大学、香港大学、香港中文大学（深圳）、西安交通大学等海内外顶尖高校的专家学者及博士生参会，以及字节跳动、明汯投资、数启寰宇等业界专家，共同聚焦大模型、人工智能理论、强化学习等关键领域的前沿进展，深度探讨技术的边界与未来。

大会组织筹备工作由上海财经大学滕佳烨、清华大学吕凯风、香港城市大学马梓业以及统计之都魏太云共同完成。FAIC人工智能基础大会脱胎于人工智能基础线上研讨班（FAI-Seminar）。此前，FAI-Seminar已成功举办三年，累计开展70余场线上学术讲座，观看人次超过35万。今年，大会从线上走到线下，旨在进一步增强青年学者间的相互交流。会议不仅关注眼前的实际应用，更关心学科的未来发展；不仅谈论具体的工程实现，更追问背后的理论基础。

在12月13日上午的报告中，清华大学李建老师首先带来题为《Understanding LLM Behaviors via Compression: Data Generation, Knowledge Acquisition and Scaling Laws》的报告，他从压缩与预测的经典关系出发，深入解析了大模型的Scaling Laws及幻觉现象。随后，中国人民大学刘勇老师发表了题为《Transformer以及架构设计：从能量的视角观察》的演讲，从统计物理能量视角构建新框架，提出自注意力机制本质是最小化Helmholtz自由能的过程。上海交通大学李帅老师在《扩散模型采样过程及训练动态分析》的报告中，重点分析了如何从采样过程与训练动态入手提升模型的效率。清华大学陈乐偲同学则分享了《极小极大优化问题的高阶加速》的最新研究，介绍了打破算法收敛率下界的高阶算法。

12月13日下午的会议中，香港中文大学（深圳）孙若愚老师首先报告了《神经网络Hessian阵的特性及其对大模型算法设计的启示》，基于对Hessian阵的分析引入了更高效的Adam-mini优化器。清华大学袁洋老师带来了《基于拓扑斯理论的大规模软件辅助生成框架》，展示了如何利用拓扑斯理论实现大规模软件系统的并行生成与细粒度控制。香港大学邹荻凡老师在《On the Mechanism Interpretability of LLM for Fine-tuning and Reasoning》报告中，揭示了强化学习与微调在大模型推理中截然不同的作用机理。北京大学钟涵同学随后进行了题为《Principled Reinforcement Learning and its Role in Large Language Models》的演讲，介绍了广义Eluder系数在刻画决策问题统计复杂度中的关键作用。

12月14日上午的会议中，西安交通大学常象宇老师首先分享了《基于大规模合作博弈的数据要素估值方法》，探讨了在MaaS场景下如何利用合作博弈理论解决数据要素的公平分配问题。北京大学张辉帅老师介绍了题为《AdamS: Momentum Itself Can Be A Normalizer for LLM Pretraining and Post-training》的研究，提出了一种无需二阶矩估计的高效优化器AdamS。上海交通大学张林峰老师在《基于扩散大语言模型的推理加速》中，详细讨论了扩散大语言模型的缓存策略、解码策略及变长生成方法。最后，清华大学陈焕然博士报告了《Unveiling the Basin-Like Loss Landscape in Large Language Models》，深入分析了大模型损失景观中“盆地”结构的形成及其对模型能力的意义。

本次大会充分体现了人工智能基础研究的多学科交叉特色，为海内外青年学者及博士生提供了宝贵的学习与交流机会。会议现场学术氛围浓厚，每场报告结束后都引发了深入讨论。主办方希望通过本次研讨会搭建更高水平的学术交流平台，汇聚青年力量、促进思想碰撞，共同探索人工智能发展的新方向与新机遇。

主办单位： 上海财经大学统计与数据科学学院、上海财经大学大数据研究院、统计之都、人工智能基础研究

赞助伙伴： 字节跳动 Seed 团队、明汯投资、上海数启寰宇人工智能科技有限公司

图文 | FAIC会务组