非结构化数据增强出口预测:基于机器学习与大语言模型
孟庆伟, 钟宁桦, 郝雨桐, 解咪
内容提要:外贸出口在我国经济运行中发挥着“压舱石”作用,尤其在全球经济不确定性上升和外部环境复杂多变现实下,对我国出口的及时与前瞻性判断具有重要意义。本文运用机器学习方法与深度求索(DeepSeek)大语言模型,探究以研报文本为代表的非结构化数据对出口预测的增强作用。研究发现,基于高维结构化数据的机器学习模型在出口预测中表现优于传统时序方法,但其预测能力存在边界。在引入经DeepSeek处理的非结构化文本后,模型的预测精度有显著提升。机制分析表明,大语言模型能从分析师文本中提取隐含的经验性信息,捕捉宏观指标难以反映的前瞻信号,这是非结构化数据提高预测能力的关键。相较常用的情感词典方法,大语言模型在处理长文本时兼具信息密度与情绪识别优势,更能挖掘潜在情绪变化。本研究的预测范式展现出了较强的泛化能力与推广价值,可为政府部门科学研判外贸形势、提升宏观调控的前瞻性提供有益参考。
