Regularizing and Optimizing LSTM Language Models

信息：文档下载格式为PDF、属性查询10页。

免费下载

简介

"RegularizingandOptimizingLSTMLanguageModels"是一篇研究论文，主要探讨如何通过正则化和优化技术提升LSTM（长短期记忆网络）语言模型的性能。该论文由StephenMerity、NitishShirishKeskar和RichardSocher共同撰写，发表在2017年的国际学习表征会议（ICLR）上。论文的核心贡献包括提出几种有效的正则化方法，如DropConnect和变分Dropout，以减少LSTM模型在训练过程中的过拟合问题。此外，作者还研究了优化策略，如非单调触发器和平均随机梯度下降（ASGD），以提高模型的收敛速度和泛化能力。实验结果表明，这些方法在多个基准数据集（如PennTreebank和WikiText-2）上显著提升了LSTM语言模型的性能。该研究为改进LSTM语言模型的训练效率和效果提供了重要的理论和实践指导，对自然语言处理领域的研究和应用具有重要价值。

声明：本站为网络服务提供者及网络索引服务平台资源索引自网络/用户分享，如有版权问题，请联系我们删除。

不能下载？报告错误

翻页：第8计　暗渡陈仓

Regularizing and Optimizing LSTM Language Models

热门标签