Transformers | 第 4 页 | AIHunt | 几百个AI工具导航，国内外AI工具导航大全

使用 🤗 Transformers 进行概率时间序列预测

介绍时间序列预测是一个重要的科学和商业问题，因此最近通过使用基于深度学习而不是经典方法的模型也涌现出诸多创新。ARIMA 等经典方法与新颖的深度学习方...

2年前 (2022)

1. 引言自然语言生成 (即文本生成) 是自然语言处理 (NLP) 的核心任务之一。本文将介绍神经网络文本生成领域当前最先进的解码方法对比搜索 (Contrastive Sea...

2年前 (2022)

1. 引言自然语言生成 (即文本生成) 是自然语言处理 (NLP) 的核心任务之一。本文将介绍神经网络文本生成领域当前最先进的解码方法对比搜索 (Contrastive Sea...

2年前 (2022)

与标准微调相比，SetFit 能更高效地利用训练样本，同时对噪声也更健壮。如何处理少标签或无标签的训练数据是每个数据科学家的梦魇 😱。最近几年来，基于预训...

3年前 (2022)

在 PyTorch 中训练大语言模型不仅仅是写一个训练循环这么简单。我们通常需要将模型分布在多个设备上，并使用许多优化技术以实现稳定高效的训练。Hugging Face...

3年前 (2022)

引言语言模型一直在变大。截至撰写本文时，PaLM 有 5400 亿参数，OPT、GPT-3 和 BLOOM 有大约 1760 亿参数，而且我们仍在继续朝着更大的模型发展。下图总结...

3年前 (2022)

简介近年来，随着以 OpenAI GPT2 模型为代表的基于数百万网页数据训练的大型 Transformer 语言模型的兴起，开放域语言生成领域吸引了越来越多的关注。开放...

5年前 (2020)