标签：Hugging Face

Hugging Face 联合 Meta, Scaleway, STATION F启动人工智能创业项目 📢

Hugging Face、Meta、Scaleway 与法国创业孵化基地 STATION F 合作的人工智能创业项目正式启动 📢 🔥 申请截止日期为 12 月 1 日本项目旨在利用开源人工智能的...

1年前 (2023)

Gradio 的目标是使机器学习模型的演示更容易定制和访问，以满足不同用户的需求。在 4.0 正式版的发布活动上，Hugging Face 的 Gradio 团队介绍了自己为了提高...

1年前 (2023)

Tay 等人的 Efficient Transformers taxonomy from Efficient Transformers: a Survey 论文本文由 Teven Le Scao、Patrick Von Platen、Suraj Patil、Yaci...

1年前 (2023)

和大家分享我们的机器学习工程师 Loubna Ben Allal 在 10 月上海 KubeCon 大会的主题演讲题目是：代码生成模型的预训练和微调演讲介绍了构建和训练大型代...

1年前 (2023)

一个幽灵，格式不正确的幽灵，在聊天模型中游荡！太长不看版现存的聊天模型使用的训练数据格式各各不同，我们需要用这些格式将对话转换为单个字符串并传给...

1年前 (2023)

基于 transformer 的编码器-解码器模型是表征学习和模型架构这两个领域多年研究成果的结晶。本文简要介绍了神经编码器-解码器模型的历史，更多背景知识，...

2年前 (2023)

!pip install transformers==4.2.1 !pip install sentencepiece==0.1.95 Vaswani 等人在其名作 Attention is all you need 中首创了基于 transformer 的编码...

2年前 (2023)

在 NLP (Natural Language Processing, 自然语言处理) 领域，ChatGPT 和其他的聊天机器人应用引起了极大的关注。每个社区为构建自己的应用，也都在持续地寻求...

2年前 (2023)

在 PyTorch 中训练大语言模型不仅仅是写一个训练循环这么简单。我们通常需要将模型分布在多个设备上，并使用许多优化技术以实现稳定高效的训练。Hugging Face...

2年前 (2023)

大语言模型 (LLM) 正在席卷整个机器学习世界。得益于其 transformer 架构，LLM 拥有从大量非结构化数据 (如文本、图像、视频或音频) 中学习的不可思议的能力...

2年前 (2023)