标签：Datasets

揭秘 FineVideo 数据集构建的背后的秘密

开放视频数据集稀缺，因此减缓了开源视频 AI 的发展。为此，我们构建了 FineVideo，这是一个包含 43,000 个视频的数据集，总时长为 3,400 小时，并带有丰富的...

AI 技术文章

6个月前

Kakao Brain 的开源 ViT、ALIGN 和 COYO 文字

最近 Kakao Brain 在 Hugging Face 发布了一个全新的开源图像文本数据集 COYO，包含 7 亿对图像和文本，并训练了两个新的视觉语言模型 ViT 和 ALIGN ViT 和 A...

AI 技术文章

2年前 (2023)

基于 Hugging Face Datasets 和 Transformers 的图像相似性搜索

通过本文，你将学习使用 🤗 Transformers 构建图像相似性搜索系统。找出查询图像和潜在候选图像之间的相似性是信息检索系统的一个重要用例，例如反向图像搜索 ...

AI 技术文章

2年前 (2023)