深入理解 BigBird 的块稀疏注意力
4## 引言 基于 transformer 的模型已被证明对很多 NLP 任务都非常有用。然而,$$O(n^2)$$ 的时间和内存复杂度 (其中 $$n$$ 是序列长度) 使得在长序列 ($n >...
Transformers.js:Web 上的最新机器学习技术
我们的工程师,Transformers.js 作者Joshua Lochne在2023年11月18日在杭州举办 FEDAY 上带来了主题为「Transformers.js: State-of-the-art Machine Learning ...
携手 MLCommons,制定有效且值得信赖的 AI 安全基准
作者 / 技术与社会部 Anoop Sinha 以及 Google Research、Responsible AI 和以人为本技术团队 Marian Croak 标准基准是衡量重要产品质量的公认方法,存在于许...
保护 ML 供应链,提高 AI 安全透明度
作者 / Google 开源安全团队 (GOSST): Mihai Maruseac、Sarah Meiklejohn、Mark Lodato 消费者和企业几乎每天都会接触到新的 AI 创新和应用。安全构建 AI 是...
使用 LCM LoRA 4 步完成 SDXL 推理
LCM 模型 通过将原始模型蒸馏为另一个需要更少步数 (4 到 8 步,而不是原来的 25 到 50 步) 的版本以减少用 Stable Diffusion (或 SDXL) 生成图像所需的步数...
【论文快读】大型语言模型中的角色扮演者 (Role playing in Large Language Model)
这篇论文简要介绍了“大型语言模型中的角色扮演”,该论文讨论了如何将大型语言模型视为角色扮演者,以更好地理解它们的运作方式。作者强调了大型语言模型与人...
【中文科普】🤗 Hugging Face 与 Intel 共同构建生成式 AI
我们中国地区负责人/ 高级工程师 王铁震受 Intel OpenVINO的邀请 与英特尔AI软件工程师杨亦诚一起做了一场关于「人工智能普惠化」的讲座 对Hugging Face是如...
使用 PPO 算法进行 RLHF 的 N 步实现细节
当下,RLHF/ChatGPT 已经变成了一个非常流行的话题。我们正在致力于更多有关 RLHF 的研究,这篇博客尝试复现 OpenAI 在 2019 年开源的原始 RLHF 代码库,其仓...
个人编程助手: 训练你自己的编码助手
在编程和软件开发这个不断演变的领域中,对效率和生产力的追求催生了许多卓越的创新。其中一个显著的创新就是代码生成模型的出现,如 Codex、StarCoder 和 Co...
【使用 Gradio 创建聊天机器人】Create Your Own Gradio Component – Part 1
介绍 Gradio 4.0 的更新,Gradio 组件更加可定制和可扩展。本视频将通过 Live coding 的方式创建自定义 Gradio 组件的,演示创建一个多模态聊天机器人组件的...