27b视频内存要求54→14.1GB:Google发布的Gemma 3 QAT
栏目:公司资讯 发布时间:2025-04-22 10:43
HOME 4月19日新闻,Google昨天(4月18日)发布了一篇博客文章,并发布了Gemma 3模型,并保持了高质量的同时减少记忆要求。 Google上个月推出了Gemma 3开源型号,该模型可以在单个NVIDIA H100 GPU中使用BFLOAT16(BF16)的精度运行得很好。它引用了一篇博客文章,并介绍了响应用户需求,Google致力于执行强大的Gemma 3性能,该性能很容易适应普通硬件。技术的体积是密钥,通过降低模型参数的准确性(例如,将16位减少到BF16到4位为INT4),相似的图像压缩可以减少颜色的数量,并大大减少了数据存储的量。以INT4数量为例,对Gemma 3 27B视频内存的需求从54GB急剧下降到14.1GB,而Gemma 3 12B从24GB下降到6.6GB; Gemma 3 1b仅需要0.5GB的视频内存。这意味着用户可以运行强大的AI Mod台式机上的EL(NVIDIA RTX 3090)或笔记本电脑(NVIDIA RTX 4060笔记本电脑GPU),甚至手机都可以支持小型型号。为了防止卷引起的性能,Google使用意识技术(QAT)的数量来模仿训练期间的低准准操作,以确保模型在压缩后保持准确。 Gemma 3 QAT模型将混淆的跌落降低到大约5000个训练步骤。 Olllama,LM Studio和Llama.cpp等基本平台包括该型号,用户将通过拥抱Face和Kaggle轻松运行Apple Silicon或CPU来招募官方的INT4和Q4_0型号。此外,Gemoverse社区还提供了更多的体积选项,以满足不同的需求。
服务热线
400-123-4567