进阶Python

club-3090社区配方让RTX 30/40/50系列轻松部署LLM

club-3090是一个开源社区项目，提供在RTX 3090/4090/5090等CUDA GPU上部署大语言模型的配方。支持vLLM、llama.cpp、ik_llama等多种推理引擎，目前已有Qwen3.6-27B、Gemma 4等配置，适合单卡和双卡运行。适合AI爱好者和开发者快速搭建本地LLM服务。

1.2K 星标

65 分叉

12 问题

50 浏览

Python

Apache-2.0

收录日期2026年6月1日

更新日期2026年6月2日

Github仓库

项目概述

部署大语言模型（LLM）到消费级GPU，一直是个门槛不低的事情。虽然Hugging Face上模型越来越多，但要在本地跑起来，尤其是利用RTX 30/40/50系列显卡，往往需要折腾环境、编译引擎、调参数。club-3090这个开源项目，试图把这些步骤打包成社区配方，让你少走弯路。

核心功能与引擎支持

club-3090不是一个大而全的平台，而是一个社区驱动的配方集合。它的核心思路很简单：针对特定的GPU型号和模型，提供经过验证的配置和命令行，让部署变成复制粘贴。项目目前支持三种主流推理引擎：vLLM、llama.cpp 和 ik_llama。这意味着无论你偏好哪个引擎的性能或特性，都能找到对应的使用方法。

支持模型与显卡组合

当前可用的配方主要针对Qwen3.6系列（27B和35B）和Gemma 4系列（26B和31B）。这些模型参数规模较大，但在RTX 3090/4090/5090上通过量化和多卡并行依然能跑。项目提供了1×和2×显卡的配置，例如双RTX 3090跑Qwen3.6-35B。随着社区贡献增多，预计会有更多模型加入。

多引擎支持：vLLM适合高吞吐，llama.cpp适合单卡优化，ik_llama聚焦推理加速。
模型无关架构：项目是模型不可知的，理论上任何下载到本地的模型都可以用这些配置来服务。
活跃社区：1212 Stars说明有不少人在关注和贡献，配方会持续更新。

适合谁使用？

如果你是个体开发者、AI爱好者，或者在小团队里需要私有化部署LLM，club-3090会很有帮助。它避免了从零开始编译和调试的麻烦，尤其适合NVIDIA 30/40/50系列显卡的用户。当然，你仍需要具备基础的命令行和CUDA环境知识，但无需精通每一个引擎的细节。

简单来说，club-3090把碎片化的部署经验变成了可复用的配置。如果你手头恰好有一张RTX 3090或4090，又想在本地跑Qwen或Gemma，不妨去GitHub看看这些配方，几分钟就能让模型跑起来。

LLM部署RTX 3090vLLMllama.cpp社区配方GPU推理消费级显卡本地模型服务

项目评分

0.0 (0 评价)

登录后可为项目评分

常见问题

club-3090: 社区配方让RTX 30/40/50系列轻松部署LLM 是什么？

club-3090: 社区配方让RTX 30/40/50系列轻松部署LLM 用什么语言开发？

club-3090: 社区配方让RTX 30/40/50系列轻松部署LLM 主要使用 Python 开发。

club-3090: 社区配方让RTX 30/40/50系列轻松部署LLM 使用什么开源协议？

club-3090: 社区配方让RTX 30/40/50系列轻松部署LLM 基于 Apache-2.0 协议开源。

探索更多

相似工具

Cursor

一款基于 VS Code 二次开发的智能代码编辑器，以“原生内置 AI”为核心卖点。它不依赖插件，而是将 AI 深度植入编辑器底层，能够理解整个项目的上下文代码库，支持无缝迁移 VS Code 的所有配置和插件。

Google Antigravity

Antigravity 支持多模型，包括 Gemini 3 Pro、Claude Sonnet 4.5、GPT-OSS，开发者可以在同一环境中选择最适合任务的模型。

Codex

OpenAI Codex 是由 OpenAI 开发的 AI 编程模型和助手，可将自然语言指令翻译成对应的源代码，为开发者提供智能补全、代码生成等功能。它最初于 2021 年作为 OpenAI API 的代码模型推出，曾为 GitHub Copilot 提供核心支持。随着 OpenAI 技术的迭代，Codex 在 2025 年以“AI 编程智能体”的全新姿态回归，能够理解复杂需求并自动编写、调试代码，显著提升开发效率和软件交付速度。

Kiro

Kiro 是由 AWS 推出的 AI 编程 IDE，采用规范驱动的开发模式，将自然语言需求转化为明确的规格文档和任务，再由内置 AI 代理生成代码并调试优化，全流程辅助大型项目开发。

Trae

Trae（官网 trae.ai）是由字节跳动（ByteDance）推出的一款 AI 原生集成开发环境（IDE）。它不是简单地作为一个编程助手，而是一个「协作伙伴」，通过深度整合大型语言模型（LLM），帮助开发者从需求、构建代码，到调试和部署，实现更智能化、自动化的软件开发。

Claude

Claude 是由美国人工智能公司 Anthropic 打造的智能语言交互平台，它融合了深度文本理解、信息整理、代码辅助和任务分析等能力，能在聊天对话之外应对更复杂的问题，例如长文摘要、图像解析、逻辑推理及编程协助等。相比一些单一问答机器人，Claude 更像一个具备推理逻辑、可扩展功能的智能工具。