Text-generation-webui：开启文本创作的智能新时代

Text-generation-webui 是适用于大型语言模型的 Gradio Web UI。支持 transformers、GPTQ、AWQ、EXL2、llama.cpp (GGUF)、Llama 模型。它的特点如下，3 种界面模式：default (two columns), notebook, chat。

算家云

853人浏览 · 2024-08-06 17:05:30

算家云 · 2024-08-06 17:05:30 发布

一、介绍

Text-generation-webui 是适用于大型语言模型的 Gradio Web UI。支持 transformers、GPTQ、AWQ、EXL2、llama.cpp (GGUF)、Llama 模型。

它的特点如下，

3 种界面模式：default (two columns), notebook, chat
支持多个模型后端：Transformers、llama.cpp（通过 llama-cpp-python）、ExLlama、ExLlamaV2、AutoGPTQ、AutoAWQ、GPTQ-for-LLaMa、CTransformers、QuIP。
通过下拉菜单可在多个不同模型之间快速切换。
大量扩展（内置和用户贡献），包括用于真实语音输出的 Coqui TTS、用于语音输入的 Whisper STT、翻译、多模式管道、向量数据库、Stable Diffusion 集成等等。
与自定义角色聊天。
适用于指令跟踪模型的精确聊天模板，包括 Llama-2-chat、Alpaca、Vicuna、Mistral。
LoRA：使用您自己的数据训练新的 LoRA，动态加载/卸载 LoRA 以进行生成。
Transformers 库集成：通过 bitsandbytes 以 4 位或 8 位精度加载模型，将 llama.cpp 与 Transformers 采样器（ llamacpp_HF 加载器）结合使用，使用 PyTorch 以 32 位精度进行 CPU 推理。
具有 OpenAI 兼容的 Chat 和 Completions API 服务器。

二、构建流程

1. 克隆代码

git clone https://github.com/oobabooga/text-generation-webui.git; 
cd text-generation-webui

2. 创建虚拟环境

安装conda

wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3.sh

创建虚拟环境

conda create -n text-generation-webui python=3.11
conda activate text-generation-webui
pip install -r requirements.txt

3. 下载vicuna-7b-v1.3语言模型

cd /text-generation-webui/models
git lfs install
git clone https://www.modelscope.cn/Xorbits/vicuna-7b-v1.3.git

屏幕截图

4. 启动Web UI

模型参数文件准备完成后，即可启动项目。启动时，可以通过 --model 参数执行默认模型，--listen 参数可以将启动的地址设置为 0.0.0.0，--listen-port 可以指定项目启动的端口

# 进入项目根目录
cd /text-generation-webui
# 启动项目
python server.py --model vicuna-7b-v1.3 --listen --listen-port 8080

屏幕截图

三、网页演示

模型运行成功运行结果如下：

屏幕截图

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

【信创-k8s】海光/兆芯+银河麒麟V10离线部署k8s1.31.8+kubesphere4.1.3

介于V4优秀的LuBan架构，核心组件非常少，资源占用也显著降低，同时带来众多功能和便利性。：使用海光3350/兆芯开先KX-5000芯片，麒麟V10 SP3操作系统，以及Containerd 1.7.13、Kubernetes v1.31.8、KubeSphere v4.1.3等软件版本。原创编写，详细记录了从环境准备到平台验证的完整流程，为信创环境下的Kubernetes与KubeSphere

2048 AI社区

从狂热到深耕：一个AI从业者的智能体创业心路历程

2048 AI社区

MCP：从被动响应到自主执行的自动化协议

AI正突破传统代码生成边界，向全流程智能调度演进。MCP（Model Context Protocol）作为开放协议，为AI与工具建立统一接口，实现跨模型、跨工具的复杂流程编排。其核心价值在于生态复用、安全可控和上下文感知，通过客户端-服务器架构让AI自主调用API完成从代码检查到性能优化的全流程。相比Function Call的单次调用，MCP支持多工具串联和本地数据处理，将重塑前端开发模式——