如何利用AnythingLLM部署在线硅基流动的DeepSeek满血版API

是一款开源的全栈应用程序，旨在帮助用户构建基于检索增强生成（RAG）技术的私有知识库。通过将本地的 PDF、Word 文档、文本文件等嵌入到本地向量库，并连接大型语言模型（LLM），用户可以通过对话或搜索的方式获取答案、见解，甚至生成摘要。通过AnythingLLM，可以方便的构建自己的知识库，不用再手动上传文档到模型中了。2025年02月14日 09:27。

kft1314

2790人浏览 · 2025-02-14 09:32:19

kft1314 · 2025-02-14 09:32:19 发布

浅木先生

2025年02月14日 09:27

AnythingLLM 是一款开源的全栈应用程序，旨在帮助用户构建基于检索增强生成（RAG）技术的私有知识库。通过将本地的 PDF、Word 文档、文本文件等嵌入到本地向量库，并连接大型语言模型（LLM），用户可以通过对话或搜索的方式获取答案、见解，甚至生成摘要。

通过AnythingLLM，可以方便的构建自己的知识库，不用再手动上传文档到模型中了。

但是需要注意，上传文件的内容是否涉密，如果涉密，请勿上传。

下载 AnythingLLM

https://anythingllm.com/desktop

教程如下：

1、注册SILICONFLOW并获取API

首先注册（硅基流动）：

https://cloud.siliconflow.cn/i/24s1PqPc

然后打开API页面，新建一个API密钥：

2、在AnythingLLM中添加DeepSeekAPI

打开AnythingLLM的设置，找到LLM首选项，在LLM提供商处找到“Generic OpenAI”，然后按照下面的配置进行填写：

解释一下两个重要参数：

1). Token Context Window（上下文窗口大小）

定义：指的是模型一次能够处理的 最大输入 token 数量（包括问题和上下文）。

作用：决定模型能“记住”多少内容，在 RAG（检索增强生成）应用中，context window 限制了检索后能提供给模型的上下文信息。

2). Max Tokens（最大生成 token 数量）

定义：控制模型 最大可以输出的 token 数量。

作用：影响回答的长度，防止生成过长的内容导致超时或消耗过多算力。

这里的chat Model Name可以在上面的硅基流动的模型广场中找到：Models

推荐一个比较NB的ai工具，好不好用试过的不言而喻
https://ai.rcouyi.com/auth/register?inviteCode=W1PXYCM4J

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

【信创-k8s】海光/兆芯+银河麒麟V10离线部署k8s1.31.8+kubesphere4.1.3

介于V4优秀的LuBan架构，核心组件非常少，资源占用也显著降低，同时带来众多功能和便利性。：使用海光3350/兆芯开先KX-5000芯片，麒麟V10 SP3操作系统，以及Containerd 1.7.13、Kubernetes v1.31.8、KubeSphere v4.1.3等软件版本。原创编写，详细记录了从环境准备到平台验证的完整流程，为信创环境下的Kubernetes与KubeSphere

2048 AI社区

从狂热到深耕：一个AI从业者的智能体创业心路历程

2048 AI社区

UFW防火墙安全指南

UFW（Uncomplicated Firewall）是Ubuntu/Debian系统中简化防火墙管理的工具，通过直观命令帮助用户有效控制网络流量，提升系统安全性。文章详细介绍了UFW的基本命令，包括启停防火墙、添加规则、限制连接速率和日志配置等操作，并提供了安全最佳实践，如默认拒绝策略、IP地址限制和服务级规则管理。同时，还涵盖高级配置技巧，例如多网络接口设置、规则优先级调整、IPv6支持及与f

2048 AI社区

所有评论(0)

查看更多评论

kft1314

@kft1314

已为社区贡献1条内容