ComfyUI:融合LLM技术,打造图片工作流新体验,实现图文音视一体化处理!(graphRAG、ollama助力)
我们正在使用一些Agent平台如FastGPT和Dify,他们注重于快速生成文本内容,知识库问答,提供自定义能力和与现有系统的集成性。同时,在AI绘画方面,我们原来使用SD,后来使用ComfyUI。虽然ComfyUI被广泛用于将文本转化为图像(文生图),但它实际上是一种生成式AI内容(AIGC)的工具,其功能不仅限于此。它还能够处理文本生成(文生文),因此可以实现多种内容的生成。Dify中也有提供
我们正在使用一些Agent平台如FastGPT和Dify,他们注重于快速生成文本内容,知识库问答,提供自定义能力和与现有系统的集成性。
同时,在AI绘画方面,我们原来使用SD,后来使用ComfyUI。虽然ComfyUI被广泛用于将文本转化为图像(文生图),但它实际上是一种生成式AI内容(AIGC)的工具,其功能不仅限于此。它还能够处理文本生成(文生文),因此可以实现多种内容的生成。
Dify中也有提供ComfyUI的集成工具,他是调用Comfy UI的服务。
所以,今天我们介绍ComfyUI LLM Party
这个工具挺酷的,他专注于LLM集成进ComfyUI里面。旨在基于comfyui作为前端,开发一套完整的LLM工作流构建节点,让用户可以快速便捷地构建自己的LLM工作流,并轻松集成到现有的图片工作流中。
该插件在 ComfyUI 中支持绝大多数大语言模型,兼容 OpenAI 格式的 API 调用,并结合 OneAPI 调用几乎所有 LLM API。支持的模型包括通义千问、智谱清言、DeepSeek 和 Kimi。
额外功能有:支持 Ollama 本地模型,模型链节点选项(LLM、VLM-GGUF、LLM-GGUF),以及 VLM 模型的图像识别和提示词反推。
实用工具包括 OpenAI 语音识别与合成、Markdown 转 HTML、HTML 转图片,以及通过飞书机器人发送消息到多个平台。
项目愿景:
1、从最基础的 LLM 多工具调用、角色设定快速搭建自己的专属AI助手、到可以行业落地的词向量RAG、GraphRAG来本地化的管理行业内知识库;
2、从单一的智能体流水线,到复杂的智能体与智能体辐射状交互模式、环形交互模式的构建;
3、从个人用户需要的接入自己的社交APP(QQ、飞书、Discord),到流媒体工作者需要的一站式LLM+TTS+ComfyUI工作流;
4、从普通学生所需要的第一个LLM应用的简单上手起步,到科研工作者们常用的各类参数调试接口,模型适配。
挺酷的,我们图片生成的工作流,一定有许多地方可以和视觉、语音LLM结合,比如:
上下文增强:通过LLM获取用户的意图和上下文,优化生成过程,使生成的图像更符合用户需求。
图像描述生成:使用视觉模型分析生成的图像并自动生成描述,帮助用户理解图像内容,适用于无障碍应用。
又如官方所说的:
您可以将任何 ComfyUI 工作流封装到 LLM 工具节点中。您可以让您的 LLM 同时控制多个 ComfyUI 工作流。当您希望它完成某些任务时,它可以根据您的提示选择合适的 ComfyUI 工作流,完成您的任务,并将结果返回给您。
“您的提示选择合适的 ComfyUI 工作流”,这在我们Fastgpt、Coze或者Dify 中称为:问题分类或意图识别。
还有一些其他的,比如ComfyUI + GraphRAG,这些就是单纯使用ComfyUI前端实现GraphRAG。
总之,节点式工作流本身就是千变万化的,给ComfyUI引入LLM的支持,会让它更加适合千变万化的场景,创建更多复杂有趣的应用。
看看模型支持部分,基本上再配合One-API,市面上的模型都能支持,生产场景建议使用VLLM做模型加速部署,以API形式接入,而不是直接Hugging Face加载下载的模型,多说一句,ollama也不如Vllm,前者多卡部署大模型如70B的,推理会很慢,生成环境下基本不行。
这个项目包罗万象,一直在兼容各种东西的路上,简单的项目描述也要写上许多字才能尽善尽美。
部署方面总共两步吧
方法一下载较方便,可在ComfyUI中直接安装该插件,之后环境部署就是给你的ComfyUI再添加一些这个插件需要的环境。
快速开始
从教程上来看,上手并不难,但是实际上因为它覆盖的东西非常多,你需要深入的话,相应的你需要掌握很多东西,比如一些搜索引擎啊 searxng、neo4j KG、graphRAG、各种LLM的格式、llama.cpp 啊(这些我都弄过,往期文章有,但不全,有一些并没有去写)
如何学习AI大模型 ?
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。【保证100%免费】🆓
CSDN粉丝独家福利
这份完整版的 AI 大模型学习资料已经上传CSDN,朋友们如果需要可以扫描下方二维码&点击下方CSDN官方认证链接免费领取 【保证100%免费】
读者福利: 👉👉CSDN大礼包:《最新AI大模型学习资源包》免费分享 👈👈
对于0基础小白入门:
如果你是零基础小白,想快速入门大模型是可以考虑的。
一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。
👉1.大模型入门学习思维导图👈
要学习一门新的技术,作为新手一定要先学习成长路线图,方向不对,努力白费。
对于从来没有接触过AI大模型的同学,我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线,大家跟着这个大的方向学习准没问题。(全套教程文末领取哈)
👉2.AGI大模型配套视频👈
很多朋友都不喜欢晦涩的文字,我也为大家准备了视频教程,每个章节都是当前板块的精华浓缩。
👉3.大模型实际应用报告合集👈
这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。(全套教程文末领取哈)
👉4.大模型落地应用案例PPT👈
光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。(全套教程文末领取哈)
👉5.大模型经典学习电子书👈
随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。(全套教程文末领取哈)
👉6.大模型面试题&答案👈
截至目前大模型已经超过200个,在大模型纵横的时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。为了让大家更容易上车大模型算法赛道,我总结了大模型常考的面试题。(全套教程文末领取哈)
👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习
CSDN粉丝独家福利
这份完整版的 AI 大模型学习资料已经上传CSDN,朋友们如果需要可以扫描下方二维码&点击下方CSDN官方认证链接免费领取 【保证100%免费】
读者福利: 👉👉CSDN大礼包:《最新AI大模型学习资源包》免费分享 👈👈
更多推荐
所有评论(0)