本次带来的是将大语言模型(AI)接入小爱音箱的教程。

本篇教程来自于@䦜𨶙小伙伴的投稿,他本身没有任何的计算机或代码基础,但是在大模型的帮助下,完成了整个接入流程。

他以小白的视角,把操作步骤总结成了切实可用的小白级教程,使得接入门槛更低。

并且,小伙伴还按照以下方法重复了两遍,确保能够完成。

所以如果你感兴趣,但是对自己的基础所顾虑的小伙伴们可以动手尝试一下了,相信你也一定可以的!

本篇教程熟练操作约需35分钟,建议先关注和收藏,以防丢失。

教程原文:


项目官方简介:

项目地址:https://github.com/idootop/.git

官方教学视频:(不太适合小白)https://www.bilibili.com/video/BV1zb421H7cS/?vd_source=89579609ff9a5bb5330aaf89ebde811a

视频配套 PPT 文件

蓝奏云:https://wwt.lanzout.com/iLHm2238xf5c

阿里云盘:https://www.alipan.com/s/Yf2RQvN961T

支持的小米音箱设备型号

完美运行

已知可以完美运行 Mi-GPT 的小爱音箱型号有:

名称型号ttsCommandwakeUpCommandplayingCommandstreamResponse反馈来源
小爱音箱 ProLX06[5, 1][5, 3]-TRUE@idootop
小爱音箱 miniLX01[5, 1][5, 2][4, 1, 1]TRUE@gsscsd
小爱音箱 Play(2019 款)LX05[5, 1][5, 3][3, 1, 1]TRUE@wt666666
小爱音箱 万能遥控版LX5A[5, 1][5, 3]-TRUE@imhsz
小米 AI 音箱S12[5, 1][5, 3]-TRUE微信: CMSJ
小米 AI 音箱(第二代)L15A[7, 3][7, 1][3, 1, 1]TRUE微信: 龙之广
小爱智能家庭屏 10X10A[7, 3][7, 1]-TRUE@IDarkBoss
Xiaomi Sound ProL17A[7, 3][7, 1]-TRUE微信: eof

🚗 正常运行

部分机型的 MIoT 接口不支持查询设备播放状态或查询状态异常,比如小米音箱 Play 增强版(L05C),将会导致 MiGPT 部分功能异常,无法使用连续对话等,此时需要关闭 streamResponse

可以正常运行 Mi-GPT,但不支持连续对话的小爱音箱型号有:

名称型号ttsCommandwakeUpCommandplayingCommandstreamResponse反馈来源
小爱音箱L06A[5, 1][5, 2]-FALSE@zhanglc
小爱音箱 PlayL05B[5, 3][5, 1]-FALSE@BiuBiu2323
小米小爱音箱 Play 增强版L05C[5, 3][5, 1]-FALSE@lyddias
Xiaomi 智能家庭屏 6X6A[7, 3][7, 1]-FALSE@Hongwing
Redmi 小爱触屏音箱 Pro 8 英寸X08E[7, 3][7, 1]-FALSE@shangjiyu
小爱音箱 ArtL09A[3, 1][3, 2]-FALSE@zwsn
小爱触屏音箱LX04[5, 1][5, 2]-FALSE@ilovesouthpark

❌ 不支持

完全不支持 MiGPT 的小爱音箱型号有:

名称型号反馈来源
小米小爱音箱 HDSM4@romantech
小米小爱蓝牙音箱随身版-微信: 明天

案例设备:我用的是小米AI音箱 1代,S12

  • 先只看型号,找到自己小米音箱的型号是否在上面的列表当中

本地部署教学(Node.js)

  • 这个方案需要电脑一直开着migpt的服务才行,关了电脑大模型就不生效了,你可以把小爱同学当作你的电脑音箱,还是那种可以随时解答问题的音箱,其实也挺有意思的

准备完毕,部署开始:

第一步:电脑需要安装的软件和环境配置:

  • Python 3.8以上的版本 ( https://www.python.org/)

  • Vscode ( https://code.visualstudio.com/)

  • nodeJS (https://nodejs.org/zh-cn)

  • Github 需要有账号 (https://github.com/)

  • Github 经常会打不开,可以下载一个steam++,https://steampp.net/

  • 安装方法参考大雨老师的教学:本地电脑请安装VSCode,NodeJS,Git等

上述软件请自行安装完成

(地址:https://waytoagi.feishu.cn/wiki/EJuiwrcJCi8uW1kTutrcBtBlnyc)

重要!安装完成后,需要配置环境,否则后面的部署过程中运行会报错

  1. 搜索 windows powershell

  1. 用管理员身份运行,进入命令行工具页面

  1. 输入以下命令,按回车
Set-ExecutionPolicy RemoteSigned

第一次执行会弹出以下窗口,会出现执行策略更改确认时,输入A后按回车确认,关闭运行窗口

  • 这一步我们做的是安装软件,配置基础环境

第二步:准备小米音箱

  1. 查看小米音箱的型号

  2. 型号1:小米AI音箱(1代),这个型号根据前述表格,型号码为S12(底部标签不一致,请按表格中型号为准)

  1. 型号2:小米AI音箱(2代),型号码为L15A(看底部标签)


在这里插入图片描述

  1. 手机上下载米家APP或者小爱音箱APP,这里有几个参数要记住:
  • 小米账号:登录米家或者小爱音箱APP后,可以在"我的"界面中看到ID,我这里是9开头的一串数字

  • 记住登录小米账号的密码:记得使用密码登录,等下需要配置

  • 通过米家APP或小爱音箱APP配置小孩音箱设备,连接到家里的网络,请保持你连接的网络必须和电脑在同一局域网下

  • 记住音箱的名称:我这里就是 小米AI音箱

  • 在这一步,我们需要的参数是:小米UID,登录密码,音箱绑定的名称,我这里绑定的名称就是 小米AI音箱

第三步:申请大模型的API接口,以silicon为例

  • 官方提供的接入API的教学文档:

https://migptgui.com/docs/apply/

  • 以我平时使用的silicon接口为例,有众多开源模型(Yi、Qwen、Llama、Gemma 等)免费使用。另赠送 14 元体验金,有效期未知,是个人认为API接口最方便最实惠的接口了

  • silicon注册和使用地址:

https://cloud.siliconflow.cn/i/ESTKPm3J

邀请码:ESTKPm3J(谢谢支持)

  • 注册登录后,单击左边栏的API密钥,单击新建API密钥

单击密钥即可完成API密钥的复制

  • silicon支持多种大模型,也支持文生图、图生图、文生视频,可自行探索

  • 这一步得到silicon的密钥即可,我们可以调用千问2.5的这个模型,满足日常对话完全没有问题,并且是免费调用的

  • 这一步我们做的是注册silicon账号,申请API密钥,保存密钥,等下配置需要填写

第四步:进入github复制mi-gpt项目


  • 打开官方仓库:https://github.com/idootop/mi-gpt

  • Fork项目到自己的账号
  1. 单击Fork

  1. 单击右下角 Create fork

  1. 这样就已经把该项目fork到自己的仓库中了

  1. 找自己仓库项目的方法

进入主页,单击左上角的"三"

单击home,就可以看到刚才fork过来的mi-gpt项目了,单击可进入项目页面

  1. 复制仓库地址:先确认是否在自己的仓库项目页面,再单击绿色的“code”按钮,再点击地址栏的复制按钮

  • 这一步是复制官方项目到自己的仓库里,并得到自己的仓库地址

第五步:打开vscode,克隆项目,并找到配置文件

  1. 打开vscode

  1. 初次配置VScode,参考大雨老师教程第二天 如何在本地修改+AI交互当中vscode基本操作部分(教程地址:

    https://waytoagi.feishu.cn/wiki/LTRIwpdpoiGTTukcpBGcU0RJnse)

  • 安装中文插件,到下图这个界面,再次打开vscode就变成中文的了

  • 选择一个文件夹,文件夹名字请随便起,我们可以起一个migpt的文件夹,到下图这一步:

  • 如果弹出信任提示,单击“是”即可
  1. 在vscode中建立migpt项目终端,进入右图状态

  1. 输入 get clone 第四步复制的你自己仓库中项目地址:

  2. 如:git clone https://github.com/idootop/mi-gpt.git

  1. 按回车,克隆仓库项目,出先下图即克隆完成,点开左边栏mi-gpt就可以看到项目文件

如果出现这样的报错:

fatal: unable to access 'https://github.com/em......y/mi-gpt.git/': SSL certificate problem: unable to get local issuer certificate

,可运行下面的代码后重新克隆一遍

  1. 修改配置文件,这里两个带有example的文件就是我们需要修改的文件

  1. 重命名这两个文件,修改为.env和.migpt.js

第六步:修改vscode配置文件

  1. 修改.env文件,可参照官方文档

https://github.com/idootop/mi-gpt/blob/main/docs/settings.md

  1. 这里我们使用千问2.5-7b-instruction模型,配置参数如下:
OPENAI_MODEL = Qwen/Qwen2.5-7B-Instruct``OPENAI_API_KEY= sk-xxxxxxxx   # 这里填写第三步中申请的API密钥即可``OPENAI_BASE_URL= https://api.siliconflow.cn/v1

  1. 修改完成后如下图:

接下来就可以配置.migpt.js文件,可参考官方文档修改指令和大模型的人设提示词

https://github.com/idootop/mi-gpt/blob/main/docs/prompt.md

https://github.com/idootop/mi-gpt/blob/main/docs/settings.md

  1. 填写第二步我们获得的小米ID等信息,分别对应小米账号ID,登录密码,设备名称,大概在93行左右

 `// 小米 ID`    `userId: "9xxxx", // 注意:不是手机号或邮箱,请在「个人信息」-「小米 ID」查看`    `// 账号密码`    `password: "axxxxx",`    `// 小爱音箱 DID 或在米家中设置的名称`    `did: "小米AI音箱", // 注意空格、大小写和错别字(音响 👉 音箱)`

  1. 修改MIoT设备指令,如下图

  • 我自己的两台设备,我在表格中找到的指令是:

  • 我绑定了S12小米AI音箱,表中command分别是[5,1],[5,3],和默认的一致则不用修改,表中playingcommand为空,则不用添加

  • 如果是L15A,那么就要改成对应的编码,并把playingcommand之前的两个//删除,如下图

  • 切记,这里的所有符号必须使用英文符号,否则会报错
  1. 修改人设,可以参考官方文档,也可以自行设定,,可以先跑通再改,提供可复制的案例如下:

第4-16行,人物提示词,可以先跑通再改

// 小爱音箱扮演角色的简介```const botProfile = ` ```性别:女``性格:高冷御姐``爱好:喜欢看电影,看书,偶尔也会去健身房锻炼,擅长游泳,爱吃醋,爱撒娇,喜欢思考哲学问题,很爱干净,喜欢穿性感服饰给哥哥看,特别喜欢挑逗哥哥。````.trim(); `````// 小爱音箱主人(你)的简介```const masterProfile = ` ```性别:男``性格:善良正直``其他:明星,总喜欢打篮球,唱,跳,RAP,练习时长两年半,是莉莉娅的男朋友。````.trim(); ```第78-87行,人物姓名(参考),可以先跑通再改``export default {`  `systemTemplate,`  `bot: {`    `name: "莉莉娅",`    `profile: botProfile,`  `},`  `master: {`    `name: "哥哥",`    `profile: masterProfile,`  `},

第104-119行,回复唤醒指令,更改姓名,让名字一致,可以先跑通再改

  `// 当消息以下面的关键词开头时,会调用 AI 来回复消息`    `callAIKeywords: ["请", "你", "莉莉娅"],`    `// 当消息以下面的关键词开头时,会进入 AI 唤醒状态`    `wakeUpKeywords: ["打开", "进入", "召唤"],`    `// 当消息以下面的关键词开头时,会退出 AI 唤醒状态`    `exitKeywords: ["关闭", "退出", "再见"],`    `// 进入 AI 模式的欢迎语`    `onEnterAI: ["我是莉莉娅,又见到哥哥啦,太开心了"], // 设为空数组时可关闭提示语`    `// 退出 AI 模式的提示语`    `onExitAI: ["莉莉娅先回去咯"], // 为空时可关闭提示语`    `// AI 开始回答时的提示语`    `onAIAsking: ["让我先想想", "请稍等"], // 为空时可关闭提示语`    `// AI 结束回答时的提示语`    `onAIReplied: ["我说完了", "还有其他问题吗"], // 为空时可关闭提示语`    `// AI 回答异常时的提示语`    `onAIError: ["啊哦,出错了,请稍后再试吧!"], // 为空时可关闭提示语``可以选择关闭部分提示语,增加交互速度(推荐)`    `// 当消息以下面的关键词开头时,会调用 AI 来回复消息`    `callAIKeywords: ["请", "你", "莉莉娅"],`    `// 当消息以下面的关键词开头时,会进入 AI 唤醒状态`    `wakeUpKeywords: ["打开", "进入", "召唤"],`    `// 当消息以下面的关键词开头时,会退出 AI 唤醒状态`    `exitKeywords: ["关闭", "退出", "再见"],`    `// 进入 AI 模式的欢迎语`    `onEnterAI: ["我是莉莉娅,又见到哥哥啦,太开心了"], // 设为空数组时可关闭提示语`    `// 退出 AI 模式的提示语`    `onExitAI: ["莉莉娅先回去咯"], // 为空时可关闭提示语`    `// AI 开始回答时的提示语`    `onAIAsking: [], // 为空时可关闭提示语`    `// AI 结束回答时的提示语`    `onAIReplied: [], // 为空时可关闭提示语`    `// AI 回答异常时的提示语`    `onAIError: ["啊哦,出错了,请稍后再试吧!"], // 为空时可关闭提示语`

第149-156行,打开连续对话功能,是否支持请根据官方文档自行判断

(部分机型的 MIoT 接口不支持查询设备播放状态或查询状态异常,比如小米音箱 Play 增强版(L05C),将会导致 MiGPT 部分功能异常,无法使用连续对话等,此时需要关闭 streamResponse。)

    `// 是否启用连续对话功能,部分小爱音箱型号无法查询到正确的播放状态,需要关闭连续对话`    `streamResponse: true,`    `// 连续对话时,无响应多久后自动退出`    `exitKeepAliveAfter: 30, // 默认 30 秒,建议不要超过 1 分钟`    `// 连续对话时,下发 TTS 指令多长时间后开始检测设备播放状态(默认 3 秒)`    `checkTTSStatusAfter: 3, // 当小爱长文本回复被过早中断时,可尝试调大该值`    `// 连续对话时,播放状态检测间隔(单位毫秒,最低 500 毫秒,默认 1 秒)`    `checkInterval: 1000, // 调小此值可以降低小爱回复之间的停顿感,请酌情调节`

这里一般只需要把连续对话功能改为true或false,如果设备支持可以改为true

  1. 保存文件,打开左上角文件,单击全部保存即可

第七步:安装依赖并运行

  1. 在下方终端窗口,单击终端,输入

    cd mi-gpt
    
    
 #这里的F:\migpt是你的文件夹目录,使用cd命令 进入mi-gpt文件

  1. 安装依赖,输入 pnpm install
pnpm install

安装完成后,界面如下:

如果安装过程报错,出现下图情况:

请在命令栏输入:npm cache clean --force 清除缓存后重新运行 pnpm install

npm cache clean --force

  1. 构建项目,输入 pnpm build
 pnpm build

出现以下界面即安装完成

如果出现以下报错,找到mi-gpt中 package.json文件,将第28行build进行修改

npx -y prisma generate && tsup

注意不要把引号删除。修改完成单击文件,一定要保存

保存后运行pnpm build,即可正常安装完成

  1. 运行项目,输入pnpm run dev
pnpm run dev

  1. 运行成功时,进入下图页面,每次对话都会在终端中显示

  1. 每次需要打开服务时,按照下图方式进入终端,先输入cd mi-gpt ,再运行 pnpm run dev 即可打开服务

如果出现以下错误不要慌,是网络问题,请重新运行

pnpm run dev

  1. 看下运行效果,记得给大模型思考的时间,说话太快会出问题的

原作者注:

  • 我自己也是个行业小白,没有任何计算机和代码的基础,教程是在一路摸索中总结出来的

  • 所有我遇到的报错,都是通过silicon的大模型来帮我解决,解决方案也都附上了

  • 使用docker更方便,只是我真的不会。

  • chat-tts的安装方法我搞了很久都没跑通,但我会继续摸索。

  • 这个小爱同学只能在服务开启的时候,也就是开着电脑同时开着服务才可以运行,听作者说如果在云端布置,需要用nas的docker,我还没学会。

    教程结束


大模型真的深刻改变了我们的生活,把之前可能遥不可及或者要花费极大精力才能完成的事情,帮助我们成为了现实,我对此深有体会。

因此请放下大模型的宏观视角,忘记那些“AI榜单”、“替代人类”等带来的无谓焦虑和嘈杂信息。拥抱AI,切实的去体验一次大模型带来的改变,你也许会有新的感受。

最后,

愿每个人都能在AI的帮助下成为更好的自己。

AI大模型学习路线

如果你对AI大模型入门感兴趣,那么你需要的话可以点击这里大模型重磅福利:入门进阶全套104G学习资源包免费分享!

扫描下方csdn官方合作二维码获取哦!

在这里插入图片描述

这是一份大模型从零基础到进阶的学习路线大纲全览,小伙伴们记得点个收藏!

请添加图片描述
第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

100套AI大模型商业化落地方案

请添加图片描述

大模型全套视频教程

请添加图片描述

200本大模型PDF书籍

请添加图片描述

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

LLM面试题合集

请添加图片描述

大模型产品经理资源合集

请添加图片描述

大模型项目实战合集

请添加图片描述

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐