一、前言

在 AI 领域,推理(Inference)和训练(Training)是 AI 模型生命周期中的两个核心阶段,训练时,模型借大量数据与算法学习规律,此过程计算资源消耗巨大且耗时漫长,旨在构建精准模型。而推理则是利用已训练好的模型对新数据进行快速判断与处理,资源需求相对较少,二者差异显著却相辅相成。大家平时听到 AI 训练比较多,对于推理相对陌生,本文主要介绍模型推理的运行原理以及与训练的差异,让读者对 AI 推理有个详细的了解。

二、为什么叫推理

什么是 AI 推理?

AI 推理是指经过训练的 AI 模型,从全新数据中得出结论的过程,推理就是人工智能模型的实际运行。

举个例子,学生学习和考试,学生平时课堂学习,写作业等,可以看成是 AI 模型的训练,学生写作业,老师批改作业,以及老师答疑,都是在给学生反馈哪些是正确的哪些是错误的,通过这个过程学生掌握了课本里面的知识。 到了考试以后,考题多数情况下是跟平时做的题目不一样(肯定不是现成一模一样的题目),学生需要利用掌握的知识来分析解答考试题目,这个就是推理的过程。 但是有一点需要说明,考试的知识点肯定要在课本知识范围内,即考试不能超纲,否则学生也答不上来或者答的效果不好,AI 推理本质也是一样,上述说的全新数据也是要在 AI 训练数据的大范围内,例如一个人脸识别的模型,训练的时候拿的都是人脸数据,包含男人、女人、老人、小孩等等,但是推理的时候拿一张小猫的图片让其识别,大概率会识别错误。

AI 模型运行为什么叫推理?

推理这个概念相对来说比较抽象,刚接触时有点难理解,找到两个比较合理的一种解释

1、推理这一术语来源于逻辑学,在逻辑学中,推理是指根据已知前提,通过规则得出结论

2、推理反映了 AI 在模拟人类思维方面的能力,人类的推理是通过已有知识(经验或教育)对新情况进行分析,例如“如果天空乌云密布,那么可能会下雨”。

AI 运行过程其实与上述描述特征基本一致,AI 模型的运行被称为“推理”,是因为它模仿了人类和逻辑系统中“从已知信息得出未知结论”的过程。推理强调模型利用训练获得的知识,在不确定的输入情况下生成合理输出。

说明:上述举例 AI 推理与人类推理类似,这里说明一下,人类推理时具有很强的涌现能力,就是创新能力(根据已有学习的知识创造出新的知识),目前大参数量的 AI 模型具备一定的涌现能力,但是效果还不稳定。

三、推理的运行过程

推理技术原理

当完成模型训练,意味着在给定的数据集上,模型已经达到最佳或者满足需求的预测效果。如果 AI 算法工程师对模型预测效果满意,就可以进入模型部署进行推理和使用模型。AI 模型推理整体过程如下

1、输入预处理

对输入数据进行归一化、特征提取等预处理操作,即将原始数据转化为模型可以理解的数值(通常是向量或矩阵形式)比如图像识别任务中,对图像进行缩放到固定大小并转化为数值矩阵。

2、前向传播

利用训练过程中学到的参数(如神经网络中的权重和偏置)对输入进行逐层计算每一层的计算通常是:a=f(Wx)+b,其中 W 是权重矩阵,b 是偏置向量,f 是激活函数。

2、输出后处理

对模型的输出进行解码,如通过 Softmax 获取分类概率,通过阈值决定预测类别,或将数值转换为自然语言文本,输出比如分类标签、预测值或生成的文本等。

可以看出这里跟训练的一个明显区别是没有反向传播过程。

实际应用模型和业务应用如何配合?

之前介绍 AI 训练的文章说到,模型训练好以后会导出权重文件,其包含了模型在训练过程中学到的各种参数和配置,还有模型文件,其包含模型网络结构,例如神经网络的拓扑结构和层级配置等,那权重文件和模型文件又是是怎么运行起来的 ?

这里就需要用到推理框架,推理框架在 AI 模型推理时扮演了关键角色,其主要功能是高效地加载和执行训练好的模型,生成所需的推理结果。这里展开介绍一下推理框架加载权重文件的过程:

1、文件解析

使用框架的专用加载工具(如 TensorFlow 的 SavedModel 或 PyTorch 的 torch.load)。读取权重文件,将二进制数据解码为模型参数。

2、张量构建(可以简单理解成向量)

将解析出的权重数据加载为内存中的张量对象(如 NumPy 数组或框架的张量类)。确保张量的维度和格式与模型定义一致。

3、映射到模型结构

按照模型拓扑,将权重数据映射到网络的每一层(如卷积层、全连接层),确保参数被正确初始化到相应的网络层中。

如上图所示,模型文件主要是定义一个神经网络结构,有多少层,每层有多少神经元节点等,推理框架在加载的时候需要将模型文件和权重文件结合,即从权重文件中读取出对应的权重和偏置设置到模型网络上对应节点上,这就要求权重文件中解析出来的数据维度必须与模型网络结构一样,否则就会加载失败,例如模型网络总共有 10 层,每层 20 个节点,但是权重文件中参数只有 5 层,每层 10 个节点,显然就对应不上会加载失败

4、设备映射(分配硬件算力)根据推理环境(CPU、GPU、TPU),将加载的张量分配到对应的计算设备。

推理框架加载好模型后,处于推理准备状态,可以接受输入数据进行计算了,那么另外一个问题来了,推理框架在实际的应用场景中,例如手机、电脑等场景中,是一个什么形式运行?

推理框架部署后通常会作为一个独立的进程运行,并通过 REST API、gRPC 方式对外提供服务。这种方式使其能够独立于业务系统,专注于处理推理任务,同时简化了开发和维护工作,推理框架通常作为单独的进程或容器运行。

举例一个典型 AI 应用:人脸识别应用,其结构和工作流程大体如下

1、用户上传图片

用户通过前端应用上传一张人脸图片,图片以 HTTP POST 请求的形式发送到 Java 后端。

2、后端处理请求

后端接收到图片,并将图片转码为推理框架支持的格式(如 Base64 解码、调整尺寸),使用 HTTP 客户端(如 Apache HttpClient、Spring RestTemplate)向推理框架发送推理请求。

3、推理框架执行推

理推理框架接收到请求后,将图片数据传递给人脸识别模型。模型计算结果(如识别到的人脸特征向量、匹配分数)

4、推理结果返回后端

推理框架将结果以 JSON 或其他格式返回给 Java 后端。

5、Java 后端解析结果,并根据业务逻辑执行操作(如匹配数据库中的用户信息)

6、后端返回结果给前端

Java 后端将最终处理结果(如认证成功或失败)返回给前端。

7、用户在前端看到相应提示

通过推理框架和业务应用的协同工作,AI 模型可以无缝集成到业务系统中,提供智能化服务。例如,在人脸识别场景中,推理框架提供强大的计算能力,而业务系统专注于用户体验和业务逻辑,实现智能化登录认证或其他应用场景。

四、训练和推理的区别

我们都知道训练和推理典型差异在于对资源的需求不同,训练资源需求大于推理,为什么会有这个差异?

训练通常需要大量的计算资源和较长的时间。例如在训练一个图像分类 AI 时,会给模型输入成千上万张带有标签(如猫、狗、汽车等类别)的图像,通过复杂的算法(如前向传播、损失计算、反向传播算法、参数更新)来调整模型的权重,并且进行多次迭代处理。可能需要数小时、数天甚至数周的时间,具体取决于模型的复杂度、数据量和硬件性能。

推理相对来说,推理对计算资源的需求和时间消耗要小得多。在推理时,模型已经固定了参数,不需要做权重更新,只是简单地进行前向计算。虽然对于一些大型复杂的模型和高并发的推理场景(如在短时间内处理大量的图像识别请求)也需要一定的计算资源支持,但通常比训练阶段少很多。例如,在一个手机上的人脸识别解锁应用,每次解锁进行推理时,手机的处理器可以在很短的时间(通常不到一秒)内完成计算,判断是否为机主的人脸。

总结:AI 训练比推理需要更多资源,因为训练过程涉及复杂的梯度计算和参数更新,同时需要处理海量数据。推理仅需完成前向传播,对资源的需求较低且优化空间更大。两者在计算量、内存和硬件需求上的本质差异,决定了训练资源需求更大。

最后的最后

感谢你们的阅读和喜欢,作为一位在一线互联网行业奋斗多年的老兵,我深知在这个瞬息万变的技术领域中,持续学习和进步的重要性。

为了帮助更多热爱技术、渴望成长的朋友,我特别整理了一份涵盖大模型领域的宝贵资料集。

这些资料不仅是我多年积累的心血结晶,也是我在行业一线实战经验的总结。

这些学习资料不仅深入浅出,而且非常实用,让大家系统而高效地掌握AI大模型的各个知识点。如果你愿意花时间沉下心来学习,相信它们一定能为你提供实质性的帮助。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

大模型知识脑图

为了成为更好的 AI大模型 开发者,这里为大家提供了总的路线图。它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
在这里插入图片描述

经典书籍阅读

阅读AI大模型经典书籍可以帮助读者提高技术水平,开拓视野,掌握核心技术,提高解决问题的能力,同时也可以借鉴他人的经验。对于想要深入学习AI大模型开发的读者来说,阅读经典书籍是非常有必要的。

在这里插入图片描述

实战案例

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

在这里插入图片描述

面试资料

我们学习AI大模型必然是想找到高薪的工作,下面这些面试题都是总结当前最新、最热、最高频的面试题,并且每道题都有详细的答案,面试前刷完这套面试题资料,小小offer,不在话下

在这里插入图片描述

640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

在这里插入图片描述

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐