几种归一化方法的概念及python实现

一　(0,1)标准化：这是最简单也是最容易想到的方法，通过遍历feature vector里的每一个数据，将Max和Min的记录下来，并通过Max-Min作为基数（即Min=0，Max=1）进行数据的归一化处理：python的代码实现：#-*-coding:utf-8-*-import numpy as npdef MaxMinNormalization(x,Max,Min):...

Python 学习者

5656人浏览 · 2020-03-28 15:30:15

Python 学习者 · 2020-03-28 15:30:15 发布

一　(0,1)标准化：

这是最简单也是最容易想到的方法，通过遍历feature vector里的每一个数据，将Max和Min的记录下来，并通过Max-Min作为基数（即Min=0，Max=1）进行数据的归一化处理：

在这里插入图片描述
python的代码实现：

#-*-coding:utf-8-*- 
import numpy as np

def MaxMinNormalization(x,Max,Min):
    x = (x - Min) / (Max - Min);
    return x;

a = np.array([[1,2,3],[4,5,6]])
print(MaxMinNormalization(a,3,0))

二　Z-score标准化：

这种方法给予原始数据的均值（mean）和标准差（standard deviation）进行数据的标准化。

经过处理的数据符合标准正态分布，即均值为0，标准差为1，这里的关键在于复合标准正态分布，个人认为在一定程度上改变了特征的分布，关于使用经验上欢迎讨论，转化函数为：

在这里插入图片描述

这里一样，mu（即均值）用np.average()，sigma（即标准差）用np.std()即可.

python的源码实现:

'''
遇到问题没人解答？小编创建了一个Python学习交流QQ群：579817333 
寻找有志同道合的小伙伴，互帮互助,群里还有不错的视频学习教程和PDF电子书！
'''
def Z_ScoreNormalization(x,mu,sigma):
    x = (x - mu) / sigma;
    return x;


b = np.array([[1,2,3],[4,5,6]])
print(Z_ScoreNormalization(b,b.mean(),b.std()))

三　Sigmoid函数

Sigmoid函数是一个具有S形曲线的函数，是良好的阈值函数，在(0, 0.5)处中心对称，在(0, 0.5)附近有比较大的斜率而当数据趋向于正无穷和负无穷的时候，映射出来的值就会无限趋向于1和0.

个人非常喜欢的“归一化方法”，之所以打引号是因为我觉得Sigmoid函数在阈值分割上也有很不错的表现，根据公式的改变，就可以改变分割阈值，这里作为归一化方法，我们只考虑(0, 0.5)作为分割阈值的点的情况：

在这里插入图片描述

python 源码：

def sigmoid(X,useStatus):
    if useStatus:
        #return 1.0 / (1 + np.exp(-float(X)))
        return 1.0 / (1 + np.exp(-X))
    else:
        return float(X)

c = np.array([[1,2,3],[4,5,6]])
print(sigmoid(c,1))

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

UFW防火墙安全指南

UFW（Uncomplicated Firewall）是Ubuntu/Debian系统中简化防火墙管理的工具，通过直观命令帮助用户有效控制网络流量，提升系统安全性。文章详细介绍了UFW的基本命令，包括启停防火墙、添加规则、限制连接速率和日志配置等操作，并提供了安全最佳实践，如默认拒绝策略、IP地址限制和服务级规则管理。同时，还涵盖高级配置技巧，例如多网络接口设置、规则优先级调整、IPv6支持及与f