特征扩展是一种数据预处理技术,包括特征缩放、特征标准化、特征归一化、特征正则化等。本题考察的是特征缩放和特征标准化。
特征缩放是一种将输入数据转换为统一尺度的方法,它通过将输入数据中的每个元素进行缩放,来使得输入数据中的每个元素的值统一在某个尺度之下。
特征标准化是将输入数据转换为均值为0,方差为1的分布。
本题中要求了标准化和最大最小归一化,对应的公式为:
标准代码如下
def feature_scaling(data):
mean = np.mean(data, axis=0)
std = np.std(data, axis=0)
standardized_data = (data - mean) / std
min_val = np.min(data, axis=0)
max_val = np.max(data, axis=0)
normalized_data = (data - min_val) / (max_val - min_val)
return np.round(standardized_data,4).tolist(), np.round(normalized_data,4).tolist()
需要注意的是,scipy库中也有对应的特征缩放方法,这里给出一种实现方式
def feature_scaling(data):
from sklearn.preprocessing import StandardScaler, MinMaxScaler
scaler = StandardScaler()
standardized_data = scaler.fit_transform(data)
scaler = MinMaxScaler()
normalized_data = scaler.fit_transform(data)
return np.round(standardized_data,4).tolist(), np.round(normalized_data,4).tolist()