前言

对于一串数字序列(或者一个平面)，我们要得到其中每个位置得相对位置，但这段数字可能存在间隔十分大，从而产生类似于稀疏矩阵这样浪费空间的问题(这个形容可能不恰当)，比如我们要对这段序列进行桶排序类似物的处理。这是我们可以对其进行求出相对位置（也可以理解为这个数字在这段序列中的排名），而不是原本的绝对位置，利用离散化可以解决这样的问题。

离散化，把无限空间中有限的个体映射到有限的空间中去，以此提高算法的时空效率。
通俗的说，离散化是在不改变数据相对大小的条件下，对数据进行相应的缩小。例如：
原数据：1,999,100000,15；处理后：1,3,4,2；
原数据：{100,200}，{20,50000}，{1,400}；
处理后：{3,4}，{2,6}，{1,5}；

摘自百度百科

离散化

方法一，

适用于所有情况(sort + unique + lower_bound)三段式：
1，将数据集arr1的内容复制到arr2中，并排序
2，利用unique将arr2中去重(前提有序，已做)
3，利用lower_bound函数查询arr1每个数字的排名

方法二，

只适用于无重复的情况:
1，定义一个类中排序前的位置以及值得两个成员变量
2，根据值排序
3，根据排序前得位置(成员变量idx)赋值当前排序后得排名

测试代码

#include <iostream>
#include <algorithm>

using namespace std;
const int maxn = (int)1e4+5;

//方法1
int arr1[maxn],arr2[maxn],rank1[maxn];
void solve_1 (int n) {
	
	cout << "============方法1处理结果============\n" << '\n';
	
	for (int i = 1; i <= n; i++) {
		cin >> arr1[i];
		arr2[i] = arr1[i];
	}
	sort(arr2 + 1, arr2 + 1 + n); // 有序
	
	int len = unique(arr2 + 1, arr2 + 1 + n) - arr2 - 1; // 去重
	cout << "len = " << len << '\n';

	for(int i = 1; i <= n; i++) {
		rank1[i] = lower_bound(arr2 + 1, arr2 + 1 + len, arr1[i]) - arr2;
	}

	cout << "rank:" << '\n';
	for (int i = 1; i <= n; i++) {
		cout << "val = " << arr1[i] << " rank = " << rank1[i] << '\n';
	}
	cout << "=====================================\n" << '\n';
}

//方法2
struct Node {
	int val,idx;
	bool operator < (const Node& A) const {
		if(val < A.val) {
			return true;
		}
		return false;
	}
};

int rank2[maxn],tmp[maxn]; Node arr3[maxn];
void solve_2 (int n) {
	cout << "============方法2处理结果============\n" << '\n';

	for (int i = 1; i <= n; i++) {
		cin >> arr3[i].val;
		arr3[i].idx = i;
		tmp[i] = arr3[i].val;
	}
	sort(arr3 + 1, arr3 + 1 + n); // 有序

	for(int i = 1; i <= n; i++) {
		rank2[arr3[i].idx] = i;
	}

	cout << "rank:" << '\n';
	for (int i = 1; i <= n; i++) {
		cout << "val = " << tmp[i] << " rank = " << rank2[i] << '\n';
	}
	cout << "=====================================\n" << '\n';
}



int main() {
	solve_1(6);  //重复 input:6 1000 2001 7 1000 305
	solve_1(6);  //非重复 input:6 1000 2001 7 10001 560
	solve_2(6);  //非重复 input:6 1000 2001 7 10001 560
	return 0;
}

离散化处理介绍

前言

摘自百度百科

离散化

方法一，

方法二，