前言

对于一串数字序列(或者一个平面),我们要得到其中每个位置得相对位置,但这段数字可能存在间隔十分大,从而产生类似于稀疏矩阵这样浪费空间的问题(这个形容可能不恰当),比如我们要对这段序列进行桶排序类似物的处理。这是我们可以对其进行求出相对位置(也可以理解为这个数字在这段序列中的排名),而不是原本的绝对位置,利用离散化可以解决这样的问题。

离散化,把无限空间中有限的个体映射到有限的空间中去,以此提高算法的时空效率。
通俗的说,离散化是在不改变数据相对大小的条件下,对数据进行相应的缩小。例如:
原数据:1,999,100000,15;处理后:1,3,4,2;
原数据:{100,200},{20,50000},{1,400};
处理后:{3,4},{2,6},{1,5};

摘自百度百科

离散化

方法一,

适用于所有情况(sort + unique + lower_bound)三段式:
1,将数据集arr1的内容复制到arr2中,并排序
2,利用unique将arr2中去重(前提有序,已做)
3,利用lower_bound函数查询arr1每个数字的排名

方法二,

只适用于无重复的情况:
1,定义一个类中排序前的位置以及值得两个成员变量
2,根据值排序
3,根据排序前得位置(成员变量idx)赋值当前排序后得排名


测试代码

#include <iostream>
#include <algorithm>

using namespace std;
const int maxn = (int)1e4+5;

//方法1
int arr1[maxn],arr2[maxn],rank1[maxn];
void solve_1 (int n) {
	
	cout << "============方法1处理结果============\n" << '\n';
	
	for (int i = 1; i <= n; i++) {
		cin >> arr1[i];
		arr2[i] = arr1[i];
	}
	sort(arr2 + 1, arr2 + 1 + n); // 有序
	
	int len = unique(arr2 + 1, arr2 + 1 + n) - arr2 - 1; // 去重
	cout << "len = " << len << '\n';

	for(int i = 1; i <= n; i++) {
		rank1[i] = lower_bound(arr2 + 1, arr2 + 1 + len, arr1[i]) - arr2;
	}

	cout << "rank:" << '\n';
	for (int i = 1; i <= n; i++) {
		cout << "val = " << arr1[i] << " rank = " << rank1[i] << '\n';
	}
	cout << "=====================================\n" << '\n';
}

//方法2
struct Node {
	int val,idx;
	bool operator < (const Node& A) const {
		if(val < A.val) {
			return true;
		}
		return false;
	}
};

int rank2[maxn],tmp[maxn]; Node arr3[maxn];
void solve_2 (int n) {
	cout << "============方法2处理结果============\n" << '\n';

	for (int i = 1; i <= n; i++) {
		cin >> arr3[i].val;
		arr3[i].idx = i;
		tmp[i] = arr3[i].val;
	}
	sort(arr3 + 1, arr3 + 1 + n); // 有序

	for(int i = 1; i <= n; i++) {
		rank2[arr3[i].idx] = i;
	}

	cout << "rank:" << '\n';
	for (int i = 1; i <= n; i++) {
		cout << "val = " << tmp[i] << " rank = " << rank2[i] << '\n';
	}
	cout << "=====================================\n" << '\n';
}



int main() {
	solve_1(6);  //重复 input:6 1000 2001 7 1000 305
	solve_1(6);  //非重复 input:6 1000 2001 7 10001 560
	solve_2(6);  //非重复 input:6 1000 2001 7 10001 560
	return 0;
}