强化学习

1、策略改善的方法。
1.1 greedy
1.2 epsilon-greedy
2、value-based 方法与policy-based 方法的区别。

计算机

1、HashMap、HashTable区别
2、HashMap手写put、get。get的问题!!! get找到桶以后比较key,他们key是不相同的

题目

1、String s = "-12.32ab.5392" 找最大最小int
使用Double.parseDouble