福哥答案2020-08-16:
知乎答案
1.数据任务执行过慢,速度不能满足报表需求,例如每小时的报表,执行时间超过1小时了,第二小时的报表任务又来了。
2.占用过多资源,跑这个任务的时候,整个集群的资源全被吃掉了,或者吃掉很多,影响了线上在线正常业务,这就非常需要优化。一般考虑先移出到其他集群,停止对线上业务的影响,之后优化。
3.数据分析准确性出了问题,例如线上业务字段增加了新的类型,例如原来的type字段只有1,2,3,现在增加了新的4,5,6,导致数据分析不够准确,这时候需要针对可能以后业务会扩展的字段类型进行优化。