不是江小白
不是江小白
全部文章
分类
CSS3(1)
Docker(2)
Git使用(2)
Leetcode题解(7)
MySQL(16)
Python(19)
Python图片识别(2)
小程序(2)
工具安装(11)
数据分析(8)
数据分析思维与实战23讲思维导图(1)
数据分析面试题汇总(4)
机器学习(10)
重整《数据分析实战45讲》(4)
题解(36)
归档
标签
去牛客网
登录
/
注册
不是江小白的博客
非典型 程序员
TA的专栏
32篇文章
2人订阅
题解 - >剑指Offer和算法篇
22篇文章
4317人学习
MySQL题解
10篇文章
4309人学习
题解-->数据分析篇
0篇文章
0人学习
全部文章
(共130篇)
数据去重的各种方法汇总(一)
这几天多次遇到数据去重的问题,所以打算整理一下几种不同类型的数据去重的方法(这里主要汇总Python列表、字典、Excel、数据库的MySQL以及Pandas的Dataframe),暂不更新Leetcode数据库的题解。 Python列表、字典去重 看下面这个例子和第一种解法set()...
2020-12-04
0
678
数据去重的各种方法汇总(二)
接上文,上篇讲了Python列表和字典的去重方法,本篇主要总结Excel和MySQL的去重方法。 Excel去重 解法一:直接使用【数据】—>【删除重复值】按钮,下面看示例和图解步骤: 先选中你要删除重复值的那一列数据,然后再按照上图👆的步骤走。 接着就是确认你要删除的重...
2020-12-04
0
819
数据去重的各种方法汇总(三)
Pandas去重DataFrame 接上篇,这篇就剩最后的用Pandas对DataFrame里面的数据去重,这里也有两种方法,可以直接看官方文档(但是掌柜觉得其实就是一种方法,因为第一种只是显示哪些重复。。。): 使用duplicated方法,它会返回一个布尔向量,其长度为行数,表示行是否重...
2020-12-04
0
684
Leetcode题解之database(四)185. Department Top Three Salaries
今天要解的题目是👉:185. Department Top Three Salaries(部门工资排前三的员工) 这题考察的知识点👉:两表连接JOIN的使用以及子查询 此题思路一👉:既然要查部门工资排前三,那么我们要知道有哪些部门?这里就要使用JOIN连接两表得到各个部门信息,然后再在各部...
2020-12-04
0
677
数据分析面试、笔试题汇总+解析(一)
这几天遇到了好几个面试,现在总结一下面试题以及相应的解法。(虽然面试的时候掌柜发挥的不怎么好,没有拿到offer。但是换个角度想想,通过多面试去发现自己的不足,也对自己是另一种锻炼和成长吧😁。)好了,言归正传,下面看面试题,因为这个公司偏向于用Python来处理数据和挖掘数据,所以面试的问题也都是...
2020-12-04
1
2128
数据分析面试、笔试题汇总+解析(二)
继续之前的面试题解析,下面是第二题: 求1 +3!+5!+7!+9!+50!之和。 这道题其实考察的是用递归解决阶乘问题,查阅过后发现有三种方法可解(不过掌柜觉得其实是两种)。下面👇看第一种解法,常规思路:先找出单个阶乘的函数表达式后再求和: 应该不难理解第一种解法,下面尝试第二种解法...
2020-12-04
0
876
数据分析面试、笔试题汇总+解析(三)
接着昨天的面试题,今天解决五六七八题: 新建属性列,提取日期中的月份 根据id和月份,做数据透视表;分别求出每个id在不同月份的消费笔数、消费总额 合并信息表和数据透视表;按id合并 数据脱敏,将文本信息匿名化 首先来解决第五题👉:新建属性列,提取日期中的月份 接着要提取日期...
2020-12-04
0
803
数据分析面试、笔试题汇总+解析(四)
今天解决最后一道题👉:把数据集随机划分为训练集和测试集,按8:2的比例。(本来应该周六就更新的,因为临时接了朋友一个自动下单程序的需求就耽搁了😂) 一般情况都会用传统定比随机划分(掌柜自己取得名字。。。也有人叫留出法?)法,即使用sklearn库里面的model_selection模块的tra...
2020-12-04
0
881
回炉整理《数据分析实战45讲》之基础篇 -- 11.数据清洗(一)
之前学了陈旸老师的《数据分析实战45讲》(掌柜现在觉得该课程偏向于技术方向的数据挖掘),让掌柜对数据分析的工具(主要是Pandas、Numpy、Matplotlib以及Scikit-learn)使用和步骤有了一个大致的了解。 但是学完后还是觉得里面漏了一些细节的东西,比如时间序列那里没有讲对差分次...
2020-12-04
1
766
回炉整理《数据分析实战45讲》之基础篇 -- 11.数据清洗(二)
上篇补了 “完全合一” 中的“完整性”这个部分掌柜觉得需要了解的知识点,接下来继续看全面性。还是回到服装店会员数据表那里,掌柜觉得这里的“全面性”指的是数据要规范:即大小写要统一、有单位的要统一单位、数据长度也要一致(小数点后面是几位都要统一)、数据名称保持一致等。 那么再看这里的表格可以发现...
2020-12-04
0
814
首页
上一页
3
4
5
6
7
8
9
10
11
12
下一页
末页