华泰证券-算法-笔经

1.输入图片大小为200×200，依次经过一层卷积（kernel size 5×5，padding 1，stride 2），pooling（kernel size 3×3，padding 0，stride 1），又一层卷积（kernel size 3×3，padding 1，stride 1）之后，输出特征图大小为：
A.95
B.96
C.97
D.98

正确答案：C
题目解析：
输出尺寸=(输入尺寸-filter尺寸+2padding）/stride+1
计算尺寸不被整除只在GoogLeNet中遇到过。卷积向下取整，池化向上取整。
本题（200-5+21）/2+1 为99.5，取99
（99-3）/1+1 为97
（97-3+2*1）/1+1 为97
研究过网络的话看到stride为1的时候，当kernel为 3 padding为1或者kernel为5 padding为2 一看就是卷积前后尺寸不变。

2.关于支持向量机SVM,下列说法错误的是（）
A.L2正则项，作用是最大化分类间隔，使得分类器拥有更强的泛化能力
B.Hinge 损失函数，作用是最小化经验分类错误
C.分类间隔为1/||w||，||w||代表向量的模
D.当参数C越小时，分类间隔越大，分类错误越多，趋于欠学习

正确答案：C
题目解析：
A正确。考虑加入正则化项的原因：想象一个完美的数据集，y>1是正类，y<-1是负类，决策面y=0，加入一个y=-30的正类噪声样本，那么决策面将会变“歪”很多，分类间隔变小，泛化能力减小。加入正则项之后，对噪声样本的容错能力增强，前面提到的例子里面，决策面就会没那么“歪”了，使得分类间隔变大，提高了泛化能力。B正确。C错误。间隔应该是2/||w||才对，后半句应该没错，向量的模通常指的就是其二范数。
D正确。考虑软间隔的时候，C对优化问题的影响就在于把a的范围从[0，+inf]限制到了[0,C]。C越小，那么a就会越小，目标函数拉格朗日函数导数为0可以求出w=求和ai∗yi∗xi，a变小使得w变小，因此间隔2/||w||变大

3.在其他条件不变的前提下，以下哪种做法容易引起机器学习中的过拟合问题（）
A.增加训练集量
B.减少神经网络隐藏层节点数
C.删除稀疏的特征 **
**D.SVM算法中使用高斯核/RBF核代替线性核

正确答案：D

造成过拟合的原因主要有：
1、训练数据不足，有限的训练数据
2、训练模型过度导致模型非常复杂，泛化能力差
选项A增加训练集可以解决训练数据不足的问题，防止过拟合
选项B对应使得模型复杂度降低，防止过拟合
选项C类似主成分分析，降低数据的特征维度，使得模型复杂度降低，防止过拟合
选项D使得模型的复杂化，会充分训练数据导致过拟合

4.下列时间序列模型中,哪一个模型可以较好地拟合波动性的分析和预测？
A.AR模型
B.MA模型
C.ARMA模型
D.GARCH模型

正确答案：D

https://blog.csdn.net/s1491695565/article/details/52093003

5.下列哪个不属于CRF模型对于HMM和MEMM模型的优势
A.特征灵活 **
**B.速度快
C.可容纳较多上下文信息
D.全局最优

正确答案：B

6.已知一组数据的协方差矩阵P,下面关于主分量说法错误的是（）
A.主分量分析的最佳准则是对一组数据进行按一组正交基分解, 在只取相同数量分量的条件下,以均方误差计算截尾误差最小
B.在经主分量分解后,协方差矩阵成为对角矩阵
C.主分量分析就是K-L变换
D.主分量是通过求协方差矩阵的特征值得到

正确答案：C
题目解析：
K-L变换与PCA变换是不同的概念，PCA的变换矩阵是协方差矩阵，K-L变换的变换矩阵可以有很多种（二阶矩阵、协方差矩阵、总类内离散度矩阵等等）。当K-L变换矩阵为协方差矩阵时，等同于PCA。

7.以下关于PMF(概率质量函数),PDF(概率密度函数),CDF(累积分布函数)描述错误的是？
A.PDF描述的是连续型随机变量在特定取值区间的概率
B.CDF是PDF在特定区间上的积分
C.PMF描述的是离散型随机变量在特定取值点的概率
D.有一个分布的CDF函数H(x),则H(a)等于P(X<=a)

正确答案：A
题目解析：
概率质量函数(probability mass function，PMF)是离散随机变量在各特定取值上的概率。
概率密度函数（p robability density function，PDF ）是对连续随机变量定义的，本身不是概率，只有对连续随机变量的取值进行积分后才是概率。
累积分布函数（cumulative distribution function，CDF）能完整描述一个实数随机变量X的概率分布，是概率密度函数的积分。对于所有实数x 与pdf相对。

8.对于PCA说法正确的是 :
1我们必须在使用PCA前规范化数据
2我们应该选择使得模型有最大variance的主成分
3我们应该选择使得模型有最小variance的主成分
4我们可以使用PCA在低维度上做数据可视化

A.1, 2 and 4
B.2 and 4
C.3 and 4
D.1 and 3

正确答案：A
题目解析：
1）PCA对数据尺度很敏感,打个比方,如果单位是从km变为cm,这样的数据尺度对PCA最后的结果可能很有影响(从不怎么重要的成分变为很重要的成分).
2）我们总是应该选择使得模型有最大variance的主成分
3）有时在低维度上左图是需要PCA的降维帮助的

9.现在有 25 匹马，不知道每匹马的速度，也没有工具测量它们的速度。假如每场比赛最多只能 5 匹马参加，请问最少需要比多少次才能找出其中最快的 3 匹马？
A.6
B.7
C.8
D.9

正确答案：B

图片说明