1.输入图片大小为200×200,依次经过一层卷积(kernel size 5×5,padding 1,stride 2),pooling(kernel size 3×3,padding 0,stride 1),又一层卷积(kernel size 3×3,padding 1,stride 1)之后,输出特征图大小为:
A.95
B.96
C.97
D.98

正确答案:C
题目解析:
输出尺寸=(输入尺寸-filter尺寸+2padding)/stride+1
计算尺寸不被整除只在GoogLeNet中遇到过。卷积向下取整,池化向上取整。
本题 (200-5+21)/2+1 为99.5,取99
(99-3)/1+1 为97
(97-3+2*1)/1+1 为97
研究过网络的话看到stride为1的时候,当kernel为 3 padding为1或者kernel为5 padding为2 一看就是卷积前后尺寸不变。

2.关于支持向量机SVM,下列说法错误的是()
A.L2正则项,作用是最大化分类间隔,使得分类器拥有更强的泛化能力
B.Hinge 损失函数,作用是最小化经验分类错误
C.分类间隔为1/||w||,||w||代表向量的模
D.当参数C越小时,分类间隔越大,分类错误越多,趋于欠学习

正确答案:C
题目解析:
A正确。考虑加入正则化项的原因:想象一个完美的数据集,y>1是正类,y<-1是负类,决策面y=0,加入一个y=-30的正类噪声样本,那么决策面将会变“歪”很多,分类间隔变小,泛化能力减小。加入正则项之后,对噪声样本的容错能力增强,前面提到的例子里面,决策面就会没那么“歪”了,使得分类间隔变大,提高了泛化能力。B正确。C错误。间隔应该是2/||w||才对,后半句应该没错,向量的模通常指的就是其二范数。
D正确。考虑软间隔的时候,C对优化问题的影响就在于把a的范围从[0,+inf]限制到了[0,C]。C越小,那么a就会越小,目标函数拉格朗日函数导数为0可以求出w=求和ai∗yi∗xi,a变小使得w变小,因此间隔2/||w||变大

3.在其他条件不变的前提下,以下哪种做法容易引起机器学习中的过拟合问题()
A.增加训练集量
B.减少神经网络隐藏层节点数
C.删除稀疏的特征 **
**D.SVM算法中使用高斯核/RBF核代替线性核

正确答案:D

造成过拟合的原因主要有:
1、训练数据不足,有限的训练数据
2、训练模型过度导致模型非常复杂,泛化能力差
选项A增加训练集可以解决训练数据不足的问题,防止过拟合
选项B对应使得模型复杂度降低,防止过拟合
选项C类似主成分分析,降低数据的特征维度,使得模型复杂度降低,防止过拟合
选项D使得模型的复杂化,会充分训练数据导致过拟合

4.下列时间序列模型中,哪一个模型可以较好地拟合波动性的分析和预测?
A.AR模型
B.MA模型
C.ARMA模型
D.GARCH模型

正确答案:D

https://blog.csdn.net/s1491695565/article/details/52093003

5.下列哪个不属于CRF模型对于HMM和MEMM模型的优势
A.特征灵活 **
**B.速度快

C.可容纳较多上下文信息
D.全局最优

正确答案:B

6.已知一组数据的协方差矩阵P,下面关于主分量说法错误的是()
A.主分量分析的最佳准则是对一组数据进行按一组正交基分解, 在只取相同数量分量的条件下,以均方误差计算截尾误差最小
B.在经主分量分解后,协方差矩阵成为对角矩阵
C.主分量分析就是K-L变换
D.主分量是通过求协方差矩阵的特征值得到

正确答案:C
题目解析:
K-L变换与PCA变换是不同的概念,PCA的变换矩阵是协方差矩阵,K-L变换的变换矩阵可以有很多种(二阶矩阵、协方差矩阵、总类内离散度矩阵等等)。当K-L变换矩阵为协方差矩阵时,等同于PCA。

7.以下关于PMF(概率质量函数),PDF(概率密度函数),CDF(累积分布函数)描述错误的是?
A.PDF描述的是连续型随机变量在特定取值区间的概率
B.CDF是PDF在特定区间上的积分
C.PMF描述的是离散型随机变量在特定取值点的概率
D.有一个分布的CDF函数H(x),则H(a)等于P(X<=a)

正确答案:A
题目解析:
概率质量函数(probability mass function,PMF)是离散随机变量在各特定取值上的概率。
概率密度函数(p robability density function,PDF )是对 连续随机变量 定义的,本身不是概率,只有对连续随机变量的取值进行积分后才是概率。
累积分布函数(cumulative distribution function,CDF) 能完整描述一个实数随机变量X的概率分布,是概率密度函数的积分。对于所有实数x 与pdf相对。

8.对于PCA说法正确的是 :
1我们必须在使用PCA前规范化数据
2我们应该选择使得模型有最大variance的主成分
3我们应该选择使得模型有最小variance的主成分
4我们可以使用PCA在低维度上做数据可视化

A.1, 2 and 4
B.2 and 4
C.3 and 4
D.1 and 3

正确答案:A
题目解析:
1)PCA对数据尺度很敏感,打个比方,如果单位是从km变为cm,这样的数据尺度对PCA最后的结果可能很有影响(从不怎么重要的成分变为很重要的成分).
2)我们总是应该选择使得模型有最大variance的主成分
3)有时在低维度上左图是需要PCA的降维帮助的

9.现在有 25 匹马,不知道每匹马的速度,也没有工具测量它们的速度。假如每场比赛最多只能 5 匹马参加,请问最少需要比多少次才能找出其中最快的 3 匹马?
A.6
B.7
C.8
D.9

正确答案:B

图片说明