牛客题解官

分类

题解(475)

/ 注册

TA的专栏 74篇文章 12人订阅

牛客代码笔记-牛栋

74篇文章 357人学习

全部文章（共788篇）

题解|SGDM（带动量的随机梯度下降）

SGDM(带冲量的随机梯度下降)是SGD的一种改进，在SGD的基础上增加了冲量，可以加速收敛。简单点说，就是每次更新参数时，不仅考虑当前的梯度，还考虑之前的梯度。使用动量代替梯度。梯度下降以及批量梯度下降的原理不再赘述，这里只给出SGDM的公式：其中，是第次迭代时的参数，是学习率， ...

2025-02-06

0 118

题解|Adam优化器

Adam优化器是一种常用的优化算法，用于训练深度学习模型。它结合了动量法和自适应学习率的方法，能够有效地加速模型的训练过程。其步骤如下： 1. 初始化参数：初始化一阶动量和二阶动量，通常设为 0。初始化学习率。初始化动量衰减系数和，通常设为 0.9 和 0.999。初始化小常...

2025-02-06

0 130

题解|实现长短期记忆（LSTM）网络

长短期记忆（LSTM）网络是循环神经网络的一种，其特点是能够处理长序列数据。LSTM网络的数学推导可以参考相关资料。 LSTM的具体步骤如下：计算遗忘门计算输入门计算细胞状态更新计算输出门其中，是sigmoid函数，表达式为，是tanh函数，表达式为。 5. 计算隐藏状...

2025-02-06

0 99

题解|实现一个简单的循环神经网络

循环神经网络（RNN）是一种能够处理序列数据的神经网络，其特点是能够处理时间序列数据。 RNN的具体步骤如下：计算隐藏状态更新计算输出计算损失反向传播本题只要求实现前向传播，反向传播不要求实现。标准代码如下 def rnn_forward(input_sequence...

2025-02-06

0 49

题解|实现自注意力机制

自注意力机制（Self-Attention Mechanism）是一种能够捕获序列内部元素之间关系的机制，它通过计算序列中每个元素与其他所有元素的相关性来实现信息的有效整合。其基本思想是将输入序列映射为查询(Query)、键(Key)和值(Value)三个矩阵，然后通过计算查询和键的相似度得到注意力...

2025-02-06

1 116

题解|实现Adam优化算法

Adam优化算法是一种自适应学习率的优化算法，其计算步骤如下：初始化参数计算梯度更新动量更新方差更新参数这里对动量和方差进行了偏差修正，以避免初始阶段的不稳定；对新参数更新的时候加上了，以避免除0错误。标准代码如下 def adam_optimizer(f, g...

2025-02-06

0 98

题解|简单二维卷积

简单二维卷积（Simple 2D Convolution）是一种常用的卷积操作，其计算公式为：其中，是输入图像，是卷积核，是输出图像。通俗点来说，就是将卷积核在输入图像上滑动，计算每个位置的卷积结果，从而实现图像的特征提取，利用padding和stride保证卷积核在输入图像的边缘也能进行卷积...

2025-02-06

0 66

题解|实现基本自动微分操作

实现基本自动微分操作（Basic Automatic Differentiation）是一种常用的自动微分方法，用于计算函数的导数。所谓的自动计算微分，就是通过计算图，从输入到输出，反向传播，计算每个节点的导数。而这个计算图，通俗点来说就是高中所学到的链式法则需要画的函数关系图，也可以理解为深度学...

2025-02-06

0 78

题解|具有反向传播的单神经元

具有反向传播的单神经元（Single Neuron with Backpropagation）是神经网络中的最常见的基本单元。本算法的步骤如下：初始化权重和偏置前向传播，计算预测值反向传播，计算梯度本题选择的均方误差作为损失函数，公式为因此，梯度计算公式为更...

2025-02-06

0 53

题解|生成对抗网络（GAN）

生成式对抗网络，通俗点说，就是一对买卖家在博弈，卖家（生成器）生成假数据想“以次充好”，买家（判别器）判断数据是真是假。在本题中，生成器通过将真实数据和噪声相加，得到生成数据。判别器通过sigmoid函数生成一个概率来判断数据是真实的还是生成的。标准代码 import numpy as np d...

Python3

2025-02-06

0 74