加载中...
avatar
文章
48
标签
20
分类
8

首页
归档
标签
分类
音乐
友链
关于
Blog of Guo12181
首页
归档
标签
分类
音乐
友链
关于

深度学习基础笔记(四)

发表于2023-02-25|更新于2023-10-21|深度学习
|字数总计:5|阅读时长:1分钟|阅读量:
文章作者: Guo12181
文章链接: http://guo12181.github.io/2023/02/25/dl-3/
版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 Blog of Guo12181!
笔记个人深度学习
cover of previous post
上一篇
算法笔记(一)基础算法部分
cover of next post
下一篇
深度学习基础笔记(三)
相关推荐
cover
2022-11-05
深度学习基础笔记(一)
cover
2024-04-08
深度学习理论学习(三)注意力机制及其评分函数
cover
2022-11-12
深度学习基础笔记(二)
cover
2024-04-08
深度学习理论学习(四)多头注意力、自注意力和位置编码
cover
2024-04-08
深度学习理论学习(五)Transformer模型架构
cover
2024-04-26
深度学习理论学习(六)Embedding
avatar
Guo12181
未来ガジェット研究所
文章
48
标签
20
分类
8
公告
不定期更新,加密文章为个人笔记,暂无公开计划
目录
  1. 1. 参数的更新
    1. 1.1. SGD
    2. 1.2. SGD的缺点
    3. 1.3. Momentum
    4. 1.4. AdaGrad
    5. 1.5. Adam
    6. 1.6. 如何选择更新方法
    7. 1.7. 基于MNIST数据集的更新方法的比较
  2. 2. 权重的初始值
    1. 2.1. 权重值能否设为0
    2. 2.2. 隐藏层的激活值的分布
    3. 2.3. ReLU的权重初始值
    4. 2.4. 基于MNIST数据集的权重初始值的比较
  3. 3. Batch Normalization
    1. 3.1. Batch Normalization 的算法
    2. 3.2. Batch Normalization的评估
  4. 4. 正则化
    1. 4.1. 过拟合
    2. 4.2. 权值衰减
    3. 4.3. Dropout
  5. 5. 超参数的验证
    1. 5.1. 验证数据
    2. 5.2. 超参数的最优化
    3. 5.3. 超参数最优化的实现
  6. 6. 章节总结
最新文章
深度学习理论学习(六)Embedding2024-04-26
深度学习理论学习(五)Transformer模型架构2024-04-08
深度学习理论学习(四)多头注意力、自注意力和位置编码2024-04-08
深度学习理论学习(三)注意力机制及其评分函数2024-04-08
深度学习理论学习(二)编码器-解码器架构和seq2seq2024-04-08
©2021 - 2025 By Guo12181
框架 Hexo|主题 Butterfly