关于 SPSA 调优实用的指导方针 - 代码天地

关于 SPSA 调优实用的指导方针

其他 2021-03-25 18:00:59 阅读次数: 0

要调优 SPSA，请参阅 Spall 在他的书中介绍的半自动调优方法随机搜索与优化导论（ISSO）。

有 3 个主要的变量，两个增益序列（_a_ 和 _c_）和扰动分布，δ。

δ 最好选择为 Bernoulli（+/- 1），因为它是渐近最优的（它不能是正态或均匀的，参见 ISSO）。

关于增益序列的性质有一些规则。标准格式很好用，遵循以下格式：

a(k) = a / (k + 1 + A) ^ alpha
c(k) = c / (k + 1) ^ gamma

这里，alpha 和 gamma 的值是联系在一起的，渐近最优的是 _alpha_ = 1 和 _gamma_ = 1/6，但是值 _alpha_ = .602 和 _gamma_ = .101 对于有限情况是适用的。
_A_ 约为总迭代次数的 10 %，_c_ 约为标准误差损失函数的。
_a_ 是最易失性的参数，必须仔细调优。

一般来说，应该选择 _a_（通过选择 _R_），使第一步不会太大，从而使算法向错误的方向发送。

为了能够成功地使用 SPSA 进行调优，需要确定系数 ck 和 Rk 的良好值。
在大多数情况下，确定理想值是不可能的。
对于评估相关参数，我们成功地使用了以下值：

最后一次迭代的：

参数	位置	值
Rk	CSV-file，列 5	0.002
ck	CSV-file，列 4	4 centipawns（8，在 Stockfish 的内部）

但是如果 parameter 在 elo 上非常不敏感，则需要使用较大的 ck 值。
此外，如果你对参数的 elo 敏感性有一些想法，以及它离最优值有多远，你可以使用内置的模拟器来发现 Rk 和 ck 的良好值。

猜你喜欢

转载自blog.csdn.net/ad44275783/article/details/114154945

关于 SPSA 调优实用的指导方针

C++核心指导方针(转)

关于调优

关于MapReduce的调优

关于JVM调优

关于MQ调优（续）

关于Solr的maxWarmingSearchers的调优

美国 AGU 发布 AI 应用手册，明确 6 大指导方针

关于系统调优之前端调优_

Meta为全天候AR眼镜设计了AI系统的八大指导方针

elasticsearch调优checklist-关于jvm

关于SQL调优与报表的性能优化

关于Linux环境调优(tomcat)

关于论文指导

关于如何指导别人

关于指导新人的感想

ATFX疫情之下开创新模式，网络研讨会精彩纷呈。自从各国政府制定指导方针并建议人们呆在家里以来，AT

Debian自由软件指导方针（英語：，简称）是Debian项目用来判断自由软件许可证的方针，以决定某软件是否可以包含在Debian之中。它是Debian社群契约的一部分。

关于sqlserver2008数据库调优

关于Spark性能调优的一些观点

机器学习——神经网络关于学习率的调优

关于MySQL数据库调优的几点心得

关于使用 VisualVM 进行性能分析及调优

关于JVM中各种参数的总结，调优，分析

【性能篇】关于Java性能调优你了解吗

关于数据库调优，看这些就够了

关于迅雷与优酷

关于回调函数

关于测试策略，测试方针，测试计划，测试方案的理解

关于锚点的简单实用

今日推荐

手把手教你用 LangChain 实现大模型 Agent

外星人入侵（python）

超全的免费chatGPT列表【建议收藏】

52.2k star! 自己部署gpt4free, 免费使用各种GPT

2024年（第十届）全国大学生统计建模大赛优秀论文解析——中国经济发展与碳排放库兹涅茨曲线的验证研究

【自动驾驶技术】自动驾驶汽车AI芯片汇总——NVIDIA篇

7个免费的ChatGPT网站，给大家送上

Angular v18 正式发布！

【VMware】 vCenter Converter standalone 6.6.0正式版下载

开源日报 | Angular v18；大模型价格战下的推理优化；Mistral AI以开源模型瞄准美国市场；硅谷有自己的鲁迅

数学建模Matlab之数据预处理方法

充电桩---ISO15118协议详细介绍

周排行

keepalived实现LB配置

数据库相关中间件收录集

Spring Boot 入门之 Web 篇（二） Spring Boot 入门之 Web 篇（二）

gitee 搭建个人网站

Java校招基础知识总结（横扫BAT,就业经验交流会演讲稿）

工程管理器

Delphi定位TDataSet数据集最后一条记录

cocos2dx笔记1:概述

Java实现 LeetCode 110 平衡二叉树

MacBook IDEA激活码

每日归档

更多

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)

2024-05-24(65)

2024-05-23(9)

2024-05-22(41)

2024-05-21(8)