混合专家系统（MoE）

其他 2018-11-28 13:34:32 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/Zoe_Su/article/details/78488143

混合专家系统（Mixture of Experts）

原理：

混合专家系统（MoE）是一种神经网络，也属于一种combine的模型。适用于数据集中的数据产生方式不同。不同于一般的神经网络的是它根据数据进行分离训练多个模型，各个模型被称为专家，而门控模块用于选择使用哪个专家，模型的实际输出为各个模型的输出与门控模型的权重组合。各个专家模型可采用不同的函数（各种线性或非线性函数）。混合专家系统就是将多个模型整合到一个单独的任务中。

混合专家系统有两种架构：competitive MoE 和cooperative MoE。competitive MoE中数据的局部区域被强制集中在数据的各离散空间，而cooperative MoE没有进行强制限制。

对于较小的数据集，该模型的表现可能不太好，但随着数据集规模的增大，该模型的表现会有明显的提高。

定义X为N*d维输入，y为N*c维输出,K为专家数， $\lambda$ 为学习率：
$for\ j\ in (0...(d-1))\ and\ i\ in\ (0...(c-1))$ :
各专家输出为: $V_{ik}=w_{ik}x$
(其中 $w_{ik}$ 为第k个专家模型对第i列输出的权重， $V_{ik}$ 为第k个专家对第i列的预测。（ $w_{ik}$ 添加了bias所以输出为d+1维）)

第k个专家输出均值为： $m_{k}=\sum_{i=0}^{c-1}V_{ik}$

门限模块输出为： $g_{k}=\frac{e^{m_{k}^{T}}}{\sum_{k}e^{m_{k}^{T}}}$
输出 $y_i$ 通过softmax函数转成概率值为： $y_{si}=\frac{e^{y_{i}}}{\sum_{i}e^{y_{i}}}$

对于Cooperative MoE：
$\Delta w_{ik}=\lambda(y_{i}-y_{si})g_{k}x$
$\Delta m_{k}=\lambda(y_{i}-y_{si})(v_{ik}-y_{si})g_{k}x$

对于Competitive MoE：
$\Delta w_{ik}=\lambda f_{k}(y_{i}-y_{ik})x$
$\Delta m_{k}=\lambda (f_{k}-g_{k})x$
$y_{ik}=\frac{e^{V_{ik}}}{\sum_{i}e^{V_{ik}}}$
$f_{k}=\frac{g_{k}e^{\sum_{i}y_{i}logy_{ik}}}{\sum_{l}g_{l}e^{\sum_{i}y_{i}logy_{ik}}}$

实验结果：

不同数据集相同k值：

k=2使用线性数据集，采用SGD和FTRL两种训练方式，结果如下：
k=2使用非线性数据集，采用SGD和FTRL两种训练方式，结果如下：

相同数据集不同k值：

k=1:
k=2:
k=4:

猜你喜欢

转载自blog.csdn.net/Zoe_Su/article/details/78488143

混合专家系统（MoE）

pyKE专家系统

专家系统好网站

动物识别专家系统

专家系统的缺点 (drawback) 与优点

智能模糊专家系统

基于规则的智能专家系统

专家系统的推理引擎

Hololens 远程专家系统

C# winform 动物识别专家系统

专家系统--pyKE小例01

人工智能之专家系统

动物识别专家系统（C++版）

专家系统中的推理机实现

浅谈科学元勘与专家系统

人工智能 7.专家系统

Problem B: 专家系统解题报告

专家系统 - 二分 - 线段树

尼克 | 从专家系统到知识图谱

基于SSM框架的JAVA题库专家系统

基于框架的智能专家系统(后补)

动物识别专家系统 Java 简单实现

JavaScript 实现动物专家系统「续」拓扑序列

JavaScript 实现动物识别专家系统交互演示

0X8专家系统

NLP(8): 专家系统和good turning smoothing

专家系统基础篇一、专家系统是干啥类与知识库菜鸟说

实现了一下动物识别系统---基于专家系统

基于产生式系统的小型专家系统--动物识别

基于Python的动物识别专家系统--20180515人工智能作业

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

OOP第二次作业

java web 乱码问题

android 禁止scrollview 因控件变化自动滚动到底的方法

mysql服务解压版的安装(5.7)

centos7 nginx+tomcat配置https 安装免费SSL Let’s Encrypt

使用Mosquitto遗嘱机制实现感知客户端上下线功能的方法

面向对象之------多态与多态性

开发Teams Tabs应用程序

C# 希尔排序

第2章 Jupyter Notebooks

每日归档

更多

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)