做实验2 - 代码天地

做实验2

其他 2019-04-18 00:14:50 阅读次数: 0

最近基本零进展。出现的问题：
1）GAN训练不好：
2）multi-gpu没有弄好，
应该：把所有的model和loss集成到一个class下。

计划：
1）GAN为什么会collapse：
–》观察：
G使用sample生成结果，reward一直是＜0.2。
D对于loss_fake,在5个epoch之后稳定在0.5。无法判断G的回答是否有用。于是collapse。
G预训练结果不好。是一个问题。
–》发现seqgan的数据集是初始N（0，1），使用lstm生成的长度为20的句子。所以用在dialogue上不好用，是肯定的。
所以我应该去看lijiwei的代码，因为他是用在dialogue而且是对seqgan改动的初期。
-》
使用李纪为的方法，batch_size=128，尽力对G预训练好一些，在GAN中，D5G1，G训练时加入teacher-forcing,learning-rate使用1e-3.clip_grad_norm_使用5
发现问题，对D的train，D5中每次sample得到的是不同的batch数据。
进行teacher-forcing。

DP-GAN介绍说很容易D训练太好，无法梯度回传，和我的情况不一样啊？

GAN的问题：
比如“西瓜汁好喝！”，我稍微改一下“西瓜汁好喝吗？”，尾巴动一点，整个意思都变了。GAN 局部信息重构到底是靠死记硬背训练样本，还是靠神经网络插值“生成”出来的？针对自然语言这种细节敏感的问题，GAN 不是一个首选方案，不然 n-gram 的 LM 也不会活到今天。
G来生成图像也相对容易，因为图像的结构化特征比较明显，就是用CNN可以较好提取的结构特征，但是语言的长程相关提取出来就比较难。语言应用需要对语言系统的整体结构特征进行提取，所以其应用落地就复杂一些。
GAN的梯度回传不好，参考Lan G的演讲。NLP的action space太大。

想法：
confirm在以前是什么样子，我能做什么改善。?
在dstc2数据集中，confirm是寻求确认，affirm是确认，request是要求店家的电话号码，thankyou/buy是对话结束。inform是询问。

猜你喜欢

转载自blog.csdn.net/yagreenhand/article/details/89093381

做无人机实验室

正交实验法2

做实验2

Linux Lab 发布 v0.1 rc2，Linux 内核实验室

IELAB网络实验室快速生成树协议2

IELAB网络实验室云计算未来几何（2）

IELAB网络实验室云计算安全(2)

IELAB网络实验室混合云与多云(2)

IELAB网络实验室云计算灾难恢复（2）

尝试 “实验楼” 文件夹及文件操作（2）

IELAB网络实验室聊聊5G(2)

第2章高级测试实验室

经验 | 在麻省理工人工智能实验室如何做研究？

教你做网络安全实验室—基础关

Go 泛型变更：约束太丑了，先移动到 x/exp 做实验性功能

【团队】实验品

实验楼

实验室网站

实验室链表

实验室周报

（.*?）实验室

chrome实验室

实验室设备

病毒分析与防护实验2—— 搭建反病毒实验室

实验楼Linux笔记

实验楼linux教程

实验室产品的商用

实验室的毕业照

Linux开放实验室

实验室Myeclipse设置

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)