Orthogonal Regularization

正交性在ConvNet过滤器中是一种理想的品质,部分原因是与正交矩阵相乘会使原始矩阵的norm保持不变。这一特性在深度或循环网络中很有价值,因为重复的矩阵乘法会导致信号消失或爆炸。我们注意到用正交矩阵初始化权重的成功(Saxe等人,2014),并认为在整个训练中保持正交性也是可取的。为此,我们提出了一种简单的权重正则化技术,即正交正则化,通过将权重推向最近的正交流形来鼓励权重的正交。(we propose a simple weight regularization technique, Orthogona
分类: 其他 发布时间: 11-27 08:45 阅读次数: 0

Policy Gradient Methods for Reinforcement Learning with Function Approximation

Policy Gradient Methods for Reinforcement Learning with Function Approximation1 Policy Gradient Theorem在时间t∈{0,1,2,...}t\in\{0,1,2,...\}t∈{0,1,2,...}的state, action, reword表示为st∈S,at∈A,rt∈Rs_t\in \mathcal S,a_t\in \mathcal A,r_t\in \mathcal Rst​∈S,at​∈A,r
分类: 其他 发布时间: 11-27 08:45 阅读次数: 0

# Representation Learning with Contrastive Predictive Coding

Representation Learning with Contrastive Predictive Coding尽管监督学习在许多应用中取得了巨大进展,但无监督学习尚未得到如此广泛的采用,仍然是人工智能的重要和具有挑战性的努力。在这项工作中,我们提出了一种通用的无监督学习方法来从高维数据中提取有用的表示,我们称之为对比预测编码。我们模型的关键见解是通过使用强大的自回归模型在潜空间中预测未来来学习这种表征。我们使用一个probabilistic contrastive loss ,诱导latent s
分类: 其他 发布时间: 11-27 08:45 阅读次数: 0

[笔记:GPVAR] 对多目标变量的时间序列用神经网络预测联合分布

[笔记:GPVAR] 对多目标变量的时间序列用神经网络预测联合分布
分类: 其他 发布时间: 11-27 08:44 阅读次数: 0

Deep Reinforcement Learning for Automated Stock Trading An Ensemble Strategy

Deep Reinforcement Learning for Automated Stock Trading An Ensemble Strategy股票交易策略在投资中起着关键作用。然而,在复杂多变的股票市场上设计一个有利可图的策略是很有挑战性的。在本文中,我们提出了一种采用深度强化方案的集合策略,通过最大化投资收益来学习股票交易策略。我们训练了一个深度强化学习代理,并使用三种actor-critic based算法获得了一个集合交易策略。近端策略优化(PPO)、Advantage Actor Cri
分类: 其他 发布时间: 11-27 08:44 阅读次数: 0

Asynchronous Methods for Deep Reinforcement Learning

Asynchronous Methods for Deep Reinforcement Learning我们提出了一个概念上简单和轻量级的深度强化学习框架,它使用异步梯度下降来优化深度神经网络控制器。我们提出了四种标准强化学习算法的异步变体(asynchronous variants),并表明并行actor-learners对训练有稳定作用,允许所有四种方法成功训练神经网络控制器。表现最好的方法,即actor-critic的异步变体,在Atari领域超过了目前的最先进水平,而在单个多核CPU而不是GPU
分类: 其他 发布时间: 11-27 08:44 阅读次数: 0

# Asynchronous Methods for Deep Reinforcement Learning

Asynchronous Methods for Deep Reinforcement Learning我们提出了一个概念上简单和轻量级的深度强化学习框架,它使用异步梯度下降来优化深度神经网络控制器。我们提出了四种标准强化学习算法的异步变体(asynchronous variants),并表明并行actor-learners对训练有稳定作用,允许所有四种方法成功训练神经网络控制器。表现最好的方法,即actor-critic的异步变体,在Atari领域超过了目前的最先进水平,而在单个多核CPU而不是GPU
分类: 其他 发布时间: 11-27 08:43 阅读次数: 0

android源码分析-Dialog

今天给大家介绍dialog
分类: 其他 发布时间: 11-27 08:43 阅读次数: 0

AndroidStudio CMakeList配置

AndroidStudio CMakeList配置详解用户可以新建个工程,对C++ include 打勾 就是C++支持的工程了,我们这里要对build.gradle里的相关配置做了解1、build.gradle中的配置externalNativeBuild { cmake { cppFlags "" p...
分类: 其他 发布时间: 11-27 08:43 阅读次数: 0

如何在AndroidStudio中运行java的Main方法

1、首先在AS中导入个module 叫java_library然后这个module的gradle文件中//apply plugin: 'java-library'apply plugin: 'java'apply plugin: 'application'mainClassName = 'java.MainRun'dependencies { implementation f...
分类: 其他 发布时间: 11-27 08:43 阅读次数: 0

synchronized的几种用法

java中,当我们处理线程同步问题的时候就会用到synchronized这个关键字,下面我们介绍下synchronized的几种用法,介绍之前我们先来看下,在java 多线程中 如果没有线程同步会出现什么问题:下面这个是一个测试例子:public class MainClass { public static class MyRun implements Runnable ...
分类: 其他 发布时间: 11-27 08:42 阅读次数: 0

Java 中Object类的wait和notify方法的使用

wait和notify主要用在线程间的通信,wait:让当前调用了wait的对象的所在线程堵塞,前提是当前线程获得了同步锁,不然会抛IllegalMonitorStateException异常notify:通知调用了wait的对象继续执行,不堵塞,前提是调用了notify的对象已经出了synchronized代码块,释放了锁,才能通知成功使用wait和notify要注意几点:wait和n...
分类: 其他 发布时间: 11-27 08:42 阅读次数: 0

android中的WebView,JS回调java中的代码线程在子线程

昨天遇到个问题,android中的WebView,js中会调用android的原生代码,但是报了异常,说子线程不能更改UI的那个异常,原来才知道,js回调到java中的方法是浏览器webView在新开的子线程做的操作,如果要更新UI必须要切换到主线程了,@JavascriptInterface private void logg(final String log) ...
分类: 其他 发布时间: 11-27 08:42 阅读次数: 0

服务器返回的Json中含有很多转义字符“\"”的问题

这个问题很多是因为Json中嵌套了json造成的比如:{ "A":"{\"fg\":\"dddd\"}", "B":"32146" }这里就含有" 转移字符这种是可以正常解析的
分类: 其他 发布时间: 11-27 08:42 阅读次数: 0

一个Demo让你理解Retrofit的工作原理-动态代理技术

首先先总结下Retrofit核心的三个技术1. java的动态代理技术:2. 解析定义的Service中的各种注解,生成request,然后利用okhttp,生成response3. 利用各种设计模式,尤其是工厂模式,来适配Rxjava 还有动态配置Gson 结果转换器Retrofit 总结起来不外乎就这三点,我们今天只通过一个Demo 分析Retrofit中的动态代理,我后面的文...
分类: 其他 发布时间: 11-27 08:41 阅读次数: 0

AndroidStudio ffmpeg配置

准备:1、ffmpeg库文件,编译好的,这个可以自己编译一、新建工程1、2、像上面一样创建个C++的工程二、导入ffmpeg库include:这个是放的ffmpeg的头文件lib.armeabi-v7a 这个是存放的so文件,我这里只放了armeabi-v7a,如果要放其他的abi架构可以同样放入三、配置文件1、配置gradle要注意的只有2点这个地方是上面架构 就写什么架构如果有报错这个就导入上面的配置好了gradle就配置好了2、CmakeLists的配置(重要
分类: 其他 发布时间: 11-27 08:41 阅读次数: 0

MultiDex原理分析

MultiDex原理分析一、MultiDex是什么,解决了什么问题MultiDex 顾名思义就是对分包的Dex文件进行读取加载到ClassLoader的库android 早期的版本中,Dex文件(android对java中字节码 class文件 进行了调整,把所有的class打包到一的Dex文件中)的方法数量是有上限的65536,当一个app中的方法数量超过这个值,在app安装的时候就会抛出错误,无法安装为什么Dex的方法数量上限是65536呢?android在安装一个应用的时候其中会有一步工作是
分类: 其他 发布时间: 11-27 08:41 阅读次数: 0

Android属性动画-ValueAnimator原理解析

Android属性动画-ValueAnimator原理解析一、概述android中的属性动画的实现是通过不断的改变View的属性然后刷新,这个改变过程是通过数据的连续补帧和渐变来实现的,那么这个就需要有个脉冲的类来实现这个功能,而且这个脉冲不是随便写的,必须要根据硬件的配置和设置已经硬件环境来触发,这个过程中有个重要的实现类就是ValueAnimator,今天就来说下这个类实现的来龙去脉二、问题1、ValueAnimator的继承关系是什么,有哪些兄弟类,都什么作用?2、ValueAnimator
分类: 其他 发布时间: 11-27 08:40 阅读次数: 0

Android动画-Animation原理解析

Android动画-Animation原理解析一、概述在android中动画分为3类,帧动画、补间动画、属性动画今天要说的就是“补间动画”,补间动画的基类是Animation,具体的实现都在TranslateAnimation、ScaleAnimation、RotateAnimation、AlphaAnimation中实现的这个动画的原理是将控件View在时间上连续的绘制,就形成了动画,但是这个动画有个2个主要缺点1、控件的本身没有移动或者旋转,位置信息没有改变,只是在绘制View的时候进行了矩阵
分类: 其他 发布时间: 11-27 08:40 阅读次数: 0

Android-View的绘制流程分析

Android-View的绘制流程分析文章目录Android-View的绘制流程分析一、概述二、绘制流程图三、代码分析1、View.requestLayout()2、ViewRootImpl#requestLayout()3、ViewRootImpl#scheduleTraversals()4、ViewRootImpl#TraversalRunnable5、ViewRootImpl#doTraversal()6、ViewRootImpl#performTraversals()7、ViewRootImpl#
分类: 其他 发布时间: 11-27 08:39 阅读次数: 0