Maze环境以及DQN的实现
环境 5*5的迷宫,其中(4,3)位置是出口,障碍物的位置分别为(1,1)、(1,2)、(1,3)、(1,4)、(3,2)、(3,3)、(4,2) 动作空间当然4个,上下左右 直接上代码~ import gym
import tensorflow as tf
import numpy as np
import time
import sys
if sys.version_info.major == 2:
import Tkinter as tk
else:
import tk
如何搞到一台自己的VPS
写在前面: 北京市第三区技术委提醒您: 网路千万条,守法第一条。 上网不守法,亲人两行泪。 《中华人民共和国电信条例》 第五十六条: 任何组织或者个人不得利用电信网络制作、复制、发布、传播含有下列内容的信息: (一)反对宪法所确定的基本原则的; (二)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一的; (三)损害国家荣誉和利益的; (四)煽动民族仇恨、民族歧视,破坏民族团结的; (五)破坏国家宗教政策,宣扬邪教和封建迷信的; (六)散布谣言,扰乱社会秩序,破坏社会稳定的; (七)散布淫
损失函数softmax_cross_entropy、binary_cross_entropy、sigmoid_cross_entropy之间的区别与联系
参考文章 https://www.jianshu.com/p/47172eb86b39 https://www.cnblogs.com/guqiangjs/p/8202899.html https://blog.csdn.net/xiamentingtao/article/details/78598511 https://blog.csdn.net/qinghuaci666/article/details/80900882 https://www.zhihu.com/question/3630
NMS与Soft NMS算法笔记
转发文章NMS——非极大值抑制 https://blog.csdn.net/shuzfan/article/details/52711706 转发文章Soft NMS算法笔记 https://blog.csdn.net/u014380165/article/details/79502197 有些不清楚的地方,弄懂后后面补充~
Leetcode刷题笔记(Python)20190322
** Leetcode 编程每日练习笔记 ** 0315 1. 给定一个整数数组和一个目标值,找出数组中和为目标值的两个数。 解法1 def solution(nums,target):
if len(nums) < 2:
return
for i in range(0,len(nums) - 1):
for j in range(i + 1, len(nums)):
if nums[i] + nums[j] == tar
剑指offer刷题笔记0331:1 不用加减乘除做加法;2 将字符串换成整数;3数组中重复的数字
1 不用加减乘除做加法 题目描述 写一个函数,求两个整数之和,要求在函数体内不得使用+、-、*、/四则运算符号。 笔记:简单的题,但是看到完全没思路,多练习呀,加油~ 解答一 class Solution:
def Add(self, num1, num2):
s = [ ]
s.append(num1)
s.append(num2)
return sum(s)
2 将字符串换成整数 题目描述 将一个字符
NDK学习笔记-JNI数据类型和属性方法的访问
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/cj5785/article/details/89048717 JNI实现了C/C++与Java的相互访问,那么这篇文章就从C/C++访问Java开始说起 native函数说明 每个native函数,都至少有两个参数(JNIEnv *和jclass或jobject) 当native方法为静态方法时,采用jclass,此时jclass代表native方法所属类的class对象 当native方法为非
NDK学习笔记-JNI的异常处理与缓存策略
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/cj5785/article/details/89048730 在使用JNI的时候,可能会产生异常,此时就需要对异常进行处理 异常处理 JNI抛出Throwable异常,在Java层可以用Throwable捕捉 而在C只有清空异常这种处理 但如果在JNI中通过ThrowNew抛出异常,则在Java曾可以捕获 例子(在native访问不存在的属性) Java中声明native方法 public na
scala要点总结1:基本语法
系列开篇: Scala要点总结系列博客,主要目的是对scala语言的要点和独特的语法进行快速的梳理,过程中避免涉及深入的理论,点到为止。 系列博客分为5篇,分别为:基本语法,数组集合常用操作,函数式编程,面向对象,模式匹配。 适合有Java语言基础的同学对scala语言进行快速的掌握,因为部分通用的语法,例如操作符等就没有提到,或者作为简易手册进行日常的快速翻查。 更加深入的内容可以阅读书籍[1]。 一. 数据类型 二. 变量 1. 可变变量 variable
var v1 : String
NDK学习笔记-NDK开发流程
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/cj5785/article/details/89048738 本文主要是说明一下在eclipse下如何对NDK进行配置 配置NDK 虽然现在基本上都使用Android Studio进行Android开发,但一些项目在eclipse中仍有运用,这里讲一讲eclipse的NDK配置 在最开始下载的adt里面是没有NDK这个选项的,那么就要进行配置,手动安装 eclipse界面下Help -> Ins
scala要点总结2:数组、集合常用操作
一: ArrayBuffer 1. 声明数组
val a = ArrayBuffer("a","b")
val b = ArrayBuffer\[String](2)
2. 获取元素
val item = a(0)
val item = a.take(1)
3. 尾部添加元素或多个元素
a += "c"
a += ("d", "e")
a.append("f")
4. 尾部添加数组
a ++= Array("f", "g")
5. 指定位置插入元素
scala要点总结3:函数式编程
Scala combines object-oriented and functional programming in one concise, high-level language. 这是Scala官网介绍scala的第一句话,可以发现Scala的两大利器:更加纯粹的面向对象和函数式编程。 如果说面向对象让构造大型系统更加便捷,那么函数式编程则会让功能的实现更加快速,极大的提高编程效率。 高阶函数是指参数是函数,Scala主要应用是各种算子;或者返回的是函数,Scala中主要应用是柯里化
scala要点总结4:面向对象
一:类和构造函数 1. 类和构造函数
object A {
def main(args: Array[String]): Unit = {
val xiaoMing = new Boy("xiaoming", 20)
val xiaoGang = new Boy("xiaoGang", 18, "china")
println(xiaoMing)
println(xiaoGang)
}
}
class Boy(name : String, age
scala要点总结5:模式匹配
scala模式匹配和Java的switch功能类似,但是功能更加的强大,支持各种类型的匹配方式 1. 数值和字符串匹配
val list = List("aa", 2, 3)
for (x <- list) {
x match {
case 1 => println("1")
case 2 => println("2")
case 3 => println("3")
case _ => println("other")
}
}
/* output:
NDK学习笔记-文件的拆分与合并
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/cj5785/article/details/89048745 文件的拆分与合并在开发中经常会用到,上传或是下载的时候都有这样的运用 文件拆分的思路 将文件大小拆分为n个文件 那么,每个文件的大小就是等大小的 如果文件大小被n除不尽,那么就使用n+1个文件来拆分 最后一个文件的大小就是整除不尽的那一部分数据 文件合并的思路 将拆分出来的全部文件胺顺序读取 挨个数据写入到指定文件中 所有文件数据写入
NDK学习笔记-增量更新
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/cj5785/article/details/89048760 虽然现在有插件化开发和热修复,但为何还需要增量更新?插件化开发和热修复依赖于宿主程序,增量更新适合更新宿主程序。 差分包生成的前提 差分包的生成依赖于BsDiff开源项目,而BsDiff又依赖于Bzip2 BsDiff源代码下载地址:BsDiff Bzip2源代码下载地址:Bzip2 Window服务器端配置 新建Java Web项目
网络编程——TCP连接的三次握手和“四次”挥手小结
版权声明:本文为CrazyMo_原创,转载请在显著位置注明原文链接 https://blog.csdn.net/CrazyMo_/article/details/88921939 引言 TCP 作为传输层最基本的通信协议,任何网络通信,都离不开TCP协议,无论是原生Sockect还是应用程协议HTTP、HTTPS都离不开TCP协议,所以了解TCP的的基本知识是进阶的重要途径,也是编写高性能网络协议的前提,同时TCP的机制的设计思想也是值得我们在开发中去借鉴和学习的。 一、TCP概述 众所周知,
备战省赛第一场 问题 A: 篮球队选拔
版权声明:版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_37618760/article/details/89048744 问题 A: 篮球队选拔 时间限制: 1 Sec 内存限制: 128 MB 提交: 798 解决: 319 [提交] [状态] [命题人:外部导入] 题目描述 云南中医学院坐落于风景秀丽、四季如春的——昆明,创建于1960年,是全国第二批成立的高等中医药本科院校,为云南省唯一一所中医药本科院校。学校设有11个二级学院
基于模型的动态规划方法理论——策略迭代方法(maze代码实现)
直接上代码 policy_iteration_method.py import random
import numpy as np
class PIM:
def __init__(self):
self.pi = dict()
self.v = dict()
def create(self, mdp):
for state in mdp.states:
self.v[self.encode_state
今日推荐
周排行