ncnn中Yolov3DetectionOutput层各个参数的含义

Yolov3DetectionOutput detection_out 2 1 output1 output2 output 0=20 1=3 2=0.500000 3=0.300000 -23304=12,23.000000,27.000000,37.000000,58.000000,81.000000,82.000000,81.000000,82.000000,135.000000,169.000000,344.000000,319.000000 -23305=6,3.000000,4.
分类: 企业开发 发布时间: 05-12 21:41 阅读次数: 0

熵为什么使用log?

首先,信息也是物理量,就像质量kg,我们测量质量的方法是,我们选择一个参照物,把这个物体的质量定义为1kg,当想要测量其它物体的质量时就看这个这个物体的质量相当于多少个参照物的质量,这里的多少个便是kg。上图中待测物体的质量m等于参照物体的质量B乘以参照物体的个数n,所以当知道总质量m要求个数n时,我们用乘法的反函数,既除法来计算。 但是测量信息时,不能用除法,比如抛掷3枚硬币能够产生的结果是2的3次方=8种,而不是2*3=6种,是指数关系而...
分类: 企业开发 发布时间: 05-12 21:41 阅读次数: 0

faiss 三种基础索引方式

faiss 三个最基础的 index. 分别是IndexFlatL2,IndexIVFFlat,IndexIVFPQ一、IndexFlatL2 - 最基础的IndexIndexFlatL2索引的结果是精确的,可以用来作为其他索引测试中准确性程度的参考.搜索时,可以以查询向量为中心,返回距离在一定范围内的结果,如返回数据库中与查询向量距离小于0.3的结果。支持IndexFlat, IndexIVFFlat,只支持在CPU使用。import numpy as npimp...
分类: 企业开发 发布时间: 05-12 21:41 阅读次数: 0

熵、联合熵、相对熵、交叉熵、JS散度、互信息、条件熵

一、熵对于离散型随机变量,当它服从均匀分布时,熵有极大值。取某一个值的概率为1,取其他所有值的概率为0时,熵有极小值(此时随机变量退化成确定的变量)。对于离散型随机变量,假设概率质量函数为p(x),熵是如下多元函数 :伯努利分布的熵为:对于连续型随机变量,假设概率密度函数为p(x),熵(也称为微Differential Entropy分熵 )定义为:二、联合熵联合熵(Joint Entropy)是熵对多维概...
分类: 企业开发 发布时间: 05-12 21:41 阅读次数: 0

OpenCV读取视频、存储视频、跳帧、分辨率、总帧数

def read_write(): ''' 文件扩展名.avi: cv2.VideoWriter_fourcc('I','4','2','0')---未压缩的YUV颜色编码,4:2:0色度子采样。兼容性好,但文件较大。 cv2.VideoWriter_fourcc('P','I','M','1')---MPEG-1编码类型。随机访问,灵活的帧率、可变的图像尺寸、定义了I-帧、P-帧和B-帧 、运动补偿可跨越多个帧 、半像素精度的运动向量 、量化矩阵、GOF.
分类: 企业开发 发布时间: 05-12 21:41 阅读次数: 0

【五分钟会,半小时懂】卡尔曼滤波器(Kalman Filter)—目标跟踪(含源码)

卡尔曼滤波器在目标跟踪中的使用
分类: 企业开发 发布时间: 05-12 21:41 阅读次数: 0

一图看懂DeepSORT整个大流程,多目标跟踪

​多目标跟踪,在DeepSORT提出之前是SORT算法(SORT论文链接),但是它对身份变换的问题,仅仅采取框和框之间距离的匹配方式,没有考虑框内的内容,所以容易发生ID-switch,不过这个问题已经在2017年的论文中进行了解决,即我们今天要介绍的DeepSORT。
分类: 企业开发 发布时间: 05-12 21:41 阅读次数: 0

深度学习调参tricks总结

寻找合适的学习率(learning rate)学习率是一个非常非常重要的超参数,这个参数呢,面对不同规模、不同batch-size、不同优化方式、不同数据集,其最合适的值都是不确定的,我们无法光凭经验来准确地确定lr的值,我们唯一可以做的,就是在训练中不断寻找最合适当前状态的学习率。比如下图利用fastai中的lr_find()函数寻找合适的学习率,根据下方的学习率-损失曲线得到此时合适的学习率为1e-2。推荐一篇fastai首席设计师「Sylvain Gugger」的一篇博客:How Do
分类: 企业开发 发布时间: 05-12 21:41 阅读次数: 0

python 图片打水印 透明图片合并

下面的例子是将img2作为水印打到bg上,注意:img2是一个背景透明的pngimport cv2from PIL import Imagedef merge_image(bg, img2, top_left): # 打开背景 bg = Image.fromarray(bg.astype('uint8')).convert('RGB') # 创建底图 target = Image.new('RGBA', (bg.size[0], bg.size[1]), (0,
分类: 企业开发 发布时间: 05-12 21:41 阅读次数: 0

Ubuntu安装CUDA和cuDNN

系统:Ubuntu 18.04.4CUDA:cuda_11.0.2_450.51.05_linuxcuDNN:cudnn-11.1-linux-x64-v8.0.5.39显卡驱动版本:450.80.02
分类: 企业开发 发布时间: 05-12 21:41 阅读次数: 0

一文看懂pytorch转换ONNX再转换TenserRT

pytorch转换ONNX再转换TenserRT
分类: 企业开发 发布时间: 05-12 21:41 阅读次数: 0

ubuntu彻底卸载Nvidia显卡驱动

一、环境ubuntu 18.04.4 LTS二、卸载显卡驱动1.执行卸载sudo apt-get --purge remove nvidia*sudo apt autoremove2.如果也要卸载CUDA:sudo apt-get --purge remove "*cublas*" "cuda*"三、禁用 Nouveau 驱动在安装新的驱动时如果发生如下报错,则需要禁用Nouveau 驱动:ERROR: The Nouveau kernel driver is
分类: 企业开发 发布时间: 05-12 21:41 阅读次数: 0

全网首发,Swin Transformer+FaceNet实现人脸识别

一、 简介与其他的深度学习方法在人脸上的应用不同,FaceNet并没有用传统的softmax的方式去进行分类学习,然后抽取其中某一层作为特征,而是直接进行端对端学习一个从图像到欧式空间的编码方法,然后基于这个编码再做人脸识别、人脸验证和人脸聚类等。FaceNet主要有两个重点:Backbone和Triplet loss。我们也将主要从这两个方面介绍。代码:oaifaye/facenet-swim-transformer二、Swin Transformer作为Backbone...
分类: 企业开发 发布时间: 05-12 21:41 阅读次数: 0

系统编程之高级文件IO(十一)——获取设置文件属性(fcntl、ioctl)

获取设置文件属性(fcntl、ioctl)
分类: 企业开发 发布时间: 05-12 21:41 阅读次数: 0

系统编程之高级文件IO(十二)——阻塞和非阻塞方式读取

阻塞与非阻塞
分类: 企业开发 发布时间: 05-12 21:41 阅读次数: 0

系统编程之高级文件IO(十三)——IO多路复用-select

IO多路复用——select
分类: 企业开发 发布时间: 05-12 21:41 阅读次数: 0

Hexo本地无法打开4000

一定是在博客的根目录下,用git bash运行hexo server我没装福昕阅读器
分类: 企业开发 发布时间: 05-12 21:41 阅读次数: 0

系统编程之高级文件IO(十四)——select优缺点

select优缺点
分类: 企业开发 发布时间: 05-12 21:41 阅读次数: 0

系统编程之高级文件IO(十五)——poll,epoll简单使用和异步IO及总结

poll,epoll简单使用和异步IO及总结
分类: 企业开发 发布时间: 05-12 21:41 阅读次数: 0

嵌入式数据库开发编程(一)——概述

数据库概述
分类: 企业开发 发布时间: 05-12 21:41 阅读次数: 0