简单理解机器学习中的L1距离,L2距离,L-Inf距离

Overview这三个东西的话,都是用来算相似度的,用更准确的说法应该叫∣∣L∣∣1||L||_1∣∣L∣∣1​,∣∣L∣∣2||L||_2∣∣L∣∣2​,∣∣L∣∣∞||L||_{\infty}∣∣L∣∣∞​,即数值分析中的1-范数、2-范数、无穷范数。接下来为了方便描述起见仅以二维空间下的两点A(x1,y1)A(x_1,y_1)A(x1​,y1​),B(x2,y2)B(x_2,y_2)B(x2​,y2​)为例。L1距离即曼哈顿距离,可以简单理解为只能横着走或竖着走:d1=∣x1−x2∣+∣y1−
分类: 企业开发 发布时间: 04-28 14:01 阅读次数: 0

简单理解梯度消失与梯度爆炸

这两种现象的触发原因都是由于网络层数比较多,导致梯度在逐层回传的时候累积出了问题。梯度消失接近输出层的网络层梯度更新较为正常,而越远(越接近输入层),其权值更新会非常慢,此时对网络的学习相当于等价于只对后几层的学习,而前面层的权重可以认为约等于是固定的保持不变。诱因 可以发现sigmoid激活函数的导数如下:可以发现其导数是不会大于0.25的,此时链式求导梯度回传过程中梯度是很可能逐渐变小的(取决于初始化权值的大小),导致最后梯度约等于0,即"消失"。可以考虑采用如下方法缓解梯度消失问题:将
分类: 企业开发 发布时间: 04-28 14:01 阅读次数: 0

[论文阅读] Annotation-Efficient Cell Counting

论文地址:https://doi.org/10.1007/978-3-030-87237-3_39代码:https://github.com/cvbmi-research/AnnotationEfficient-CellCounting发表于:MICCAI 21Abstract最近深度学习的进展在显微镜细胞计数任务上取得了令人印象深刻的结果。深度学习模型的成功通常需要足够的训练数据与人工注释,这可能是耗时且昂贵的。在本文中,我们提出了一种标注高效的细胞计数方法,将细胞计数网络注入到主动学习框架中。通
分类: 企业开发 发布时间: 04-28 14:01 阅读次数: 0

计算机视觉中常见图像扰动方法的Pytorch实现

可以用来测试深度模型的鲁棒程度。考虑读取一张图片如下:高斯模糊Gaussian Blur:高斯噪声Gaussian Noise:旋转Rotation:翻转Flip:灰度Gray:
分类: 企业开发 发布时间: 04-28 14:01 阅读次数: 0

[论文阅读] Cross-level Contrastive Learning and Consistency Constraint for Medical Image Segmentation

论文地址:https://arxiv.org/abs/2202.04074代码:https://github.com/ShinkaiZ/CLCC-semi发表于:ISBI 22Abstract半监督学习(SSL)旨在利用少数标记的图像和大量未标记的图像进行网络训练,有利于减轻医学图像分割中的数据注释负担。根据医学影像专家的经验,局部属性如纹理、光泽和平滑度是识别医学图像中病变和息肉等目标对象的非常重要的因素。受此启发,我们提出了一种跨层对比学习方案,以提高半监督医学图像分割中局部特征的表示能力。与现
分类: 企业开发 发布时间: 04-28 14:01 阅读次数: 0

Pytorch torch.topk()的简单用法

官方文档:https://pytorch.org/docs/stable/generated/torch.topk.html?highlight=topk#torch.topk由于numpy本身是没有提供topk方法的,自己写一个有时候又很蛋疼(懒得写),在这种情况下便可以考虑pytorch提供的topk:torch.topk(input, k, dim=None, largest=True, sorted=True, *, out=None)input:输入tensork:字面意思dim:按
分类: 企业开发 发布时间: 04-28 14:01 阅读次数: 0

SAP 云平台 (Cloud Platform) 架构概述

引言在我们开始SAP云平台的架构之旅之前,让我们先看看SAP已经发布的一些其他云产品。这些云产品方案可以分为公有云和私有云两种。SAP公有云解决方案见下图最右侧,比较著名的有SAP SuccessFactors和SAP Cloud for Customer(C4C)等,作为SAP软件即服务(SaaS)的解决方案。以SAP C4C为例,软件应用和计算资源均由SAP提供,部署于SAP的数据中心,用户通过Internet来访问使用软件。所有C4C客户以不同租户(tenant)的方式
分类: 编程语言 发布时间: 04-28 13:59 阅读次数: 0

Android 13 Beta 版发布,诸多亮点不容错过

有奖调研|华为分析服务诚邀您参与>>> 作者 / Dave Burke, VP of Engineering 四月已至,我们仍在不断稳步推进完善 Android 13 的功能和稳定性。Android 13 围绕我们的 核心主题 打造,即隐私和安全、开发者生产力,以及支持平板电脑和大屏幕设备。今天,我们进入到发布周期的下一个阶段,为大家带来 Android 13 的第一个 Beta 版。 对于开发者来说,Android 13 有很多值得探索的地方,从新的通知权限和照片选择器等隐私功能,到帮助您构
分类: 移动开发 发布时间: 04-28 13:58 阅读次数: 0

软件测试从零基础学习(1)概念,介绍,验证测试,需求分析,

什么是软件测试?软件测试就是利用手工或者测试工具按照测试方案和流程对产品j一。测试介绍什么是软件测试?使用技术手段验证软件是否满足需求使用技术手段验证软件是否满足需求认识软件以及测试什么是软件?聊天,电商,操作系统软件:控制计算机硬件工作的工具。页面客户端->请求代码服务器页面客户端-》请求代码服务器 》请求数据服务器页面客户端->请求,响应代码服务器-》请求响应数据服务器软件控制硬件的工具03-软件产生过程需求产生(需求方,客户,用户,产品经理)-》需求文..
分类: 编程语言 发布时间: 04-28 13:58 阅读次数: 0

卷疯了!SOTA级发丝超精细抠图算法开源了!

你还在用P.S.等商业软件,划着鼠标,一点点勾勒图像边缘完成抠图嘛?有些大神可能会说:我可以用蒙板、通道等等高端操作实现超快抠图!但如果能有一个软件可以实现智能全自动抠图,完美保留发丝、树叶等精细边缘,还完全免费,甚至代码都是全部开源的,它不香嘛!!!图1Matting效果展示这绝对不是画饼,近期一项被称为Matting的算法可算是火爆了AI界,它相比于单纯的图像分割技...
分类: 企业开发 发布时间: 04-28 13:57 阅读次数: 0

秒啊,Python代码可以轻松打包为可执行的程序

PDF转Word是一个古老的话题,其难点在于建立从PDF基于元素位置的格式到Word基于内容的格式的映射。PDF文档实际并不存在段落、表格的概念,PDF转Word要做的就是将PDF文档中“横、竖线条围绕着文本”解析为Word的“表格”,将“文本及下方的一条横线”解析为“文本下划线”,等等。pdf2docx 支持Windows和Linux平台,要求Python版本>=3.6。喜欢本文记得收藏、关注、点赞。【注】完整版代码、资料、技术交流,文末见pdf2docx安装方式pip install p
分类: 业界资讯 发布时间: 04-28 13:53 阅读次数: 0

Delorean:一款非常实用的 Python 时间格式智能转换工具

DeLorean 是一个Python的第三方模块,基于 pytz 和 dateutil 开发,用于处理Python中日期时间的格式转换。由于时间转换是一个足够微妙的问题,DeLorean希望为移位、操作和生成日期时间提供一种更干净、更省事的解决方案。比如,实例化字符串形式的时间对象,Delorean只需要 parse 指定字符串,不需要声明其格式就可以进行转换。至于 Delorean 这个模块名称的由来,Delorean 是电影《回到未来》里的那辆极为炫酷的鸥翼汽车,采用这部电影里的非常具有代表性的汽车
分类: 业界资讯 发布时间: 04-28 13:53 阅读次数: 0

这个神奇的库,可以将数据平滑化并找到异常点

在处理数据的时候,我们经常会遇到一些非连续的散点时间序列数据:有些时候,这样的散点数据是不利于我们进行数据的聚类和预测的。因此我们需要把它们平滑化,如下图所示:如果我们将散点及其范围区间都去除,平滑后的效果如下:这样的时序数据是不是看起来舒服多了?此外,使用平滑后的时序数据去做聚类或预测或许有令人惊艳的效果,因为它去除了一些偏差值并细化了数据的分布范围。如果我们自己开发一个这样的平滑工具,会耗费不少的时间。因为平滑的技术有很多种,你需要一个个地去研究,找到最合适的技术并编写代码,这是一个非常耗时的过程。平滑
分类: 业界资讯 发布时间: 04-28 13:53 阅读次数: 0

超全,我梳理了最频繁使用的 70 个数据分析网址

今天给大家分享的这篇文章,更像是一份数据分析常用网站字典,一共70个,可视化、词频词云、PPT模板等等面面俱到,值得收藏!  数据可视化工具百度EChartshttp://echarts.baidu.com/Cytoscapehttp://www.cytoscape.org/图表秀http://www.tubiaoxiu.com/数据观http://shujuguan.cn/微博足迹可视化http://vis.pku.edu.cn/weibova/weibogeo_footprint/i
分类: 业界资讯 发布时间: 04-28 13:53 阅读次数: 0

值得收藏,工作中最频繁使用的 10 个 Python 脚本程序

不久前的复旦大佬,用130行Python代码硬核搞定核酸统计,上了人民日报了!在日常的工作中,我们总会面临到各式各样的问题。其中不少的问题,使用一些简单的Python 代码就能解决。今天我就带大家学习一下10个Python脚本程序,虽然简单,不过还是蛮有用的。喜欢记得收藏、点赞、关注。【注】完整代码、数据、技术交流文末获取。1、Jpg转Png图片格式转换,以前可能第一时间想到的是【格式工厂】这个软件。如今编写一个Python脚本就能完成各种图片格式的转换,此处以jpg转成png为例。有两种解决
分类: 业界资讯 发布时间: 04-28 13:53 阅读次数: 0

natsort:一款非常棒的 Python 排序库

自然排序顺序(Natural sort order),不同于默认排序针对字符串逐个比较对应位置字符的ASCII码的方式,它更关注字符串实际相对大小意义的排序,举个常见的例子,假如我们有下面这样的一张表,其中value字段是百分比格式的字符串:这时如果直接照常基于value字段进行排序,得到的结果明显不符合数据实际意义:而我们今天要介绍的技巧,就需要用到第三方库natsort,使用pip install natsort完成安装后,利用其index_natsorted()对目标字段进行自然顺序排序,再配
分类: 业界资讯 发布时间: 04-28 13:53 阅读次数: 0

竟可如此轻松解决,PDF 转 Word只需几行 Python 代码

PDF转Word是一个古老的话题,其难点在于建立从PDF基于元素位置的格式到Word基于内容的格式的映射。PDF文档实际并不存在段落、表格的概念,PDF转Word要做的就是将PDF文档中“横、竖线条围绕着文本”解析为Word的“表格”,将“文本及下方的一条横线”解析为“文本下划线”等等需要明确的是:pdf2docx支持Windows和Linux平台,要求Python版本>=3.6。喜欢本文记得收藏、关注、点赞。【注】完整版代码、数据、交流,文末有pdf2docx安装方式:pip instal
分类: 业界资讯 发布时间: 04-28 13:53 阅读次数: 0

D-Tale:一款功能异常强大的探索性数据分析工具

大家好,今天给大家分享一款十分强大的数据集探索性分析插件D-Tale。可以通过它,我们可快速分析和了解数据的基本情况,进一步进行数据分析和可视化,喜欢记得收藏、点赞、关注。注:完整数据文末获取。安装好该模块pip install dtale用D-Tale插件打开数据集我们在D-Tale中打开数据集,代码如下import dtaleimport pandas as pddf = pd.read_csv(r'gapminder_full.csv')d = dtale.show(df)d
分类: 业界资讯 发布时间: 04-28 13:53 阅读次数: 0

数十款代码编辑器,PyCharm为何如此优秀?

这两年被Python初学小白问到最多的问题就是,该用什么代码编辑工具?说实话,我个人是用Jupyter Notebook最多,主要是经常做数据可视化,方便些。但对于初学者来说,PyCharm仍是不二的选择,甚至我建议你只用PyCharm.从当前所有主流Python IDE来看,PyCharm是最适合做Python开发的,特别对新手而言,可以节省很多不必要的时间成本。我也常用PyCharm写脚本,偶尔开发一些web应用,PyCharm的完善程度可以说没有一个IDE能达到。其他IDE相比,PyCha
分类: 业界资讯 发布时间: 04-28 13:53 阅读次数: 0

机器学习中最常使用的10种数据编码方式

大家好,在机器学习中,很多算法都需要我们对分类特征进行转换(编码)。为了方便讲解,下面创建示例DataFrame数值型数据让我们先来讨论连续型数据的转换,也就是根据Score列的值,来新增一列标签,即如果分数大于90,则标记为A,分数在80-90标记为B,以此类推。自定义函数 + 循环遍历首先当然是最简单,最笨的方法,自己写一个函数,并用循环遍历,那肯定就是一个def加一个fordf1 = df.copy()def myfun(x): if x>90: ret
分类: 业界资讯 发布时间: 04-28 13:53 阅读次数: 0