restful api接口封装

1. 背景知识restful 是一种互联网软件架构(以网络为基础的应用软件的架构设计),其特点:一个URL对应一种资源表现层:客户端和服务器之间,把"资源"具体呈现出来的形式,如文本可以采用txt,json等格式客户端基本操作:GET 获取资源、POST 新建/更新资源、PUT 更新资源、DELETE 删除资源2. 使用说明route():装饰器,URL对应触发的函数,该段代码运行后,打开http://127.0.0.1:5000即可查看对应的资源from flask import Fla
分类: 其他 发布时间: 10-08 22:12 阅读次数: 0

re 正则语法

re 表达式https://www.jianshu.com/p/d5ae083ff35d
分类: 其他 发布时间: 10-08 22:11 阅读次数: 0

pandas 语法

1. df样本乱序df = df.sample(frac=1)2. 将某列内容展开例如,csv文件如下label tags传统节日 清明节,春节,中秋节,国庆节国家 美国,中国,日本希望获取如下的df文件label tags传统节日 清明节传统节日 春节传统节日 中秋节传统节日 国庆节df_new = df.drop('tags', axis=1).join(df_tags['tags'].str.split(',', expand=True).stack().reset_i
分类: 其他 发布时间: 10-08 22:11 阅读次数: 0

代码格式 PEP8

1 PEP8检查在cmd窗口中输入,若代码不符合pep8规范,将自动列出相关文件与行tox -e pep82 pycharm设置linux换行格式换行格式有3种:CRLF(\r\n)、LF(\n)、CR(\r),分别是windows、linux、mac的换行方式在windows里写完代码,迁移到linux服务器上跑的时候,和本机上的运行过程不同,此时可能是换行符的问题,需要注意...
分类: 其他 发布时间: 10-08 22:10 阅读次数: 0

bert 实体识别

1. 训练语料bert基于字进行训练,学习获取句子的上下文、语义信息等,具有较好的泛化性。标注语料示例:非命名实体采用O表示,命名实体根据其属性进行标注,如ORG:组织机构,PER:人名等,可自行定义。实体的第一个字符采用 B- 进行表示,余下字符采用 I- 进行表示。世 界 动 物 卫 生 组 织 的 英 文 简 称 为 什 么 。B-ORG I-ORG I-ORG I-ORG I-ORG I-ORG I-ORG O O O O O O O O O2 数据集说明source:训练集中文,t
分类: 其他 发布时间: 10-08 22:10 阅读次数: 0

tensorflow 安装与语法介绍

1. tensorflow安装安装tensorflow:pip3 install tensorflow安装后报错DLL load failed,原因是protobuf的版本不匹配,pip install protobuf==3.6.0后错误消失安装CUDAimport tensorflow时报错Could not load dynamic library 'cudart64_101.dll,原因是CUDA安装失败,CUDA是GPU的并行计算框架。与tensorflow_gpu配套使用,需要
分类: 其他 发布时间: 10-08 22:10 阅读次数: 0

request 上传文件

近期,requests.post上传文件时,status_code返回200,服务器校验时返回400,提示文件为空,但之前的处理逻辑中已进行了文件大小的判断,若文件为空,则直接返回失败,推测是网络问题,实际原因未定。{'msg': '文件不能为空', 'code': 400, 'data': None}file_size = os.path.getsize(csv_dir + file_name)if file_size <= 0: return Falseresponse = r
分类: 其他 发布时间: 10-08 22:09 阅读次数: 0

milvus 向量搜索

1. 简介milvus存储向量化的文本,可以快速查询top-N条相似记录。milvus安装使用中的一些坑,参考:https://zhuanlan.zhihu.com/p/914447532. 常用语法连接milvusmilvus = Milvus(ip, hort)创建、删除表,判断表是否存在当向量数据不断导入时,Milvus 会把数据增量式地合并成文件,当某个文件达到 index_file_size 所设置的值之后,该文件就不再接受新的数据,Milvus 会把新的数据存成另外一个文
分类: 其他 发布时间: 10-08 22:09 阅读次数: 0

xshell 后台运行程序与Supervisor

1. 后台运行退出xshell后,程序仍在后台运行nohup python3 /opt/bin/title_query_enter.py2. 关闭后台程序查看后台是否运行该程序ps -ef |grep title_query_enter.py关闭该进程kill -9 <pid># kill -9 1949
分类: 其他 发布时间: 10-08 22:09 阅读次数: 0

bert 生成文本句向量

之前生成文本句向量的方法是:训练词向量模型w2v,将句子中各词的向量进行平均,现在想尝试一下用bert模型生成句向量。1.bert模型结构all_encoder_layers: 经过transformer_model函数返回每个block的结果,即对应bert的12个Transformer层sequence_output:bert最后一层的输出,不明白其与all_encoder_layers最后一层的输出有何不同?2. 加载bert模型加载bert模型主要使用modeling文件中的相关函数
分类: 其他 发布时间: 10-08 22:09 阅读次数: 0

cronsun 定时任务管理

crontab命令配置简单,但是不方便管理,采用cronsun管理更为方便
分类: 其他 发布时间: 10-08 22:08 阅读次数: 0

pytorch 安装与语法

1. 安装pytorch在官网https://pytorch.org/get-started/locally/获取采用pip下载的链接。【报错】检查发现python版本为3.6.0时出现该错误,升级python为3.6.3后torch可以正常导入2. pytorch手写数字识别在网上下载mnist数据集http://deeplearning.net/data/mnist/,该数据集为50000条手写数字图像,图像维度28*28,数字分为0~9共10个分类标签。import pickleimp
分类: 其他 发布时间: 10-08 22:08 阅读次数: 0

hdfs 操作

之前将数据文件存放在服务器本地,开启高可用时,代码运行结果保存的服务器位置不定,导致加载文件失败,考虑将文件存入HDFS进行访问。1. hdfs查看、创建目录查看目录hdfs dfs -ls /user创建新目录,此时user目录下生成了新文件夹,文件将被存放在此处。但是创建目录后发现该文件夹没有写入权限,需要hdfs用户提供权限修改。hdfs dfs -mkdir /user/word2vec2. python写入、读取hdfs安装hdfs包,采用如下代码上传from hdfs.cl
分类: 其他 发布时间: 10-08 22:07 阅读次数: 0

时序序列预测-温度

最近看了一些关于时序序列预测的论文,找了一份耶拿天气数据集,数据集维度:(420551, 14),时间跨度:2009~2016,每10min采样一次。预测要求:根据给出的前10天的观测数据(气压、风速、温度等),预测未来24h时的温度。数据项如下:['"Date Time"', '"p (mbar)"', '"T (degC)"', '"Tpot (K)"', '"Tdew (degC)"', '"rh (%)"', '"VPmax (mbar)"', '"VPact (mbar)"', '"VPde
分类: 其他 发布时间: 10-08 22:07 阅读次数: 0

深度学习的杂七杂八

1. 神经网络的搭建原则在学习和实践深度学习的时候,对于神经网络的搭建过程感觉蛮好奇的。现在主流的框架tensorflow、pytorch等都封了一系列底层模块,搭神经网络有点类似拼积木,embedding、Conv2d、LSTM、Linear组合起来加上各激活函数、在确定优化器、损失函数,就组了一个模型出来,那么在设计这个模型的时候是依据什么原则进行规划的呢?一般我会在NLP分析里加上embedding(用预训练的词向量模型)、卷积(类似于提取n-grams信息)、max_pool(最大池化用的比较多
分类: 其他 发布时间: 10-08 22:07 阅读次数: 0

pycharm 远程调试linux

由于代码编写时需要在虚拟机、服务器上配置两套各种组件、算法模型的环境,因此直接通过pycharm进行远程调试。1. 配置说明打开pycharm的tools,打开configuration,新建SFTP连接,输入服务器ip,用户名、密码,保存后测试连接是否成功。2. 开始调试打开pycharm的settings工具,添加服务器上的python解释器,注意这里需要点击Move。配置代码的映射路径,此时本地上的代码将自动更新到映射的服务器地址,如果不想自动更新,也可以选择关闭该功能。...
分类: 其他 发布时间: 10-08 22:06 阅读次数: 0

apache atlas 数据治理

1. 安装在安装完ambari平台后,可以在可添加服务中选择atlas安装,其它相关安装事项参见https://blog.csdn.net/g511266804/article/details/106489935/2. UI界面atlas提供了可视化的界面用于查询某一type下的所有实体、血缘关系等,如type为hive_table的实体共有123个,点击查找后,可以选择一个实体查看其定义信息、血缘关系等。血缘关系通常定义于process类别中。3. api调用atlas提供了丰富的api
分类: 其他 发布时间: 10-08 22:06 阅读次数: 0

采用nginx+uwsgi+docker部署django + vue

最近搭一个前后端分离的开发框架,记录下步骤。1. django部署安装django依赖包:pip3 install Django采用命令行创建django项目:django-admin startproject src执行同步数据库文件:python3 manage.py migrate不明白这步是干嘛的?执行时报错sqlite版本过低,因此更新sqlite为3.28.0,参见https://blog.csdn.net/weixin_43336281/article/details/100055
分类: 其他 发布时间: 10-08 22:06 阅读次数: 0

软件产品测试

将一个编写完成的软件系统投入使用之前,需要进行产品性能上的测试。1. 前言之前遇到一个比较坑的点是:服务器性能的测试,因为之前没有硬件方面的知识和观念,都是拿到一个服务器就开始用。然后发现ES的查询性能特别慢,单次查询返回6000条数据时耗时28s,单次查询返回100条数据时耗时0.23s,导致软件在某些查询内容返回多时查询效率异常缓慢。本以为是ES的集群部署的问题,本集群部署在3台32g的节点上,然后查询ES性能优化的解决方案:分片调整开启缓存ES查询性能提高了一点,当命中缓存的时候,单次
分类: 其他 发布时间: 10-08 22:05 阅读次数: 0

hadoop||spark||yarn运维

1. 简介hadoophadoop实现了一个分布式文件系统HDFS,框架核心设计:HDFS和MapReduce。sparkspark 是专为大规模数据处理而设计的快速通用的计算引擎,支持 Hadoop YARN。使用总结:hadoop提供分布式集群和分布式文件系统,spark使用hadoop的HDFS代替MapReduce进行大数据的计算处理。2. Hadoop安装...
分类: 其他 发布时间: 10-08 22:05 阅读次数: 0