预处理数据时,需要用到的一些方法(不定期更新)

Excel
1.“1”如何变为“001”
方法:选中-右键-设置单元格格式-数字-自定义-类型-填写“000”

2.如果在第二列找第一列的值,如果找到就写包含,如果没有就写不包含
方法:=IF(SUMPRODUCT(COUNTIF(B2,A 2 : A 100)),”包含”,”不包含”)

3.复制筛选出的数据,而不是全部
方法:筛选-Control+G-定位条件-可见单元格-选中范围-复制

4.生成字母列A,B,C,……AA,AB,AC,……
方法:=SUBSTITUTE(ADDRESS(1,ROW(),4),1,”“)

5.输入拼接的公式后,显示为公式而不是结果
方法:查找-“=”替换为“=”

6.表格空白单元格全部填充为0
方法:选中-Control+G-定位条件-空值-输入“0”-按住Control不放-点击Enter

Windows
1.批量读取文件名
①新建一个txt格式的记事本文件。
②在记事本文件中输入:DIR . /B >LIST.TXT
③将此记事本文件后辍名,由txt改为bat。会弹出重命名对话框,单击“是”。
④双击文件“新建文本文档.bat”即可生成list.txt文件。打开txt文件就可以看到当前文件夹内的所有文件名列表。

2.批量修改文件名
①用xls打开c:\pic文件夹中的rename.xls,你会发现文件名以全部罗列在A列中(你也可以用鼠标来调整文件名的顺序),你可以在B1列中输入1.jpg作为第一个文件文件名。
②鼠标选中C1单元格,并在编辑框中输入公式=”ren “&A1&” “&B1。
③继续用鼠标拖动C1单元格右下方的句柄,使剩余的C2-C7单元格填充。
④然后,鼠标选中C列,鼠标右键复制,在记事本中,粘贴刚才的命令行,鼠标点击菜单“文件”——“另存为”,输入文件名ren.bat,要注意下图所示红圈中的路径及扩展名选项

R
1.read.table读入的数据类型变成list,mode(data1)是list
方法:data2<-as.matrix(data1)

2.错误提示下标出界:即赋值的左边和右边不等,可能的原因是:
①左右集合的大小设定错误;
②左右集合的指定错误;
③赋值的集合(一般为右)中存在na,null,inf或者直接为空。
方法:一个一个带进去查看,少量少量跑进去验证。

3.将矩阵中的NA值换成0值/将矩阵中的0值换成NA值,假设矩阵的名字是a
方法:a[is.na(a)]<-0,反过来是a[a==0]<-na

4.一些详细说明的网址
(1)绘制饼图
单个说明:https://zhuanlan.zhihu.com/p/25234546
多个说明:http://blog.csdn.net/u013421629/article/details/73162217
(2)一页多图
http://www.cnblogs.com/nxld/p/6065237.html
(3)绘制散点图
http://blog.csdn.net/zx403413599/article/details/46866977
(4)绘制条形图和折线图
http://blog.csdn.net/zx403413599/article/details/46866977
(5)排序
http://blog.sina.com.cn/s/blog_6caea8bf0100spe9.html
(6)绘制气泡图
可以有四维,很好看:
https://mp.weixin.qq.com/s?__biz=MzA3Njc0NzA0MA==&mid=2653191632&idx=1&sn=0ed0fed5478c1f22e16ed7553a0e5634&chksm=848c459fb3fbcc89ac994c7bc1a70832b164ba6b36d2104f4c22baf11c559dc0cca00bfee1e1&mpshare=1&scene=1&srcid=0915bZAM4OrluDr1WCm1pILH&pass_ticket=mBD0ABxEIlsb9HlghhGD5Z956UQ3krOgO8F2%2FCP21iI%3D#rd
(7)ggplot2中图例的修改
http://blog.sina.com.cn/s/blog_670445240102v250.html
http://blog.sina.com.cn/s/blog_79f2c16f0102uzyv.html
(8)图片的导出
https://www.shengxin.ren/article/73
(9)从图片中提取文字的包
http://blog.csdn.net/sinat_26917383/article/details/54487359
(10)卷积神经网络
MXNet包的使用:
http://blog.csdn.net/xxzhangx/article/details/54729055
http://www.dataguru.cn/article-10669-1.html

猜你喜欢

转载自blog.csdn.net/u011591202/article/details/82108709