《NLTK基础教程》读书笔记 009期
正如这章一开始所说的,需要用到大量的Twitter和Facebook的东西,本着完成书上内容的态度,还是使用VPN进行翻墙操作。
中文书tweet变量名后面少打印了字幕s,没有变成复数,这里参照英文原版书
另外,我把存放文件名直接改成了twitter.json
tweets = json.loads(open('twitter.json').read())
tweet_text = [tw...
BZOJ 2243 SDOI2011 染色
2243: [SDOI2011]染色 Time Limit: 20 Sec Memory Limit: 512 MB Submit: 10135 Solved: 3868 [Submit][Status][Discuss] Description 给定一棵有n个节点的无根树和m个操作,操作有2类: 1、将节点a到节点b路径上所有点都染成颜色c; 2、询问节点a到节点b路径上的颜色段数量(连续相同颜色被认为是同一段), 如“112221”由3段组成:“11”、“222”和“1”。 请你写一个程序
python写一个简单的CMS识别
前言: 收集了一点cms路径,打算在写一个。之前已经写了 有需要的可以自己翻我的博客 思路: 网站添加路径判断是否为200,并且无过滤列表中的字符 代码: import requests
import threading
import os
us=[]
ut=[]
error=['404','不存在','无权限访问','403','D盾','没有','页面消失了']
okurl=[]
noturl=[]
user=input('url->>>')
if os.path.e
【转载】C# 从服务器下载文件
1 一、//TransmitFile实现下载
2 protected void Button1_Click(object sender, EventArgs e)
3 {
4 /*
5 微软为Response对象提供了一个新的方法TransmitFile来解决使用Response.BinaryWrite
6 下载超过400mb的文件时导致Aspnet_wp.exe进程回收而无法成功下载的问题。
7
I-team 博客全文检索 Elasticsearch 实战
一直觉得博客缺点东西,最近还是发现了,当博客慢慢多起来的时候想要找一篇之前写的博客很是麻烦,于是作为后端开发的楼主觉得自己动手丰衣足食,也就有了这次博客全文检索功能Elasticsearch实战,这里还要感谢一下‘辉哥’赞助的一台服务器。 全文检索工具选型 众所周知,支持全文检索的工具有很多,像 Lucene,solr, Elasticsearch 等,相比于其他的工具,显然 Elasticsearch 社区更加活跃,遇到问题相对来说也比较好解决,另外 Elasticsearch 提供的res
pycharm基本设置
一、pycharm字体放大的设置 File —> setting —> Keymap —>在搜寻框中输入:increase —> Increase Font Size(双击) —> 在弹出的对话框中选择Add Mouse Shortcut 在弹出的对话框中同时按住ctrl键和鼠标滚轮向上滑。点击OK 二、Pycharm字体缩小的设置 File —> setting —> Keymap —>在搜寻框中输入:decrease —>Decrease Font Size(双击)—> 在弹出的对话框中选
java局部变量和临时变量
局部变量:temp=1, 临时变量:return a+b 临时变量会有一点的性能优势 局部变量会比成员变量和静态成员变量有优势,改进的方法是吧成员变量和静态成员变量赋值在局部变量:https://blog.csdn.net/javensun/article/details/6527926
hibernate框架学习之二级缓存(测试用例)
HqlDemoApp.java package cn.itcast.h3.query.hql;
import java.io.Serializable;
import org.hibernate.Query;
import org.hibernate.Session;
import org.hibernate.Transaction;
import cn.itcast.h3.query.hql.vo.StudentModel;
import cn.itcast.h3.query.hql.
go 利用orm简单实现接口分布式锁
在开发中有些敏感接口,例如用户余额提现接口,需要考虑在并发情况下接口是否会发生问题。如果用户将自己的多条提现请求同时发送到服务器,代码能否扛得住呢?一旦没做锁,那么就真的会给用户多次提现,给公司带来损失。我来简单介绍一下在这种接口开发过程中,我的做法。 第一阶段: 我们使用的orm为xorm,提现表对应的结构体如下 type Participating struct {
ID uint `xorm:"autoincr id" json:"id,omitempty"
linux tail
Linux tail command Updated: 05/21/2018 by Computer Hope About tail Syntax Examples ▸ Related commands ▸ Linux and Unix commands help About tail tail outputs the last part, or "tail", of files. It can also monitor new information written to the file
python 接口自动化--登录
从目前知道系统登录来看一般主要是与数据库存储用户名密码进行比对,若登录域名和业务域名不是同一个还需要获取业务域的coockie hre项目登录demo: __author__ = 'Administrator' import re import requests #roleId:3为派单专员 def login(username,password,roleId): session = requests.Session() url = "https://login.daydao.com/logi
《关于安卓和IOS开发》
28年前有人发明www microsoft技术开发人员lot 看论文可以看中国知网 微软亚洲研究院 WWDC苹果开发者大会上,苹果都会发布一些新的公司发展出的新的产品的新技术。iOS开发,用到的语言有:objective-c swift 还有cocoa touch框架 storyboarding(故事板——其实就是应用里的页面),一些基本的控件还有视图处理,界面控制,其他的跟系统有关的弹出框,屏幕旋转,多媒体处理,定位处理,互联网处理,游戏开发,healthkit开发,homekit开发,wa
谈谈对TCP、UDP、FTP、HTTP、Socket理解
TCP、UDP、FTP、HTTP、Socket 作者:Vincent Wang 链接:https://www.zhihu.com/question/20583641/answer/20242980 来源:知乎 Http,FTP是应用层协议,HTTP用来传输超文本而FTP用来传文件;TCP/UDP 是传输层协议 作者:晚风轻拂 链接:https://www.zhihu.com/question/20583641/answer/130840531 来源:知乎 1,主机需要网络传输数据,网络本质上是
《Natural Language Processing with Python》读书笔记 001期
这本书对应python2的中文版书籍网上有很多,但是随后更新的python3的版本却微乎其微,只能从官网上的电子英文版开看了,反正也全当练习了。
官网明确更新的几条观月NLTK 3.0的信息,间接说明这些可能很重要或者很常用,就像print对于python一样。
NLTK also includes some pervasive changes:
many types are initia...
《Natural Language Processing with Python》读书笔记 002期
第二章一开始核心就是再讲nltk里面内置的各种语料库,但是个人觉得这个并不是这张的重点,重点在于后面如何自己构造自己的语料库,毕竟如果一般训练的话,都肯定是拿自己手头的data来搞。
这个地方其实也没有什么要多加注意的,就是要仔细注意编码问题,都变成utf-8的格式最好统一,这样与PlaintextCorpusReader的默认编码就相同了。
def __init__(self, root...
《Natural Language Processing with Python》读书笔记 003期
这个2554.txt已经改名了貌似,改成2554-0.txt了。把代码也相应改了。
长度变成了:1176965
多了一些编码:
>>> len(tokens)
257726
>>> tokens[:10]
['\ufeffThe', 'Project', 'Gutenberg', 'EBook', 'of', 'Crime', 'and', 'Puni...
今日推荐
周排行