【资源聚合平台】5/28日工作日志 - 代码天地

【资源聚合平台】5/28日工作日志

其他 2018-06-10 12:07:22 阅读次数: 2

王子悦

最近这两周考试有点忙，博客更新的不怎么勤，完成的工作也比较少。

今天仔细看了一下序列挖掘的原理，发现我上次写的那个访问记录方式完全不够用的啊，那样的就没有时间序列的感觉了。但是这样抛弃掉计数加一的方法，直接多一次访问多一条记录也不行，相当于记录下来全部的访问，这样上线没几天访问量就会爆炸。考虑到如果我最近在学某一门课，那么可能会频繁的访问同一门课，而连续的多次访问对于序列来说是和一次访问等价的，这样我就有了新思路：
这里写图片描述

以用户为主体，如果这个用户的上次访问和这次访问是同一个课程，那么数据库里这一用户的最后一条记录计数加一；如果不是同一个课程，认为开始学某个新的课程了，创建一条新纪录。

邵长旭

改了一些课程界面的UI,同时研究了一下fnlp，做了敏感词的过滤审核，正在做关键词的提取分析
研究了对插入图片的实现

今天做了NLP的一些研究：

首先下载编译了FNLP的jar包：具体过程见https://github.com/FudanNLP/fnlp/wiki

之后尝试了一些FNLP的功能，我做的首个任务就是提取关键词：

首先初始化停用词和分隔符，然后分词：

对以下段落分词：

比特币的概念最初由中本聪在2009年提出，比特币是一种P2P形式的数字货币。点对点的传输意味着一个去中心化的支付系统。与大多数货币不同，比特币不依靠特定货币机构发行，它依据特定算法，通过大量的计算产生，它是一种虚拟的货币。

效果：

可以看到提取关键词效果不是特别好，最主要的应该是比特币这个词，所以我想加入句子结构的权重：

利用以下函数对句子结构进行分析：

结果如下：

第一列是编号，第二列是词，第三列是词性，第四列是依赖的序号，最后一个是结构

大体的想法是主语和谓语的权重较高，名词和动词的权重较高，依赖关系最多的（在树结构中孩子最多的那个节点）权重高，然后与本来提取关键词得到的得分一起加权计算一个新的得分，得分高的最为关键词。具体明天实现

梁惠欣

尝试使用抽取式摘要生成技术，正在研究textRank+word2vec的实现

猜你喜欢

转载自blog.csdn.net/lhx960921/article/details/80529934

【资源聚合平台】5/28日工作日志

【资源聚合平台】5/5日工作日志

【资源聚合平台】5/4日工作日志

【资源聚合平台】5/3日工作日志

【资源聚合平台】5/2日工作日志

【资源聚合平台】5/23日工作日志

【资源聚合平台】5/16日工作日志

【资源聚合平台】5/15日工作日志

【资源聚合平台】5/14日工作日志

【资源聚合平台】6/5日工作日志

【资源聚合平台】5/31日工作日志

【资源聚合平台】5/30日工作日志

【资源聚合平台】5/22日工作日志

【资源聚合平台】5/21日工作日志

【资源聚合平台】5/20日工作日志

【资源聚合平台】5/18日工作日志

【资源聚合平台】5/17日工作日志

【资源聚合平台】4/29日工作日志

【资源聚合平台】4/27日工作日志

【资源聚合平台】4/24日工作日志

【资源聚合平台】4/23日工作日志

【资源聚合平台】4/21日工作日志

【资源聚合平台】4/19日工作日志

【资源聚合平台】4/18日工作日志

【资源聚合平台】4/17日工作日志

【资源聚合平台】 4/16日工作日志

【资源聚合平台】6/7日工作日志

【资源聚合平台】6/6日工作日志

【资源聚合平台】6/4日工作日志

【资源聚合平台】6/1日工作日志

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

LogN级别的区间查询算法(线段树), 你学会了吗

数论概论(英文版.第4版)

idea 更新后和新的直接安装前，都需要配置 idea64.exe.vmoptions 后再使用

CANOpen系列教程04_CAN总线波特率、位时序、帧类型及格式说明

Java序列化基础

java排序算法整理

异常：org.apache.ibatis.reflection.ReflectionException

（算法练习）——二路归并排序

go 闭包函数

好程序员web前端技术分享媒体查询

每日归档

更多

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)