面向机器智能的TensorFlow实战8：序列分类 - 代码天地

面向机器智能的TensorFlow实战8：序列分类

其他 2018-05-30 04:57:10 阅读次数: 1

序列分类的任务是为整个输入序列预测一个类别标签。在许多领域中，包括基因和金融领域，这样的问题都极为常见。NLP中的一个突出例子是情绪分析。

使用国际电影数据库的影评数据集，该数据集的目标值是二元的---正面的和负面的。将逐个单词地查看每条评论。依据最后的那个单词的活性值，将训练一个用于预测整条评论的情绪的分类器。由于是按照端到端的方式训练模型，RNN将从单词中收集那些对于最终分类最有价值的信息，并进行编码。

Imdb影评数据集：http://ai.stanford.edu/~amaas/data/sentiment/，它是一个经过压缩的tar文档，其中正面的和负面的评论可从分列于两个文件夹中的文本文件中获取。利用正则表达式提取纯文本，并将其中的字母全部转换为小写。

使用词向量嵌入：词向量嵌入表示比one-hot具有更丰富的语义。因此，如果使RNN工作在影评的被嵌入的而非one-hot的单词上，则有助于RNN获取更好的性能。

import bz2
import numpy as np

class Embedding:
    def __init__(self, vocabulary_path, embedding_path, length):
        self._embedding = np.load(embedding_path)
        with bz2.open(vocabulary_path, 'rt') as file_:
            self.vocabulary = {k.strip(): i for i, k in enumerate(file_)}
        self._length = length
        
    def __call__(self, sequence):
        data = np.zeros((self._length, self._embedding.shape[1]))
        indices = [self._vocabulary.get(x, 0) for x in sequence]
        embedded = self._embedding[indices]
        data[:len(sequence)] = embedded
        return data
    
    def dimensions(self):
        return self._embedding.shape[1]

序列标注模型：

猜你喜欢

转载自blog.csdn.net/qfire/article/details/80464104

面向机器智能的TensorFlow实战8：序列分类

面向机器智能的TensorFlow实战5：目标识别与分类

面向机器智能的TensorFlow实战1：安装

面向机器智能的TensorFlow实战2：TensorFlow基础

面向机器智能的TensorFlow实战4：机器学习基础

面向机器智能的TensorFlow实战7：词向量嵌入

面向机器智能的TensorFlow实战6：循环神经网络与自然语言处理

[当人工智能遇上安全] 8.基于API序列和机器学习的恶意家族分类实例详解

《面向机器智能的TensorFlow实践》pdf 中文版下载

《面向机器智能的TensorFlow实践》StanfordDog完整修改

《面向机器智能的TensorFlow实践》学习笔记和一点思考

机器学习的分类：面向预测 / 面向决策

AI机器学习时序序列特征提取实现分类预测实战

智能对话机器人实战开发（1）- 体系结构和分类

分享《面向机器智能的TensorFlow实践》中文版PDF+英文版PDF+源代码

机器学习实战——基于Scikit-Learn和TensorFlow 阅读笔记之第三章：分类

【tensorflow实战笔记-分类篇】思路构思

【备忘】Tensorflow项目实战-文本分类

tensorflow实战一（分类交通标志）

TensorFlow实战之softmax多分类

[Python人工智能] 十.Tensorflow+Opencv实现CNN自定义图像分类案例及与机器学习KNN图像分类算法对比

TensorFlow2.0 教程8：图像分类

机器智能实验三分类算法

8种时间序列分类方法总结

智能对话机器人实战开发案例剖析（1）- 体系结构和分类

机器学习 TensorFlow 实现智能鉴黄

机器学习实战——贝叶斯分类器

机器学习实战——贝叶斯分类器代码

《机器学习实战》-朴素贝叶斯分类器

机器学习实战——KNN分类算法

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

女程序员是这样被恶搞的

B/S 和 C/S 的优缺点

vector一直申请会怎样？

座头鲸识别比赛(Humpback Whale Identification)总结

Linux高性能服务器编程——I/O复用 select

Mysql连接数据库（当包使用）

通过URI获取的文件路径为null的解决方法

1022-Primes on Interval(素数筛选+二分查找) ZCMU

Python出现： TypeError: expected string or buffer

bzoj2434: [Noi2011]阿狸的打字机 ac自动机+树状数组

每日归档

更多

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)