命名实体分类NER初识

NLP连载系列:

  1. NLP入门:文本特征的表示方式
  2. 命名实体分类NER初识
  3. n-gram的原理
  4. CS224N笔记(一) Lecture1~2——word2vec超详细解析
  5. CS224N笔记(二) Lecture1~2 :深入理解Glove原理
  6. CS224N笔记(三) Lecture 6~7——深入理解循环神经网络RNN模型
  7. CS224N笔记(四) Lecture 7:循环神经网络RNN的进阶——LSTM与GRU
  8. CS224N笔记(五) Lecture8 机器翻译、Seq2Seq以及Attention注意力机制

命名实体分类就是判断一个词是不是属于某个实体的名字,比如人名、地点名、组织名等,这里介绍CS224N中提到的两种简单方法,均是判断一个窗口内的中心词是不是命名实体:

  1. 将周边词的词向量做平均池化后,丢入到若干层神经网络后softmax分类或者直接softmax分类。简单但是会损失位置信息

  2. 将周边词的词向量收尾相连,丢入到若干神经网络后softmax分类,不会损失位置信息但是输入大小的窗口大小成正比,会导致输入向量长度过大:

    NER/Untitled.png

打赏
  • 版权声明: 本博客所有文章除特别声明外,著作权归作者所有。转载请注明出处!

请我喝杯咖啡吧~

支付宝
微信