人工智能大作业–中文文本分类(2)

发布于 2022-01-02  276 次阅读


关键词提取-基于 TF-IDF 算法的关键词抽取

import jieba.analyse
  • jieba.analyse.extract_tags(sentence, topK=20, withWeight=False, allowPOS=())
  • sentence 为待提取的文本
  • topK 为返回几个 TF/IDF 权重最大的关键词,默认值为 20
  • withWeight 为是否一并返回关键词权重值,默认值为 False
  • allowPOS 仅包括指定词性的词,默认值为空,即不筛选
  • jieba.analyse.TFIDF(idf_path=None) 新建 TFIDF 实例,idf_path 为 IDF 频率文件
    代码示例 (关键词提取)

自然语言处理(NLP)

file

file

file

文本分类任务描述

file

应用场景

file

file

file

file

file

文本表示

file

file

file

file

One hot编码实战

一些基础知识

file

file

file

file

file

file

file

file

file

file

file

TF-IDF

file

file

file

file

CNN

file

file

file

file

file

Free Gpu

file

file

file


擦肩而过的概率