摘要:pynlpir的安装及简单使用
1 安装
1 | pip install PyNLPIR |
2 初始化NLPIR
1 | import pynlpir |
3 切分文本
1 | # 词性标注 pos_tagging=True;词性标注显示英文/中文 pos_english=True; 词性标记的显示方式 pos_names='parent/child/all' |
1 | s = 'NLPIR分词系统前身为2000年发布的ICTCLAS词法分析系统,从2009年开始,为了和以前工作进行大的区隔,并推广NLPIR自然语言处理与信息检索共享平台,调整命名为NLPIR分词系统。' |
如果不想词性标注,设置post_tagging为false:
1 | pynlpir.segment(s, pos_tagging=False) |
4 关键字
1 | # 获得多少个词:max_words=50; 显示关键字权重:weighted=True |