生活资讯
自然语言识别python_一个快速从自然语言文本中提取和识别关键短语的工具
2024-12-28 22:56  浏览:81

chinese_keyphrase_extractor (CKPE)

一个从 中文自然语言文本 中抽取 关键短语 的工具,只消耗 35M 内存

A tool for automatic keyphrase extraction from Chinese text.

本项目即将迁移至 jionlp 工具包,性能更好,速度更快哦~~~

应用场景 Application scenario

1.抽取关键短语

在很多关键词提取任务中,使用tfidf、textrank等方法提取得到的仅仅是若干零碎词汇。

这样的零碎词汇无法真正的表达文章的原本含义,我们并不想要它。

In many keyword extraction tasks, only a few fragmentary words are extracted when using tfidf, textrank and other methods.

Such fragmentary words cannot really express the original meaning of the article. We do not want it.

例如:

For example:

>>> text = '朝鲜确认金正恩出访俄罗斯 将与普京举行会谈...'

>>> keywords = ['俄罗斯', '朝鲜', '普京', '金正恩', '俄方']

我们往往需要更细化的短语描述,来作为文本的关键信息展示。这样的需求在生成词云、提供摘要阅读、关键信息检索等任务中都非常重要。

We often need more detailed phrase descriptions to display the key information of the text. Such requirements, namely keyphrases extraction, are very important in generating word cloud, providing abstract reading, key information retrieval and other tasks.

例如: For example:

>>> phrases = ['俄罗斯克里姆林宫', '邀请金正恩访俄', '最高司令官金正恩',

'朝方转交普京', '举行会谈']

2.扩展相关短语词汇

    以上就是本篇文章【自然语言识别python_一个快速从自然语言文本中提取和识别关键短语的工具】的全部内容了,欢迎阅览 ! 文章地址:http://tiush.xhstdz.com/xwnews/820.html 
     栏目首页      相关文章      动态      同类文章      热门文章      网站地图      返回首页 物流园资讯移动站 http://tiush.xhstdz.com/mobile/ , 查看更多   
最新文章
Ruby From Other Languages
This document contains two major sections. The first attempts to be arapid-fire summary of what you can expect to see wh
“云网边端”一体化,打造产业数字底座
  数字化转型的内涵   数字化转型强调在要素数字化的基础上,进一步利用数字技术,推动企业生产运行模式、人民组织生活形式
Python库BeautifulSoup与pyecharts在数据大屏可视化中的应用
1.Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档
一篇文章带你了解http/https
走在前端的大道上本篇将自己读过的相关 http/https 方法 文章中,对自己有启发的章节片段总结在这(会对原文进行删
【知识图谱系列】动态时序知识图谱EvolveGCN
vue-d3-graph基于之前的代码进行修改:目前只是最基础的版本,主要是提供代码的参考,后续会完善代码内容一、代码使用说明1. 依
Win10 开机进桌面黑屏只有鼠标可以移动,任务管理器运行explorer没反应
Win10开机黑屏只有鼠标可能是由于系统启动问题、驱动程序冲突或者硬件故障引起的。解决方法如下:首先,你可以尝试按下Ctrl+Alt+
【必看】2024诺贝尔奖考点解读:人物素材+速用示范+考点试题
10月14日,2024年诺贝尔经济学奖揭晓,6个奖项尘埃落定。作为一个文化符号、文化现象,诺贝尔奖的影响力已经超出其所覆盖的领域
HNU-人工智能-实验1-A*算法
掌握有信息搜索策略的算法思想;能够编程实现搜索算法;应用A*搜索算法求解罗马尼亚问题。 课程实训平台https://www
一周牛股榜丨引力波、移动支付、虚拟现实,热点集齐闹猴年
猴年首周,A股首秀不仅顶住了外围市场暴跌压力,随后一高兴还上演了三日连阳。不过,到底是有根高压线立在上头,沪指越靠近2900
相关文章