Python jieba库分词模式怎么用?
pythonjieba库分词模式怎么用?
在中文分词中,jiebe库是最为常见的,主要的原因还是它独特的支持分词模式如:精确模式、全模式、搜索引擎模式。也对应着三种方式,包括jieba.cut()方法、jieba.lcut()方法、jieba.cut_for_search()方法。下面就为大家实例操作这些分词模式,以及方法的使用,一起来了解下吧。
全模式:
importjieba
seg_list=jieba.cut("南京市长江大桥欢迎你。",cut_all=True)
print(type(seg_list),seg_list)
精确模式:
seg_list1=jieba.lcut("南京市长江大桥欢迎你。",cut_all=False)
print(type(seg_list1),seg_list1)
搜索模式:
seg_list2=jieba.cut_for_search("南京市长江大桥欢迎你。")
print(type(seg_list2),seg_list2)
print("全模式:"+"/".join(seg_list))
print("精确模式:"+"/".join(seg_list1))
print("搜索引擎模式:"+"/".join(seg_list2))
输出结果:
['南京市','长江大桥','欢迎','你','。']
全模式:南京/南京市/京市/市长/长江/长江大桥/大桥/欢迎/你/。
精确模式:南京市/长江大桥/欢迎/你/。
搜索引擎模式:南京/京市/南京市/长江/大桥/长江大桥/欢迎/你/。
一组实例详细给大家演示讲解了关于jieba库分词模式的使用方法,大家感兴趣的话,可以尝试学习下哦~更多Python学习教程请关注IT培训机构:千锋教育。
相关推荐HOT
更多>>python流式读取大文件的两种方法
python流式读取大文件的两种方法1、使用read方法分块读取使用更底层的file.read()方法,与直接循环迭代文件对象不同,每次调用file.read(chunk_...详情>>
2023-11-14 16:48:08pythongreenlet如何交替运行
pythongreenlet如何交替运行1、greenlet说明greenlet是一个基于Greenlet实现的网络库,它使用greenlet来实现协同程序。其基本思想是,当greenle...详情>>
2023-11-14 14:52:57python收集参数的调用顺序
python收集参数的调用顺序本文教程操作环境:windows7系统、Python3.9.1,DELLG3电脑。1、说明收集参数,关键字参数,普通参数可以混合使用使用...详情>>
2023-11-14 13:23:09python实例属性的优先级分析
python实例属性的优先级分析1、说明当在实例上给类属性赋值时,实际上是给这个实例绑定了同名的属性而已,并不会影响类属性和其他实例。使用实...详情>>
2023-11-14 10:17:33