百度360必应搜狗淘宝本站头条

jieba.posseg 第2页

    苦等了四年的《釜山行2》,你就给我这

    7月15日,《釜山行》的续集《釜山行2:半岛》在首尔正式上映,不少朋友都对它充满期待。四年前,第一部《釜山行》上映,丧尸沦陷中,釜山是希望。四年后,整个半岛全部沦陷,正式成为丧尸半岛。...

    自然语言处理基础技术之词性标注实战

    一些常用python工具包的词性标注demo,供小白入门练手找感觉~~jieba词性标注(partofspecch)...

    自然语言处理之中文分词详解

    中文分词是中文文本处理的一个基础步骤,也是中文人机自然语言交互的基础模块,在进行中文自然语言处理时,通常需要先进行分词。“结巴”分词是一个Python中文分词组件,可以对中文文本进行分词、词性标注、关键词抽取等功能,并且支持自定义词典。...

    自然语言处理N天-Day1401中文命名实体提取(NER)

    说明:本文依据《中文自然语言处理入门实战》完成。目前网上有不少转载的课程,我是从GitChat上购买。第十四课中文命名实体提取(NER)命名实体识别(NamedEntitiesRecognition,NER)是自然语言处理的一个基础任务。其目的是识别语料中人名、地名、组织机构名等命名实体。由于命...

    短文本的LDA模型实现及应用(一)

    前段时间主要在进行基于微信聊天内容的分析,主要的思路是从聊天内容中提取出有价值的内容,作为运营分析的指导。实践应用了隐含狄利克雷分布(LatentDirichletAllocation,以下简称LDA),采用的工具是Python、jupyternotebook,作为扩展对LightLDA也进...

    用TensorFlow构建一个中文分词模型需要几个步骤

    分析中文分词方法现在主要有两种类型,一种是jieba这样软件包中用隐马尔科夫(HMM)模型构建的。另一种就是使用如TensorFlow、PyTorch这类训练深度学习序列标注(Tagging)模型。这里面我们主要以后者为参考。...

    深度为了七夕节送女朋友一支口红,我爬取了京东并进行数据分析

    友情提示,本文略长,建议收藏后慢慢看!今天是七夕节,祝大家节日快乐!每到这一天,不少男生就开始犯愁(单身狗除外):该给女朋友送什么礼物呢?思来想去,我决定送一个口红,一来口红属于化妆品,深受女生欢迎,二来口红在化妆品的领域中,属于物美价廉的一种品类,对于囊中羞涩的我来说,非常合适。...

    文本挖掘,带你看金庸笔下不一样的恩怨情仇

    提起中国武侠小说,金庸先生是绕不开的名字,十余年间以汪洋恣肆的想象力,写下15部作品。可用"飞雪连天射白鹿,笑书神侠倚碧鸳"来形容。...

    教你如何使用python快速提取文章关键词(附源码)

    写在前面如何给文章取一个标题,要贴近文章主题那种?如何给文章提取关键词?即使你能一目十行,过目不忘,也比不上机器“一幕十篇”。接下来介绍一个python项目,经过笔者的改造后,可以方便学习和使用,它能很好、很快地提取文章关键词。...

    排名第一的Python语言,是如何应用于医疗临床

    AlphaGo战胜了围棋领域的人类第一高手,让人们惊叹于人工智能的发展速度。一夜之间,人工智能的应用成为了大家最热议的话题。在医疗领域,人工智能应用已逐渐渗透,如病理诊断、影像、肿瘤治疗等。人工智能的核心是算法和数据,尤其是海量的优质数据,是人工智能发展的关键。过去“以药养医”,存在过度治疗、过度检...