27 篇文章 1.1m总阅读 9550订阅量 3622被赞
苏格兰折耳喵
社交媒体数据挖掘爱好者
数据分析

通过文本挖掘,我们发现了国家公务员考试的这些秘密

笔者以一个旁观者的视角,通过一些语义分析技术去发现近八年(2011~2018)国考行政职业能力测验(以下简称“行测”)考了哪些内容,看能否有一些规律性的发现。 据中国新...

苏格兰折耳喵
数据分析

文本挖掘从小白到精通(二):料库和词向量空间

写笔者最近在梳理自己的文本挖掘知识结构,借助gensim、sklearn、keras等库的文档做了些扩充,会陆陆续续介绍文本向量化、tfidf、主题模型、word2vec,既会涉及理论,也...

苏格兰折耳喵
数据分析

文本挖掘从小白到精通(一):语料、向量空间和模型的概念

本文给大家介绍几个在使用gensim进行文本挖掘所需了解的基本概念和术语,并提供一些简单的用法示例。enjoy~ 笔者最近在梳理自己的文本挖掘知识结构,借助gensim、sklea...

苏格兰折耳喵
数据分析

干货| 如何利用Social Listening从在线垂直社区提炼有价值的信息?

在本文中,笔者将焦点集中在对互联网在线垂直社区的内容挖掘上,并且利用了多种数据挖掘方法和商业模型,以汽车之家的口碑数据挖掘为例,进一步对Social Listening的分...

苏格兰折耳喵
数据分析

数据挖掘实操|用文本挖掘剖析近5万首《全唐诗》

本文作者将使用多种文本挖掘方法,来分析《全唐诗》。篇幅略长,请耐心阅读^_^ 楔子 近些年来,弘扬中华传统文化的现象级综艺节目不断涌现,如《中国汉字听写大会》、...

苏格兰折耳喵
数据分析

以虎嗅网4W+文章的文本挖掘为例,展现数据分析的一整套流程

本文作者将结合自身经验,并以实际案例的形式进行呈现,涉及从数据采集、数据清洗、数据分析再到数据可视化的一整套流程分析,力求条理清晰的展现外部数据分析的强大威...

苏格兰折耳喵
数据分析

不会机器学习,你照样可以预测用户流失

即使不会高深莫测的机器学习,你照样可以利用统计学来预测用户流失。 什么是用户流失率?我们为什么需要关注用户流失率? 简单来说,用户流失率是指用户的流失数量与全...

苏格兰折耳喵
数据分析

干货|作为一个合格的“增长黑客”,你还得重视外部数据的分析!

在本文中,作者引出了“外部数据”这一概念,并实例分析,如何从海量的外部数据中获取可以对自身业务起到指导作用和借鉴意义的insight,并借助外部环境数据来优化自己。 ...

苏格兰折耳喵
数据分析

【干货】用大数据文本挖掘,来洞察“共享单车”的行业现状及走势

对于当下共享单车在互联网界的火热状况,笔者想从大数据文本挖掘的角度来做一番分析,主要是从海量的文本数据中找到有价值的讯息和观察视角,透过文本挖掘了解共享单车...

苏格兰折耳喵
数据分析

【干货】从社交媒体传播和文本挖掘角度解读《欢乐颂2》

作为数据分析爱好者,本文作者将想从数据的角度去解读《欢乐颂2》这部热播剧的方方面面,包括舆情传播、网络口碑、人物社交网络分析及,以及小说内容的文本分析。 5月1...

苏格兰折耳喵
创业学院

不懂数理和编程,如何运用免费的大数据工具获得行业洞察?

当我们想要创业却对市场行情不甚了解,该如何迅速了解市场行情,以便我们能更好的切入市???本文作者介绍了一种零成本用大数据获悉市场行情的方法,对你想要了解市场行...

苏格兰折耳喵
产品运营

干货|如何利用Social Listening从社会化媒体中“提炼”有价值的信息?

在本文中,笔者将会介绍大数据分析主要的处对象—社会化媒体(Social Media),以及对社会化媒体进行分析的重要手段——社会化聆听(Social Listening)。最后,笔者...

苏格兰折耳喵
快三 临朐县| 怀安县| 南宫市| 朝阳县| 连云港市| 固始县| 郎溪县| 元朗区| 仪陇县| 佛冈县| 乐清市| 清镇市| 清新县| 大兴区| 尉犁县| 柘城县| 墨玉县| 蒲城县| 武冈市| 迁安市| 广汉市| 深州市| 新田县| 新建县| 固原市| 佛学| 龙陵县| 大田县| 泽库县| 台山市| 安义县| 瑞金市| 新干县| 全州县| 浮山县| 潮州市| 白玉县| 卢氏县| 遂平县| 藁城市| 铅山县|