【舆情监测平台】舆情监测如何通过数据挖掘来获得商机

【舆情监测平台】舆情监测如何通过数据挖掘来获得商机

2020-02-13 18:31 115
抓取数据、清洗数据对于当下的舆情监测平台来说,都不算是什么难题了,难就难在如何从已得到的数据中获得商业洞察,再用这些商业洞察指导实践,而不仅仅是简单的各类数据统计。
舆情数据是互联网上的公开数据,就是相较于销售数据、用户数据等企业内部之外的数据,姑且称之为“外部数据”。
现在互联网上关于“增长黑客”的概念很火,它那“四两拨千斤”、“小投入大收益”的神奇法力令无数互联网从业者为之着迷。一般来说,“增长黑客”主要依赖于企业的内部数据(如企业自身拥有的销售数据、用户数据、页面浏览数据等),以此为依据进行数据分析和推广策略拟定。但是,如果遇到如下几种情况,“增长黑客”就捉襟见肘了:
 
假如一家初创公司,自己刚起步,自身并没有还积累数据,怎么破?
就算有数据,但自己拥有的数据无论在“质”和“量”上都很差,正所谓“garbage in ,garbage out”,这样的数据再怎么分析和挖掘,也难以得到可作为决策依据的数据洞察……
能看到数量上的变化趋势,却无法精准的获悉数值变动的真正原因,比如,近期APP上的活跃度下降不少,从内部数据上,你只能看到数量上的减少,但对于用户活跃度下降的真实动因却无法准确判定,只能拍脑袋或者利用过时的经验,无法让相关人信服。

描述型数据分析
描述型分析是用来概括、表述事物整体状况以及事物间关联、类属关系的统计方法,是上述四类中最为常见的数据分析类型。通过统计处理可以简洁地用几个统计值来表示一组数据地集中性(如平均值、中位数和众数等)和离散型(反映数据的波动性大小,如方差、标准差等)。
 
诊断型数据分析
在描述型分析的基础上,数据分析师需要进一步的钻取和深入,细分到特定的时间维度和空间维度,依据数据的浅层表现和自身的历史累积经验来判断现象/问题出现的原因。
 
预测型数据分析
预测型数据分析利用各种高级统计学技术,包括利用预测模型,机器学习,数据挖掘等技术来分析当前和历史的数据,从而对未来或其他不确定的事件进行预测。
 
规范型数据分析
最具价值和处理复杂度的当属规范型分析。
 
规范型分析通过 “已经发生什么”、“为什么发生”和“什么将发生”,也就是综合运用上述提及的描述型分析、诊断型分析和预测型分析,对潜在用户进行商品/服务推荐和决策支持。

对外部数据中的分析很重要
经过上面对四种数据分析类型的描述,笔者认为现有的基于企业内部数据的数据分析实践存在如下几类特征:
 
大多数的数据分析仅停留在描述性数据分析上,未触及数据深层次的规律,没有最大限度的挖掘数据的潜在价值;
数据分析的对象以结构化的数值型数据为主,而对非结构化数据,尤其是文本类型的数据分析实践则较少;
对内部数据高度重视,如用户增长数据,销售数据,以及产品相关指标数据等,但没有和外部数据进行关联,导致分析的结果片面、孤立和失真,起不到问题诊断和决策支撑作用。
由此,我们必须对企业之外的外部数据引起重视,尤其是外部数据中的非结构化文本数据。


外部数据的几种常见类型
外部数据是互联网时代的产物,随着移动互联时代的兴起,外部数据的增长呈现井喷的趋势。各个领域的外部数据从不同角度刻画了移动互联时代的商业社会,综合这些外部数据,才能俯瞰到一个“全息式”的互联网版图。
 
按互联网行业和领域的不同,外部数据包括且不限于:
 
阿里(淘宝和天猫):电商大数据
腾讯(微信和QQ):社交网络大数据
新浪(新浪微博和新浪博客):社交媒体大数据
脉脉:职场社交大数据
谷歌/百度:搜索大数据
优酷:影视播放大数据
今日头条:阅读兴趣大数据
酷云EYE:收视大数据
高德地图:POI大数据

外部数据的获取/采集
随着互联网时代对于“Open Data(开放数据)”或“Data Sharing(共享数据)”的日益倡导,很多互联网巨头(部分)开放了它们所积累的外部数据;再者一些可以抓取网络数据的第三方应用和编程工具不断出现,使得我们可以以免费或付费的方式获得大量外部数据(在获得对方允许和涉及商业目的的情况下),最终的形式包括未加工的原始数据、系统化的数据产品和定制化的数据服务。
 
 
 
 
 
 

电话咨询
解决方案
核心技术
QQ客服