专业的信息化与通信融合产品选型平台及垂直门户
注册 登陆 设为首页 加入收藏
首页 企业新闻 招标信息 行业应用 厂商专区 活动 商城 中标信息

资讯
中心

新闻中心 人物观点
厂商专区 市场分析
行业
应用
政府机构 能源产业 金融机构
教育科研 医疗卫生 交通运输
应用
分类
统一协作 呼叫客服 IP语音 视频会议 智能管理 数据库
数字监控 信息安全 IP储存 移动应用 云计算 物联网

TOP

大数据与预测分析 数据真的越多越好?
2013-10-15 15:47:21 来源:机房360 作者:【
关键词:大数据
 
对于数据科学家来说,最重要的不是想着怎样分析所有的数据,而是看通过哪些数据可以得出真正有价值的结果。
  Berry在Predictive Analytics World做主题演讲时说到,“很多预测分析的应用其实并不需要所有的数据。”因此,对于数据科学家来说,最重要的不是想着怎样分析所有的数据,而是看通过哪些数据可以得出真正有价值的结果。那么,到底该怎么办呢?
  
  但通过每次增加一些数据的方式来测试预测模型的有效性,可以最终确定多少数据是足够的。比如,当Berry想知道旅游代理商对某家酒店或特定客户的标准价位时,采用计算平均值的方法:选取两个取均值,然后是三个…最终在1万个时均值稳定下来。如果取2万个,均值肯定会发生变化,但这已经没有必要了。
  
  “这就是关键所在。如果你有足够的数据,那么单纯数量上的增加就不会对结果造成很大的影响。”Berry说。如果过多的数据不会带来本质的不同,那么什么才是关键所在呢?“很多方面。”Berry表示。数据的纯净度、样本的合理全面以及专注于数据质量和挖掘的人才等,都会导致结果的不同。
  
  这些都是预测分析中的关键点,比如指出哪些变量可以使模型更健壮,或者结合哪些来源的数据可以发现新的模式。“比如风寒效应。”Berry说。结合了实际的温度和风速,才能切实分析出人体对于外界环境的感受。
  
  大数据的误区
  
  Berry并非唯一对当前大数据和预测分析境况有微词的人。咨询公司RexerAnalytics的创始人KarlRexer认为数据科学家们多少都有点迷茫失措。在其2013年对数据挖掘从业者的调查看出,受访者反馈表明数据规模变得越来越大。但是,当被问及有多少数据被用于真正的分析时,答案和2007年的调查结果并无二致。这并非证明所谓大数据是一场闹剧。“对于传统的预测分析建模或数据挖掘项目来说,总体的样本规模并未出现增长。”Rexer说。
  
  缩写词汇命名
  
  将分析术语转化为业务端所能理解的语言,是一种巨大的挑战。工资、人力和服务外包提供商Paychex是这样打破藩篱的:根据业务端的建议来进行描述。
  
  “当我们构建模型时,会举行一个命名比赛。”Paychex的建模分析师TomKern在本次PredictiveAnalyticsWorld上表示。Kern的团队会向用户发送电子邮件,其中对模型进行了简短的描述,并且提供一些词汇供其使用。用户根据实际工作,创造缩写词汇,比如SAM表示销售预期模型,TIM表示领域识别和映射模型。
  
  如果业务端用户的建议最终被采用,其就会收到一个礼物卡。由此,就可以根据诸如销售人员之类的用户的期望,从而思考预测模型该做些甚么。
  
  汰渍的策略变化
  
  作为全球最大的零售商之一,宝洁公司宣布推出一款新型的低价汰渍洗衣剂,以此来吸引中端客户。该如何评价这个决策呢?
  
  ShelSmith是市场分析公司Twenty-TenInc.的创始人,他的看法是:“如果你发布类似的产品,不仅仅是在获取新的客户,其实还在鼓励已有的客户替换现有的高价产品。”鉴于当前经济形势的影响,这种担忧并非没有道理。但是,Smith对宝洁的策略持有信心。他认为,宝洁的策略是基于预测模型、海量数据和精准营销来达成的,可以在获取新客户的同时不影响现有品牌的销量。
      

责任编辑:admin
免责声明:以上内容转载互联网平台或企业单位自行提供,对内容的真实性、准确性和合法性不负责,Voipchina网对此不承担任何法律责任。

】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部

上一篇数据中心综合布线系统的抗干扰与..
下一篇虚拟流量引发数据中心网络新矛盾

热门文章

图片主题

最新文章

相关文章

广告位

Copyright@2003-2009 网络通信中国(原VoIP中国) 版权所有
联系方式:503927495@qq.com
  京ICP备05067673号-1 京公网安1101111101259