Archive by category 数据挖掘

Technavio:预计2020年全球深度学习系统市场规模超13亿美元

Technavio:预计2020年全球深度学习系统市场规模超13亿美元

报告称,到2020年,全球深度学习系统市场规模将超13亿美元,2016~2020年期间的复合年增长率达到 38.73%。深度学习具有在现实生活中应用的巨大潜力,这也使得它越来越受到关注。在实际应用中,社交媒体、软件服务协议、硬件、网站Cookies 以及应用程序权限等为训练神经网络提供了大量数据。深度学习网络在从这些数据中提取有价值的信息方面很有优势,因为它们擅长无监督学习。

阅读全文

做好数据挖掘模型的9条经验总结

做好数据挖掘模型的9条经验总结

当前的数据挖掘形式,是在20世纪90年代实践领域诞生的,是在集成数据挖掘算法平台发展的支撑下适合商业分析的一种形式。也许是因为数据挖掘源于实践而非 理论,在其过程的理解上不太引人注意。20世纪90年代晚期发展的CRISP-DM,逐渐成为数据挖掘过程的一种标准化过程,被越来越多的数据挖掘实践者成功运用和遵循。

阅读全文

机器学习和统计模型的差异

机器学习和统计模型的差异

机器学习还被应用在YouTube 和Google的引擎推荐上, 机器学习通过瞬间分析大量的观测样本给出近乎完美的推荐建议。 即使只采用一个16 G 内存的笔记本,我每天处理数十万行的数千个参数的模型也不会超过30分钟。 然而一个统计模型需要在一台超级计算机跑一百万年来来观察数千个参数。

阅读全文

2015年数据可视化十佳项目

2015年数据可视化十佳项目

2015 年,优秀的可视化作品生机勃勃,我可以确定,明年也会有很多好作品。横跨不同主题和应用形式的项目大量涌现,但如果让我选一个年度主题的话,那一定是“教学”,不管是通过解释说明,模拟说明还是深刻分析的方式。有时候会感到可视化创作者很大胆,试着让读者们不再用惯有的思维方式来理解数据和统计学。我很喜欢这一点。

阅读全文

12位专家展望未来5年深度学习发展趋势

12位专家展望未来5年深度学习发展趋势

2015年已然过去,2016刚刚开始,回头将目光集中于去年的成就上,以及对将来科学趋势的预测。去年最令人瞩目的一个领域就是深度学习,它是机器学习中越来越流行的一个分支,看起来它会继续向前发展,并会运用到越来越多的行业和领域中。

阅读全文

谷歌如何从网络的大海里捞到针

谷歌如何从网络的大海里捞到针

包括谷歌在内,多数搜索引擎都是不断地运行计算机程序群,来检索网络上的网页、搜索每份文件中的词语并且将相关信息以高效的形式进行存储。每当用户检索一个短语,例如“搜索引擎”,搜索引擎就将找出所有含有被检索短语的网页。(或许,类似“搜索”与“引擎”之间的距离这样的额外信息都被会考虑在内。)

阅读全文

构建机器学习系统的20个经验教训

构建机器学习系统的20个经验教训

数据科学家对优化算法和模型以进一步发掘数据价值的追求永无止境。在这个过程中他们不仅需要总结前人的经验教训,还需要有自己的理解与见地,虽然后者取决于人的灵动性,但是前者却是可以用语言来传授的。最近Devendra Desale就在KDnuggets上发表了一篇文章,总结了Quora的工程副总裁Xavier Amatriain在Netflix和Quora从事推荐系统和机器学习工作时所总结的20条经验教训。

阅读全文

基于技能的改善数据科学实践的方法

基于技能的改善数据科学实践的方法

在当今的大数据时代,利用数据科学理论进行数据分析起着越来越重要的作用。探讨不同数据技巧类型和熟练程度对相关项目有着怎样的影响也开始具有重要意义。近日,AnalyticsWeek的首席研究员、Bussiness Over Broadway的总裁Bob Hayes博士就公开了研究数据分析项目成功所必需技能的相关结果。Bob所提出的基于技能的数据科学驱动力矩阵方法,可以指出最能改善数据科学实践的若干技能。

阅读全文

如何挖掘网民意见?评价对象抽取综述

如何挖掘网民意见?评价对象抽取综述

近年来微博等用户自媒体的爆炸式增长,使得利用计算机挖掘网民意见不但变得可行,而且变得必须。这其中很重要的一项任务就是挖掘网民意见所讨论的对象,即评价对象。本文概览了目前主流的提取技术,包括名词短语的频繁项挖掘、评价词的映射、监督学习方法以及主题模型方法。目前抽取的问题在于中文本身的特性、大数据等。

阅读全文

信用卡客户价值分析

信用卡客户价值分析

让历史告诉未来。客户价值分析就是通过数学模型由客户历史数据预测客户未来购买力,这是数据挖掘与数据分析中一个重要的研究和应用方向。RMF方法就是让历史告诉未来的趋势分析法,利用RMF方法科学地预测老客户未来的购买金额,然后对产品成本、关系营销费用等进行推算,即可按年、按季度、按月预测出客户未来价值。这里以信用卡为例,讨论和分析信用卡客户价值。

阅读全文

TalkingData:相关分析在游戏中的应用

TalkingData:相关分析在游戏中的应用

凭借着科技的力量进入了大数据时代,收集数据的能力也大大提高,分析师 每天与这些“大”数据打交道。在游戏行业,我们拥有成熟的 AARRR 模型,从 获客、活跃、流失和留存、收入到用户传播建立一个完美的 闭环。除了常规指标, 在分析过程中我们还会建立很多临时指标来辅助分析。面对这么多统计的数据, 我们会好奇这些指标或者变量之间是否存在某种相关性,以及相关程度如何,这 就用到我们今天要分享的内容——相关分析。

阅读全文

实时营销对B2B来说意味着什么

实时营销对B2B来说意味着什么

事实上65%的B2B公司正在实施某种形式的实时营销,并且有87%的公司认同实时营销作为行为、设备、地点和时间的集合是至关重要的。完整的报告中可以发现,其突出显示出商业买家是如何不间断地明确他们的需求,以及实时营销的好处和挑战。

阅读全文