-
倒计时24小时开课|StuQ大数据分析平台小班课(仅剩10
[大数据] 2021-01-23 22:43:30
StuQ?联合三位大数据资深专家桑文锋、曹犟、付力力共同推出《从0到1构建大数据分析平台》精品小班教学,仅有 60 席位,精品小班课区别于大众在线视频教学,课程设置具有如下特色: 采用在线视频直播授课 以实战为主 ...[详细]
-
O2O产品质量保障体系(四)| 基于学习的线下商户质量
[大数据] 2021-01-23 22:43:01
一、线下商户问题迫在眉睫 糯米不仅仅是团购,它是O2O的生活服务平台,糯米的产品质量可以定义为线上和线下,线上主要是在线商品的售卖情况,所对应的质量问题也就是商品类的badcase,这些会直接影响我们的流水。而...[详细]
-
EMC存储上的大数据 – 大数据分析实施路线
[大数据] 2021-01-23 22:40:42
? ? ?企业一直在处理快速增长的数据量(也称为大数据)的存储和管理问题。本文为系列的第十篇,介绍了发现适当的大数据业务机会并制定利用该机会的全面路线图。 ? ???? 大数据时代,各公司都在努力挖掘有关他们业务...[详细]
-
Mondrian 4 测试的简单demo(Saiku简单测试Schema文件
[大数据] 2021-01-23 22:40:18
##?整理此文章方便大家做测试(手写Mondrian?Schema自测),不必每次都向saiku上传文件了 ##?关键文件 *?foodmart4.xml??测试对应的schema文件 *?foodmart-sql.zip????测试对应的数据库脚本 maven项目: pom文件 foo...[详细]
-
文本挖掘的基本流程
[大数据] 2021-01-23 22:39:46
一、获取文本 ??我们获取网络文本,主要是获取网页HTML的形式。我们要把网络中的文本获取文本数据库(数据集)。编写爬虫(Spider)程序,抓取到网络中的信息。可以用广度优先和深度优先;根据用户的需求,爬虫可以有垂...[详细]
-
81个开源大数据处理工具汇总(上),包括查询引擎/流
[大数据] 2021-01-23 22:38:48
本文一共分为上下两部分。我们将针对大数据开源工具不同的用处来进行分类,并且附上了官网和部分下载链接,希望能给做大数据的朋友做个参考。下面是第一部分。 查询引擎 一、Phoenix 贡献者::Salesforce 简介:这...[详细]
-
81个开源大数据处理工具汇总(下),包括日志收集系统
[大数据] 2021-01-23 22:38:10
上一部分:http://my.oschina.net/u/2391658/blog/711016 第二部分主要收集整理的内容主要有日志收集系统、消息系统、分布式服务、集群管理、RPC、基础设施、搜索引擎、Iaas和监控管理等大数据开源工具。 ? 日志收集...[详细]
-
深度解析 Twitter Heron 大数据实时分析系统
[大数据] 2021-01-23 22:37:41
2015年6月1号, Twitter 对外宣讲了他们的Heron系统, 从ppt和论文中,看起来完爆storm。昨天,抽空把论文,仔细读了一遍, 把个人笔记和心得分享一下: 摘要: Heron更适合超大规模的机器, 超过1000台机器以上的集...[详细]
-
图解机顶盒数据处理流程
[大数据] 2021-01-23 22:37:10
1. 前端数据的打包、调制 与 广播 前端系统负责将电视节目的音视频数据,数字电视业务信息的各种表 按照 数字电视业务信息规范,打包成 ts 流,然后进行调制,再通过cable线,卫星,地面直播信号塔这些物理信道进行...[详细]