对标国内外的互联网的现状,大数据已经是全球互联网普遍存在的问题。既然是互联网,那肯定是用户为王,这时矛盾就出现了,既要拥抱大量的用户,又想减少海量大数据给企业业务运行所带来的压力。这看似是一个伪命题,但在互联网圈内,似乎没有解决不了的难题。
并且在互联网越来越快的今天,用户的“耐性”正在变得越来越差,打车、外卖、网购、在线视频等等,用户已经不能忍受较长时间的等待。在用户为王的互联网圈,用户的需求就是企业最为关注的地方。况且个性化服务、用户体验提升、智能分析、事中决策等复杂的业务需求都在要求企业能够快速且实时的对用户数据进行处理和分析,毕竟在寸秒寸金的互联网行业内,一秒的延迟就意味着大量资金的流失。
因此,对于大数据的处理能力,也间接决定了一家企业的体量究竟能够做到多大。
从大数据处理技术在国内的应用程度来说,一线大厂的技术进化程度更高,且由于数据体量更大,大数据处理技术在一线大厂内的实践对我们普通开发者来说更具参考价值。
此次 QCon 广州【大数据处理】专题,邀请到了来自阿里的资深技术专家王绍翾(大沙),滴滴出行高级专家工程师张亮,OPPO 大数据平台研发负责人张俊以及 PingCAP 数据库核心研发工程师韦万。来为大家实地讲解大数据处理技术在一线大厂内的深度实践,以最具参考价值的大体量数据为基本点,共同探索智能化大数据处理平台的发展趋势及方向。
以下为具体的讲师议题介绍:
滴滴数据检索平台是基于 ElasticSearch 构建的一站式搜索中台,服务了公司一千多个平台方,涵盖了搜索与推荐、Mysql 实时数仓、安全分析、日志检索四大应用场景。本次会分享面对数千万 TPS 写入、数万 QPS 查询,PB 级的数据存储,如何打造存储成本低、系统稳定性好,易用的搜索中台。
如何基于 ElasticSearch 构建低成本的日志检索解决方案?
面对千万级 TPS 的实时写入,万级 QPS 的实时查询,如何保证检索平台的稳定性?
业务快速发展下,平台如何高效的服务用户?
为了全面推动数仓实时化,OPPO 基于 Flink 打造的实时计算平台 OStream ,已广泛服务于实时 ETL/ 实时报表 / 实时标签等应用场景。本次讲演将分享 OStream 平台的研发之道(包括设计原则、总体架构、Flink 改进优化),业务场景的接入与应用实践,以及平台往智能化方向发展的探索与思考。
OPPO 大数据平台整体介绍;
构建实时计算平台的业务与技术背景;
基于 Flink 来研发 OStream 所进行的一系列工作,包括对 Flink 的改进与贡献;
OStream 业务接入与应用实践;
未来展望与规划。
如何基于 Flink 构建低门槛、高可用的实时计算平台,其核心优势是什么;
如何推动业务接入平台,有哪些切入点;
如何推动平台往智能化发展,进一步降低业务应用门槛;
如何参与到 Flink 开源社区,让企业的改动和社区保持同步。
由于分析型与交易型数据库设计上的本质矛盾,使用户的数据平台变得异常复杂:人们不得不通过各种手段将在线交易数据搬运到分析平台中。这样的架构不但难于维护,而且可能会丢失数据库新鲜度与一致性。HTAP 是一个并不容易的目标。包括 TiDB 自己,以往版本所提出的解决方案并不完善。一个相对完善的 HTAP 数据库,必须良好地解决交易和分析负载隔离;行存和列存的融合且互不影响,并避免设计中可能引入的延迟或一致性冲突。
本次演讲将和听众探讨 HTAP 的价值,为何难以实现以及 TiDB 的新组件 TiFlash 如何围绕 Multi-Raft 独创性地解决这些问题。
了解 HTAP 的意义;
了解 HTAP 的技术难点;
学习 TiFlash 的设计以及如何解决这些难题。
5 月 25-28 日 QCon 全球软件开发大会(广州站),现场与大咖讲师面对面沟通,共话大数据处理技术在多业务场景下的技术落地与发展趋势。此外大会还会邀请来自 BAT、京东、滴滴、网易等 70 余名来自一线大厂的大咖讲师,与现场参会者深度探讨【大前端】、【微服务】、【人工智能】、【高可用高性能架构】、【DevOps】等 13+ 热门技术的实践及趋势。
扫描下方二维码或点击阅读原文可了解大会详情,当前正处于 9 折阶段,购票立减 680 元,咨询可致电鱼丸:13269078023(微信同号)。
1、头条易读遵循行业规范,任何转载的稿件都会明确标注作者和来源;
2、本文内容来自“InfoQ”微信公众号,文章版权归InfoQ公众号所有。