56-天亮大数据系列教程之海量数据秒级布署与实时查询项目-课堂笔记-13

1、关于海量数据布署与查询的说明?
准确的讲项目名称为:海量数据秒级布署与高实时查询项目
布署:将数据进行处理至可以正式提供服务为止的这段过程或时间。
在此项目中,布署环境即为从weibo_json的生成(即数据块已完成)开始到对外可以提供restful service为止。
在此项目中,为何强调秒级布署?
1) 相比于mysql,redis,mongodb,hbase,oracle等而言,该方案在生成索引数据时,
非常的独立和高效,因为充分挥了集群mr和bdb嵌入式计算的特点。
2) 在生成索引数据过程中,对已提供的数据和rest服务,没有任何影响。
3) 在切换新数据源的时候,只需要切换数据源目录即可,通过一个多线程方法可以轻松实现。
在此项目中,何为高实时查询?
1) 之前的本地测试已证明,单次查询可以在3-5ms内完成。
2) 该查询因为采用双索引结构,先是索引号到database,再是database到kv对查询。
不会随着数据量的增长而使查询效率明显降低,需要合适设置数据总量和块数的比例关系。



天亮教育是一家从事大数据云计算、人工智能、教育培训、产品开发、咨询服务、人才优选为一体的综合型互联网科技公司。
公司由一批BAT等一线互联网IT精英人士创建,
以"快乐工作,认真生活,打造高端职业技能教育的一面旗帜"为愿景,胸怀"让天下没有难找的工作"使命,
坚持"客户第一、诚信、激情、拥抱变化"的价值观,
全心全意为学员赋能提效,践行技术改变命运的初心。

更多学习讨论, 请加入
官方-天亮大数据交流-366784928
群二维码:
这里写图片描述
天亮教育公开课-从小白到大佬修成记-全系列视频地址:http://bbs.myhope365.com/forum.php?mod=viewthread&tid=1422&extra=page%3D1

欢迎关注天亮教育公众号,大数据技术资料与课程、招生就业动态、教育资讯动态、创业历程分享一站式分享,官方微信公众号二维码:
在这里插入图片描述

天亮教育官方群318971238,
爬虫、nlp技术qq群320349384
hadoop & spark & hive技术群297585251
教育培训官网:http://myhope365.com
项目研发业务尚云科技官网:http://shangyuninfo.com/
官方天亮论坛:http://bbs.myhope365.com/

猜你喜欢

转载自blog.csdn.net/erliang20088/article/details/86548904