什么是规律| 印度阿三是什么意思| 幽门螺杆菌感染有什么症状和表现| vana是什么牌子| 官杀是什么| 化妆的步骤是什么顺序| 骨骼是什么意思| 11月20号是什么星座| 补肾壮阳吃什么好| gg什么意思| 皮肤干燥缺什么维生素| 孕妇梦见水是什么意思| 沉香是什么| 胶囊壳是什么原料做的| 双手脱皮是什么原因引起的| 什么是湿气| 扁桃体发炎不能吃什么东西| 老婆妹妹叫什么| 鸡飞狗跳是什么生肖| 影字五行属什么| 鸡腿炖什么好吃| 背靠背是什么牌子| 阑尾炎属于什么科室| 什么是开悟| 什么不什么什么| 开怀什么意思| 耸肩是什么意思| 什么是雾霾| 石榴什么时候开花| 政治信仰是什么| 柠檬片泡水喝有什么功效和作用| cm是什么| 什么是白内障症状| 尿路感染用什么药| 一什么蜘蛛| nub是什么意思| 肝火旺是什么原因引起的| 荤菜是什么意思| 脾与什么相表里| 缓释片是什么意思| 一月出生是什么星座| 小肠与什么相表里| 吸入甲醛会有什么症状| 11月生日是什么星座| 腰椎间盘突出看什么科| 铁蛋白低是什么意思| 胜肽的主要功能是什么| 高祖父的爸爸叫什么| 5年生存率是什么意思| 吃开心果有什么好处和坏处| 梦见倒房子是什么预兆| 耗儿鱼是什么鱼| 礼拜是什么意思| 神疲乏力是什么症状| 异位性皮炎是什么意思| 逆时针揉肚子起什么作用| 小孩便秘吃什么食物好| 11.9是什么星座| 现在是吃什么水果的季节| 什么是党的根本大法| 脚背痛什么原因| 停车坐爱枫林晚的坐是什么意思| 舌头有麻木感什么原因| 玫瑰花代表什么意思| 得宫颈癌的前兆是什么| 肠息肉是什么原因造成的| disease是什么意思| 虚岁28岁属什么生肖| 阿玛尼手表属于什么档次| 淀粉酶高是什么原因| 喉咙干痒咳嗽吃什么药| 面试穿什么衣服比较合适| 冶游史是什么意思| 铁剂是什么| 11月6日什么星座| bpd是胎儿的什么意思| 什么的鸟儿| 什么叫湿热| 牛和什么属相最配| 摩羯男喜欢什么类型的女生| 男人阳气不足有什么症状| 嬲是什么意思| 痱子是什么样的图片| 外阴白斑有什么症状| b站是什么| 带量采购是什么意思| 慢性胃炎伴胆汁反流是什么意思| 痛苦是什么意思| 感染梅毒有什么症状| 90年属于什么生肖| 牛黄安宫丸什么时候吃最好| 今年21岁属什么生肖| 双喜临门的临是什么意思| 芈月传芈姝结局是什么| 战国时期是什么时候| 田各读什么| 放飞自我是什么意思| 帝女花讲的是什么故事| 青核桃皮的功效与作用是什么| 相拥是什么意思| 地中海贫血是什么| 辐照食品是什么意思| 今年十八岁属什么生肖| 12月7日是什么星座| 早起的鸟儿有虫吃是什么意思| 瞬移是什么意思| 鱼什么而什么| 四大美女指什么生肖| 肩胛骨疼挂什么科| 大肝功能是检查什么| 排长是什么级别| 遗传是什么意思| kai是什么意思| 酸奶什么时候喝好| 大便干结是什么原因| 麦冬有什么作用与功效| 谷氨酰转肽酶偏高是什么意思| 害喜是什么意思| 集少两撇是什么字| 心脏供血不足是什么原因引起的| 乳痈是什么意思| 拔牙之后吃什么消炎药| 走仕途是什么意思| 腻歪什么意思| 南瓜子吃多了有什么副作用| 为什么吃辣的就拉肚子| twins是什么意思| 宗人府是什么地方| 清补凉是什么| 胎菊和金银花一起泡水有什么效果| 轻描淡写是什么意思| 梦见给别人剪头发是什么意思| 指桑骂槐是什么生肖| 吃生姜对身体有什么好处和坏处| 老公护着婆婆说明什么| 4月5日什么星座| 生殖疱疹用什么药效果好| 甜菜是什么菜| 红枣有什么功效和作用| 什么含维生素d| 产后可以吃什么水果| 落魄是什么意思| 生长激素由什么分泌| 51年属什么生肖| 孕期便秘吃什么通便快| 经是什么意思| 牛乳是什么| 假酒喝了有什么症状| 手串18颗代表什么意思| 不孕为什么要查胰岛素| 狗狗能看见什么颜色| 浔是什么意思| 79岁属什么| 什么是三公经费| covu是什么药| 今年66岁属什么生肖的| 腰间盘突出有什么好的治疗方法| 中指尖麻木是什么原因| 秋葵什么时候播种| 天煞是什么意思| 天使轮是什么意思| 龙日冲狗煞南是什么意思| 小腿痛是什么原因| 有福是什么意思| gg是什么牌子的包包| 狗被蜱虫咬了有什么症状| 什么颜色加什么颜色是黄色| 花旗参和西洋参有什么区别| AMY医学上是什么意思| 什么地指挥| 为什么耳鸣一直不停| 生普属于什么茶| 糍粑是什么做的| 什么叫真菌| 耦合是什么意思| 日文是什么字| 甲状腺3类是什么意思| 喝冰水牙疼是什么原因| 搬家有什么讲究和忌讳| 刮宫和清宫有什么区别| 部堂大人是什么职位| 今年是什么年啊| 医美是什么意思| 英姿的动物是什么生肖| 口苦吃什么药最有效| 第一颗原子弹叫什么| 碘伏和碘酒有什么区别| no2是什么| 男人吃四环素治什么病| 血细胞分析能查出什么| 井泉水命什么意思| 肝功能查什么| 1987年属什么| 真菌孢子是什么| 淋巴结清扫是什么意思| 1936年是什么年| 脚脱皮是什么原因| 出汗发粘是什么原因| 叶黄素有什么功效| 女儿红属于什么酒| 蛋白粉什么时候吃最好| 生殖激素常规检查是查什么的| 什么时间泡脚最好| 骨髓捐赠对自己有什么影响没有| 牙周炎吃什么药好| 肚子响是什么原因| 五心烦热是什么意思| eo什么意思| 正师级是什么军衔| 七八年属什么生肖| 男人阳气不足有什么症状| 粉饼是干什么用的| 胎盘低置状态是什么意思| 为什么会得阴道炎| 青蒿素是什么| 什么牌助听器好| 胆结石吃什么药可以化掉结石| 漂洗和洗涤有什么区别| 2030是什么年| 聪明的动物是什么生肖| 脂肪肝喝什么茶最好| 为什么眼皮会肿| 4月17是什么星座| 休克是什么症状| 一什么浮萍| 老年人出虚汗是什么原因引起的| 脖子落枕贴什么膏药| 主人杯是什么意思| 辰五行属性是什么| 银杏属于什么植物| 尿酸高什么水果不能吃| 什么动物可以贴在墙上| mac是什么牌子| 申时是什么时候| 为什么会长花斑癣| 乙肝抗体阳性是什么意思| 退烧药吃多了有什么副作用| 厚黑学是什么意思| 切尔斯什么意思| 起司是什么| 什么是双向情感障碍| 为什么会一直放屁| 甲鱼吃什么的| cd是什么牌子| 鱼泡是鱼的什么器官| 刻舟求剑的寓意是什么| 减肥可以吃什么主食| 六亲缘浅是什么意思| 1221是什么星座| 神经纤维瘤是什么病| 布朗尼是什么| 11月是什么星座| 畅字五行属什么| 祖马龙香水什么档次| 新生儿出院回家有什么讲究| 笑话是什么意思| pm是什么职位| 娃娃衫配什么裤子图片| 丹五行属性是什么| 花白鲢喂养什么长得快| 甲状腺钙化是什么意思| 七月二十六是什么星座| 什么的表演| 收缩压和舒张压是什么| 百度
大数据频道 频道

阿里云封神:Gartner看衰的并不是Hadoop生态

  【IT168 评论】在过去几个月的走访调研中,针对Gartner《2017年数据管理技术成熟度曲线》做出的Hadoop“即将在到达生产成熟期之前衰落”的结论,笔者询问了数十位大数据领域技术专家的观点,Hadoop在国内大数据市场的地位正如笔者所预料的一样稳固。既然如此,那么是Gartner的结论有误吗?我们应该如何正确解读这份报告?抛开报告,Hadoop生态各组件到底表现如何呢?

阿里云封神:Gartner看衰的并不是Hadoop生态

  本期采访嘉宾:封神,09年加入阿里,9年来专注在分布式计算、存储、数据库领域。曾研发集团超过1w台Hadoop集群,万台规模的跨机房建设,并负责其中分布式调度及内存计算引擎Spark。曾研发集团超过5w台的ODPS集群,自主研发分布式内存引擎,处理超过PB级别数据的迭代计算,并把开源体系融合到内部ODPS体系之中。16年起,开始做云产品,构建大数据数据库服务,研究分布式检索与原始数据的融合技术、研究行列混合、存储计算分离、新硬件加速、统一SQL、弹性调度计算、时序、时空、图数据等非结构化等技术,并负责计算与存储产品化,目前为千百客户提供专业存储计算云HBase服务。

  Gartner看衰结论正确解读:此“Hadoop”非彼“Hadoop”!

  Gartner所做出的的看衰结论不假,但其主体范围需要界定清楚。根据封神的介绍,Gartner所提及的Hadoop更多是狭义上的Hadoop一体化平台,但我们通常意义上讨论的是广义Hadoop生态,整个生态包含了众多组件,这个范围与前者相差很大。

  对于Hadoop生态的发展状态,我们可以分层逐级解析。首先是HDFS分布式文件系统层,封神表示,目前尚没有任何一款开源产品足以完整替代HDFS,因此其生命力必定是旺盛的。目前看起来,有可能挑战的是业务模式的变化,用户上云后,直接用对象存储,做到存储与计算分离,节约成本。

  其次是Yarn所在的分布式调度层。作为大数据核心调度组件,Yarn的使用覆盖率非常高。虽然在离线与在线数据混合方面表现欠缺,但Yarn一直在不断改进。这一点也与Yarn的发展背景有关,支持Yarn的几家公司主要做离线系统,对在线系统部署问题关注不够。当然,目前市场已经有了存在一定竞争关系的产品,比如Mesos,但这两大调度系统的设计目标并不完全相同,并且Yarn也在朝着Mesos的领域进军。此外,从某种意义上讲,Yarn与Hadoop生态体系中的一些组件包都可共享,贸然更换势必面临着适配问题。

  在分布式文件系统和分布式调度系统的基础之上,各类组件的加入让Hadoop生态更加丰富。在绝大多数用户的认知中,Hive、MapReduce、热议的Spark以及Flink的定位都只是Hadoop生态中的一个计算引擎,并不存在替代Hadoop生态的关系,Hadoop生态的整体生命力非常强,这一点也在连续几个月的调研中得到了证实,Hadoop在大数据领域的标准地位远比我们想象得要稳固。

阿里云封神:Gartner看衰的并不是Hadoop生态

  Hadoop生态圈组件生命力解析:替不替代取决于需求!

  Hadoop生态圈组件繁多,组件替换是大多数企业对Hadoop生态圈进行改良的重要一步,但很多企业和技术人员对如何替换和挑选组件完全没有头绪。根据封神的介绍,虽然短期内Spark和Flink没有能力替代整个Hadoop生态,但是它们有能力替代个别计算引擎。Spark的生态日益完善,其在机器学习、SQL以及Streaming方面的先天优势明显;Flink主攻流式处理,延迟较低,这两大引擎目前的整体表现还是不错的。虽然部分企业会尝试使用Spark替换MapReduce,但在封神看来,这样的组件替换需要从实际业务需求出发,如果看中稳定性,MapReduce略胜一筹;如果看中生态所提供的能力,自然是Spark更加完善。

  此外,Hive也非常有竞争力,阿里内部PB级数据量的处理非Hive不可,因为其稳定性非常高,当数据量达到PB级别,一个任务要运行两到三天时,没有一个组件可以挑战Hive的稳定性。作为开源分布式数据库,HBase也是大多数企业的首选,本月发布的HBase 2.0版本被称为迄今为止最大的版本,共包含4551个Issues,对可用性和延迟均做出了优化。对于现在很多数据库都在做的一写多读,HBase在1.X版本早期就具备该能力。其次,HBase非常适合云计算环境。不管是AWS还是阿里主推的关系型数据库,其本质都是存储计算分离,HBase诞生的第一天就是存储计算分离的,现如今经过了多年在各大公司的磨炼,HBase的存储计算分离已经相当成熟。

  Hadoop渐步成熟期,其可能替代品的生存现状如何?

  封神表示,就个人参加Hadoop大会的感受而言,Hadoop不是衰退了而是成熟了,现在的Hadoop大会更多的是在谈人工智能、区块链和知识图谱等新兴技术,大家更关注的不再是Hadoop生态的底层实现,而是其上的应用,这就造成了用户对Hadoop关注度降低的假象。

  当然,任何一项技术发展了十余年,总会出现一些挑战者。封神谈及,NewSQL确实是分布式,也能解决部分存储相关的事情,具备存储和并发能力,但它主要解决的是核心场景,比如金融级场景下的核心问题,并不擅长海量数据存储且成本偏高。此外,Cassandra和Elasticsearch也能变相解决部分Hadoop问题,在工具的支撑下,用户非常容易上手,但随着规模的不断扩大,最终还是要回到整个Hadoop生态。

  综上,封神认为Gartner所做出的的结论更偏向于Hadoop本身而非Hadoop生态,但在大多数用户的认知中,我们在谈论Hadoop时已经默认是Hadoop生态,因此我们没必要对Gartner的结论太过苛责,毕竟目前国内的一线互联网企业都在使用Hadoop生态,短期内我们并没有看到改朝换代的迹象,反倒是其核心组件越来越成熟。如果不用Hadoop,你还可以做出什么选择呢?

阿里云封神:Gartner看衰的并不是Hadoop生态
点击参与大话IT讨论活动,有机会获得精美礼品

0
相关文章