没有找到合适的产品?
联系客服协助选型:023-68661681
提供3000多款全球软件/控件产品
针对软件研发的各个阶段提供专业培训与技术咨询
根据客户需求提供定制化的软件开发服务
全球知名设计软件,显著提升设计质量
打造以经营为中心,实现生产过程透明化管理
帮助企业合理产能分配,提高资源利用率
快速打造数字化生产线,实现全流程追溯
生产过程精准追溯,满足企业合规要求
以六西格玛为理论基础,实现产品质量全数字化管理
通过大屏电子看板,实现车间透明化管理
对设备进行全生命周期管理,提高设备综合利用率
实现设备数据的实时采集与监控
利用数字化技术提升油气勘探的效率和成功率
钻井计划优化、实时监控和风险评估
提供业务洞察与决策支持实现数据驱动决策
原创|行业资讯|编辑:况鱼杰|2020-06-03 10:13:33.943|阅读 380 次
概述:Apache Hadoop Ozone是一个分布式键值存储,可以同时管理大小文件。Ozone旨在解决HDFS相对于小文件的规模限制。HDFS旨在存储大文件,对于Namenode,HDFS上建议的文件数量为3亿个,并且扩展规模不能超过此限制。
# 界面/图表报表/文档/IDE等千款热门软控件火热销售中 >>
相关链接:
Apache Hadoop Ozone是一个分布式键值存储,可以同时管理大小文件。Ozone旨在解决HDFS相对于小文件的规模限制。HDFS旨在存储大文件,对于Namenode,HDFS上建议的文件数量为3亿个,并且扩展规模不能超过此限制。
有助于实现可扩展性的Ozone的主要功能是:
突破10亿个密钥之旅,超越了HDFS可扩展性限制
在Ozone中达到十亿个对象一直是该项目的重要里程碑之一。使用在5个节点(每个节点有50个线程)上运行的自定义作业填充数据。Ozone在11个节点的群集(1个OM,1个SCM和9个数据节点)上运行,花了56个小时才达到10亿个对象,每个对象的大小均为10KB。选择10KB的原因是用小文件测量Ozone性能。
Ozone能够以〜5000个对象/秒的持续速率写入对象,这进一步突出了Ozone的小文件处理能力,在整个测试过程中,它能够提供相同的吞吐量。
一些重要的细节:
来自OzoneManger的持续交易
OzoneManger总共处理了20亿笔交易,每个对象有两笔交易(一个用于打开文件,另一个用于提交文件)。OzoneManger(OM)以大约12毫秒的延迟处理了10亿个对象中的这些操作。恒定的等待时间还凸显了OzoneManager上没有长时间的GC暂停。
小元数据开销
每个10KB大小的十亿个密钥存储在2121个5GB容器中,这大大减少了SCM的块元数据,与在OFS中报告的2121个容器相比,HDFS中报告了10亿个块。另一方面,OM上的十亿个密钥在SSD上总共占用了127 GB的空间。
测试环境
该测试在Apache Hadoop Ozone 0.5.0(Beta)版本上运行。
硬件
该测试是在AWS EC2实例类型为m5a.4xlarge的情况下执行的,其中具有用于OzoneManager和Storage Container Manager数据库的SSD。
结论
HDFS围绕小文件的已知限制和名称空间规模限制导致存储节点利用率不足,GC问题和Namenode不稳定,以及大型数据湖部署的名称空间碎片。Ozone通过处理数十亿个各种大小的文件来克服这些限制,因此可以在单个名称空间中部署大型数据湖。 具有更高规模的Ozone体系结构以及对对象存储用例的支持,可以满足私有云环境中对大数据存储的需求,在私有云环境中,计算和存储的分类正在迅速发展。
关于Cloudera
在 Cloudera,我们相信数据可以使今天的不可能,在明天成为可能。我们使人们能够将复杂的数据转换为清晰而可行的洞察力。Cloudera 为任何地方的任何数据从边缘到人工智能提供企业数据云平台服务。在开源社区不懈创新的支持下, Cloudera推动了全球最大型企业的数字化转型历程。了解更多,请联系在线客服。
慧都大数据专业团队为企业提供Cloudera大数据平台搭建,免费业务咨询,定制开发等完整服务,快速、轻松、低成本将任何Hadoop集群从试用阶段转移到生产阶段。
欢迎拨打慧都热线023-68661681或咨询慧都在线客服,我们有专业的大数据团队,为您提供免费大数据相关业务咨询!
本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@evget.com
近日,AG Grid 正式发布 34.1 版本,本次更新以“提升开发者生产力、简化测试流程、增强布局与样式控制”为核心目标,带来了多项实用功能与体验优化。
金融行业的支付、清算和核心账务系统,承载着海量用户的实时交易和高并发访问。TestComplete的并行测试方案正在重新定义质量保障的标准,从千人并发模拟到跨浏览器验证,再到持续集成下的自动化回归,这套完整的测试体系使金融系统实现了从"被动防御故障"到"主动保障质量"的转变。
还在为复杂业务需求难以梳理而困扰?或是苦于软件设计文档零散、沟通效率低下?对于追求效率与技术深度的顾问、分析师、架构师和开发工程师而言,一款趁手的建模工具绝非锦上添花,而是刚需。企业级架构与建模工具Enterprise Architect (Sparx EA)专业版正是这样一款能让你在5分钟内快速启动,并即刻投入高效建模工作的利器,无缝覆盖从业务流程到软件设计的全流程。
微软首席项目经理 Jeff Fritz演示了 IronPDF 如何通过新的 AI 驱动扩展功能,改变和简化开发人员处理 PDF 文档的方式。IronPDF 不仅是一款 PDF 生成工具,现在还能让用户以创新的方式分析、汇总和与 PDF 进行交互。
一款用于数据驱动的云优先型企业的平台。
Cloudera Data Warehouse今天,明天及未来的现代分析数据库。
Cloudera DataFlowCloudera DataFlow是一个可扩展的实时流分析平台。
Cloudera Machine Learning使AI第一企业能够通过自助服务访问受控数据。
CDP Data CenterCDP Data Center是用于本地IT环境的全面数据管理和分析平台。
服务电话
重庆/ 023-68661681
华东/ 13452821722
华南/ 18100878085
华北/ 17347785263
客户支持
技术支持咨询服务
服务热线:400-700-1020
邮箱:sales@evget.com
关注我们
地址 : 重庆市九龙坡区火炬大道69号6幢
慧都科技 版权所有 Copyright 2003-
2025 渝ICP备12000582号-13 渝公网安备
50010702500608号