第一范文网 - 专业文章范例文档资料分享平台

分布式数据库TPC-H测试_XXX

来源:用户分享 时间:2025/10/6 19:12:59 本文由loading 分享 下载这篇文档手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:xxxxxxx或QQ:xxxxxx 处理(尽可能给您提供完整文档),感谢您的支持与谅解。

分布式数据库TPC-H测试(GREENPLUM)

1、引言

如今,多样的交易模式以及大众消费观念的改变使得数据库应用领域不断扩大,现代的大型分布式应用系统的数据膨胀也对数据库的海量数据处理能力和并行处理能力提出了更高的要求,如何在数据呈现海量扩张的同时提高处理速度和应用系统的可用性,使客户能同时得到更高的处理速度、更高的数据可用性和更大的数据集,是数据库系统面临的一个挑战。

通过TPC-H基准测试,可获得数据库单位时间内的性能处理能力,为评估数据库系统的现有性能服务水平提供有效依据,通过横向对比促进数据库系统的整体质量提升,能更好地在重大信息化工程中实现推广。

2、TPC-H原理简介

TPC-H是由TPC(Transaction Processing Performance Council)事务处理性能委员会公布的一套针对数据库决策支持能力的测试基准,通过模拟数据库中与业务相关的复杂查询和并行的数据修改操作考察数据库的综合处理能力,获取数据库操作的响应时间和每小时执行的查询数指标(QphH@Size)。

TPC-H基准模型中定义了一个数据库模型,容量可以在1GB~10000GB的8个级别中进行选择。数据库模型包括CUSTOMER、LINEITEM、NATION、ORDERS、PART、PARTSUPP、REGION和SUPPLIER 8张数据表,涉及22条复杂的select查询流语句和2条带有insert和delete程序段的更新流语句。测试分为Power测试和Throughout测试两种类型,Power测试是随机执行22条查询流中的一条测试流和2条更新流中的一条测试流,考核指标为QppH@Size;Throughout测试执行的是多条查询流和一条更新流对数据库的混合操作,考核指标是QthH@Size,Power测试和Throughout测试通过数理方式合成的结果为TPC-H基准测试中最关键的一项指标:每小时数据库查询数(QphH@Size),是QppH@Size和QthH@Size结果的乘积的1/2次方。

3、某数据库测试执行和优化过程 3.1测试执行过程

数据加载完成后需要进行数据完整性检查,10GB容量的数据情况应如下:

通过《TPC-H测试规范》排序集中规定的方式单线程执行功率测试中的22条SQL查询语句,2条更新流语句通过人工执行并统计时间;吞吐率测试为10个线程同时执行。

测试监控:使用spotlight和vmstat、iostat、sar命令同步监控。 3.2测试优化过程 无

3.3测试结果 (1)配置统计信息:

(2)测试结果统计信息:

(3)响应时间统计信息:

(4)查询和更新操作响应时间曲线图:

图 1 TPC-H查询和更新操作响应时间-

(5)此时过程中数据库服务器资源监控

CPU利用率

网络利用率

每秒磁盘I/O数

4、结果分析

在本次测试过程中,共有10个线程进行数据操作,其中 Q1 查询语句的平均响应时间为 秒, Q2 查询语句的平均响应时间为 秒, Q3 查询语句的平均响应时间为 秒, Q4 查询语句的平均响应时间为 秒, Q5 查询语句的平均响应时间为 秒, Q6 查询语句的平均响应时间为 秒, Q7 查询语句的平均响应时间为 秒, Q8 查询语句的平均响应时间为 秒, Q9 查询语句的平均响应时间为 秒, Q10 查询语句的平均响应时间为 秒, Q11 查询语句的平均响应时间为 秒, Q12 查询语句的平均响应时间为 秒, Q13 查询语句的平均响应时间为 秒, Q14 查询语句的平均响应时间为 秒, Q15 查询语句的平均响应时间为 秒, Q16 查询语句的平均响应时间为 秒, Q17 查询语句的平均响应时间为 秒, Q18 查询语句的平均响应时间为 秒, Q19 查询语句的平均响应时间为 2.804 秒, Q20 查询语句的平均响应时间为 秒, Q21 查询语句的平均响应时间为 秒, Q22 查询语句的平均响应时间为 秒, RF1 更新语句的平均响应时间为 秒, RF2 更新语句的平均响应时间为 秒。

通过上述平均响应时间可以看出,被测数据库对于简单查询(简单查询所指对单个表的查询、多个表的简单属性查询、单一函数三种情况中的一种的查询语句)的平均响应时间较小,对于复杂查询(复杂查询所指对单个表的查询、多个表的简单属性查询、单一函数三种查询情况的两种及其以上的查询语句)的平均响应时间较大,而两条更新语句平均响应时间都较小,因此被测数据库在负载查询的处理方面仍存在很大的优化提升空间。通过TPC-H基准测试可以有效评估数据库系统的性能处理能力,也可以通过横向对比测试评价不同数据库管理系统的联机分析处理能力的差异,促进数据库系统的联机事务处理能力发展。

搜索更多关于: 分布式数据库TPC-H测试_XXX 的文档
分布式数据库TPC-H测试_XXX.doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.diyifanwen.net/c0smwq56s5r4mu7425eej_1.html(转载请注明文章来源)
热门推荐
Copyright © 2012-2023 第一范文网 版权所有 免责声明 | 联系我们
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:xxxxxx 邮箱:xxxxxx@qq.com
渝ICP备2023013149号
Top