oracle cloud computing solution ·...
TRANSCRIPT
Oracle Enterprise Architecture
河南移动 甲骨文技术日
Software. Hardware. Complete
Oracle数据库云解决方案用于OneOSS基础云平台
提纲
• 云计算与移动网管支撑系统发展趋势
• Oracle数据库云平台
• 端到端云管理和云治理
• 电信行业案例和总结
云计算和虚拟化成为2010年CIO最为关注的话题
Source: Gartner. Leading in Times of Transition. The 2010 CIO Agenda
www.oracle.com/commitment
云架构烟囱式垂直架构
平均资源利用率5% - 10%
(Gartner)
平均资源自用率60% - 70%
(Oracle大学的网格)
Oracle 大学实际应用效果:从30个机房 =》 3个机房(3个异地容灾中心)
从200机架设备=》20机架设备开源(使能新的业务)+节流(降低CAPEX和OPEX)
Oracle是云计算的践行者:Oracle University助力节能减排
数据库和存储云• 8机架设备• 2368 核• 16TB内存• 1000+TB有效存储• 40TB Flash
• 7040Gb/s带宽
应用服务器云• 4机架设备• 1440核• 11.52TB内存• 3600Gb/s带宽
桌面云• 8机架设备• 2880核• 23.4TB内存• 7200Gb/s带宽
技术引导变革,Cloud In Boxes!
无所不在的网络
IB IB
企业云:提高整体系统利用率,降低CAPEX & OPEX
国内某电信企业调研主要应用基础设施状况分析
6
各线条主要应用系统大多采用x86
架构服务器,而且数量逐渐增加,
少数采用IBM,SUN,HP等提供的
Unix架构服务器
服务器架构
各线条主要应用系统的服务器峰值
利用率大多在35%到70%之间,利
用率小于35%和大于70%的各占
28%
CPU利用率(注)
业务线条 x86架构 Unix架构
业务支撑 69% 31%
网络支撑 60% 40%
管理支撑 67% 33%
数据业务 97% 3%
政企客户业务 100% 0
业务线条 <35
%
35%-
70%
>70%
业务支撑 34% 34% 32%
网络支撑 47% 25% 28%
管理支撑 17% 60% 23%
数据业务 35% 62% 3%
政企客户业务 98% 1% 0
注:服务器CPU峰值利用率和存储的数据为不完全统计,仅占收集到的服务器总数的40%
非Unix架构75%
各线条主要应用系统大多采用IBM
的存储设备,少部分采用SUN,
HP等提供的存储设备
存储使用(注)
业务线条 数据库 文件 其它
业务支撑 64% 29% 7%
网络支撑 67% 27% 6%
管理支撑 79% 22% 3%
数据业务 64% 25% 3%
政企客户业务 69% 24% 8%
结论:
1、非Unix架构服务器已占很大比例生产系统,而且呈现不断增加趋势
2、各业务系统CPU资源利用率普遍偏低
3、服务器和存储(除备份和容灾外)主要应用于数据库应用
4、进行基于服务器虚拟化和基于数据库的云计算探索价值最为明显
5、经过实测,经过VM虚拟机上实现数据库性能损耗达到50%以上
云资源池需求:针对不同资源需求,提供IaaS和PaaS不同类型的云平台资源池资源组合,分别满足低端和高端资源需求
服务器平台Server Platform
存储Storage
Win Linux UNIX
共享资源 + 独立资源
SAN NASBack
up
共享资源 + 独立资源
网络
网络
DMZ
存储区域
网络区域 A…Z
拆分
Oracle服务器/存储资源池
资源计划
服务安全
数据库类别
x86平台
Windows
1000M
NAS
数据库服务 应用服务/基础服务
高端PaaS数据库云服务
低端IaaS数据库服务
应用逻辑/展现
x86平台
Windows
1000M
NAS/iSCSI
标准配置
组合
数据库Oracle
SQL
Server
服务器
平台X86平台
UNIX平台
操作
系统Windows
UNIX
Linux
网络
类型1000M
10000M
存储 SAN
NAS
iSCSI
IaaS云平台资源 PaaS云平台资源
服务器资源池
存储资源池
数据库云
DBaaS
服务器资源池
存储资源池
中间件云
服务器资源池
存储资源池
安全云
.
.
.
.
.
服务级别和服务质量
服务策略和应对措施
云平台资源池
Application(SaaS)
业务级价值由每个部门独立建设
由中心系统统一提供Platform
(PaaS)服务级和系统级价值
Infrastructure
(IaaS) 硬件维护和管理级价值
PaaS云具备更强的业务级价值
– IaaS云具备硬件维护和管理级价值
部署PaaS云平台,是对企业业务价值和灵活性最好的平衡点
应用建设即需要关注平台软件能力,又需要关注应用逻辑,需要大量的集成和开发工作,完成企业应用所需的软件级服务和应用能力
灵活性较低,不能符合个性化需求
应用建设只需要关注应用逻辑,具备较好的应用灵活性和平台级软件管理和服务能力
PaaS层云实现的关键:软、硬件一体化资源池硬件虚拟化 + 软件弹性计算
• 基于硬件及软件池构建各个应用系统
• 整合的共享资源池
• 标准化的技术
• 快速提供能力
• 资源弹性能力
• 管理的自动化
• 管控的集中化
可以同时支持“大分小”和“小合大”的计算需求,所以虚拟化和集群技术
Oracle倡导PaaS云能力1:弹性动态资源池虚拟化技术 + 集群技术 = 真正的资源弹性能力
虚拟化技术实现大分小
动态集群技术实现小合大
Oracle 倡导PaaS云能力2:云管理和云治理可视化、集中化、端到端的云管理和云治理能力
Firewall
中间件云 数据库云
`
End Users
Order Entry
A/C Update
Login
`
`
云管理平台
硬件+软件管理 数据库+存储管理User Exp Monitoring SLM
• Transaction tracing and performance monitoring across all tiers
CMOSS2.0的关键目标:整合与共享
界面整合
• 系统操作使用人员通过统一界面导航访问和使用多个系统
• 门户技术、单点登录技术、4A技术等
服务集成
• Web Service技术、ESB技术、消息中间件技术等
• 各个系统通过统一的服务接口进行数据交换和能力共享(SDP)
数据整合 • 各个系统理解和共享统一的公共数据模型(ODM)
数据存储
业务逻辑
界面展现
业务系统A
数据存储
业务逻辑
界面展现
业务系统B
界面整合
服务集成
数据整合
由于移动业务的快速发展和变化要求,目前网管形成了多个烟囱式的IT系统,每个
系统拥有自己独立的数据模型、业务逻辑和展现界面。在系统建设初期这种独立建设的
模式最经济、效率最高,被普遍采用,当多套IT系统发展到一定规模,就需要进行横向
整合,从烟囱式到集群式转变,整合包括3个层面:
网络 服务器 存储/备份
操作系统 数据库 中间件
业务连续性
ITSM OSS应用
IaaS Cloud Computing
PaaS Cloud Computing
CMOSS 2.0的关键技术引入:云计算
IaaS:Infrastructure as a Service网络、存储、服务器虚拟化
PaaS:Platform as a Service优化的中间件、数据库等作为服务
SaaS:Software as a Service应用、流程、信息作为服务
Services
Services
Services
OneOSS2.0计划实施范围:
考虑到相关技术的成熟性,CMOSS2.0规划主要实施IaaS和Paas,形成虚拟化
的IT基础设施,动态整合的IT基础架构/共享的计算资源
• 资源容量可自动管理
• IT基础架构简化整合
• 高性能
• 资源利用率高
• 系统管理简便
• 节能环保
SaaS Cloud Computing
OneOSS3.0
Page 14
IT资源优化方法论,将实现IT资源优化的途径分为四个阶段,后一阶段以前一
阶段为基础,可以实现更大的灵活性,获得更高的业务价值
“云计算”与“整合与共享”相辅相成
•数据库整合
•SOA服务整合
PaaS Cloud Computing
•网络整合,安全域划分
•存储整合,集中备份
•服务器整合,虚拟化
IaaS Cloud Computing
灵活动态的响应能力
简化整合(Simplify)
虚拟化(Virtualize)
自动供应(Provision)
云计算(Cloud)
简化整合IT资源
系统软件标准化
操作系统及应用版本统一化
管理和监控系统软件标准化
垂直整合服务器分区功能的实现
水平整合服务器群集功能的运用
文件和数据块级别的存储虚拟化
服务器及存储资源的动态分配
容量及负载的自动化管理
资源按照管理员的定义进行自动分配
性能问题自动探测及隔离
资源按照业务优先策略进行自动分配
随需应变,按需分配
15
OSS系统数据处理问题
DB
应用
DB
应用
DB
应用
重复采集、跨系统数据同步和复制、跨系统数据访问、跨系统功能调用
系统1 系统2 系统3
跨域数据访问
界面、功能的调用
数据重叠和数据同步
数据重叠采集
数据问题:数据重复采集、采集点和处理过程不同带来的数据不一致和冲突、数据界限和定义不清晰和重叠,数据组织方式混乱、数据质量低
运营问题:带来规范化管理、共享、运行效率、重复的处理成本、难以适应综合应用等等一系列问题,需要首先进行数据层面的规范化和整合
OMC
•同一组数据由于在不同系统中模型定义不一致,需要进行映射来解决
数据统一和标准化问题 数据的开放共享问题 数据采集的问题
•对系统产生的数据进行进一步加工处理,发现系统的数据存储和组织方式完全封闭,根本无法获取和使用
•不同的系统由于数据边界划分不清晰,造成数据的生产和消费脱节,每个系统按照各自理解管理数据,形成重叠交叉
•系统数据质量不高,造成可信度下降,
•数据生产者和消费者分工和边界不清
•不同的系统对相同的原始数据进行采集,造成网元处理压力大
•使用采集数据过程中,发现数据不完整、不及时,却很难及时自动处理
•不同系统采集时间不一致,数据相互矛盾,但数据的产生处理过程无法踪
问题描述
数据框架构成 ODM DB 数据总线 统一采集共享平台
数据整合与
共享
解决的问题
CMOSS2.0中对数据整合与共享问题的解决之道
任务调度
数据抽取主动检测
数据清洗
采集调度
数据采集 数据转换
触发消息接
收
数据解析
数据装载
数据转换
数据装载
数据补采 数据汇总
任务监控数据共享封
装
数据仓
库ODM-
DB
数据源
ESB
数据流
控制流
ODM DB实现数据标准化 资源主题域(ODM-R) 应用主题域(ODM-A)
公共资源域
业务域
参与者
网络资源域
物理资源
物理设备 硬件(架/框/板/槽/端口) 物理连接
逻辑资源
管线资源
网络/子网 网络节点 逻辑设备
设备接口(媒介接口/逻辑接口)
软件 操作系统
网络地址
传送实体
协议
端点逻辑通路(逻辑连接/路径)
内部组织 用户 客户 合作伙伴
事件域 统计域
性能数据
测试数据域
路测数据
业务拨测
呼叫记录域
配置域
局数据
网络参数
单据域
定单
安全域
无线链路测量
安全帐号口令
日志
信令合成CDR
原始话单
资源确认单
管控类业务单
工单任务单
告警事件
例行任务
质量数据管理事件
空间资源
行政区域 管理区域 站点 机房 标准地址
面向资源业务(RFS)
RFS规格 RFS等级 RFS-网络资源关联
面向客户业务(CFS)
CFS规格 CFS等级 CFS-RFS关联
知识域
绩效考核 运维流程 运维知识
许可证
容量数据
通过数据总线逐渐搭建统一共享数据库
• 搭建数据总线平台,提供部分数据共享和服务共享能力
一阶段
• 优化数据总线平台,支撑综合类系统的数据共享需求
• 建立完善的OSS数据共享平台
1. 面向专业网管和统一采集平台,提供简单的数据共享能力
1. 满足综合类系统的数据共享需求,支撑综合类业务应用
1. 支撑整个OSS系统的数
据共享,提升综合业务应用快速支撑能力
二阶段(2011-2012年) 三阶段(2013年)
1. 面向专业网管和统一采集平台间数据共享需求,分析系统间交互时所需共享数据,统一和明确共享数据模型及共享方式;
2. 构建数据总线平台,建立共享数据库,支撑专业网管和统一采集平台间的数据共享需求
1. 梳理和分析综合类系统和其它系统间数据共享需求、共享模型和共享方式
2. 通过数据总线支撑综合类系统的数据共享需求,不断完善共享数据模型库,实现10种数据共享方式
1. 梳理和分析新增系统数据共享需求,继续完善数据总线功能和支撑整个OSS数据共享的能力
业务能力
阶段目标
实施步骤
统一采集平台实现底层数据采集的统一
• 南向接口适配:实现与底层网管的接口协议
适配,解析并识别底层网管以私有信息模型
描述的接口数据
• 数据转换和处理:根据处理规则将采集到的
底层数据转换成以相应的信息模型的数据,
并进行原子处理(即不借助外部资源数据的
处理,不发生时间、空间粒度变化的处理),
以便于上层应用识别和利用
• 北向接口适配:实现对上层的统一采集数据
服务,接收上层应用的数据采集请求,并将
采集到的数据分发给上层应用,该接口有实
时接口和非实时接口
• 采集调度管理:采集调度主要是完成对各种
采集的统一调度管理,采集调度对所有主动
式的采集任务进行控制
• 采集数据管理:主要是管理采集来的原始数
据和转化后的数据
• 数据存储:根据需要暂存采集到的原始数据
及经过原子处理的数据,支持数据库存储和
文件存储模式
• 与ESB集成:利用ESB的能力提供采集事件
消息的订阅/分发
统一采集平台关键技术能力说明
`
南向接口适配(SBI)
OMC/EMS 其他数据源信令监测采集设备 自动拨测设备
数据库存储
数据转换和处理
CORBA / Q3 / SNMP / ASCII / TL1 / 其他私有协议
北向接口适配(NBI)
采集调度管理
采集数据服务接口(包括实时数据服务和非实时数据服务
采集适配代理
统一采集平台
CSV/XML文件存储
数据存储
应用层
网络监控平台 质量保障平台 业务开通平台
ODM XML
ODM XML
前端采集层
采集数据管理
CMOSS2.0 数据架构关键—集中共享的数据库云平台
资源域 业务域 事件域 呼叫记录域
投诉处理
本地数据
综合监控 综合资源
本地数据
共享数据(ODM)
本地数据
网络分析
集中维护
本地数据
用户开户及订单处理
SDP
JDBC/ODBCAdapter Adapter Adapter JDBC/ODBC统一采集平台
数据库云平台
网络分析、信令营销
OSS发展趋势
大量网络数据的深入挖掘和使用
综合型网管应用建设
面向市场和前台的支持
数据集中和共享
理想的网管数据平台
海量数据、高并行支持
数据共享、混合型资源要求
高并发、高可用性、高实时性要求
高可靠、高扩展、低能耗云平台
通过数据库云来构建理想的网管数据平台
统
分
符合云计算特征的理想化支撑平台
普适性:Shared Disk和Shared Nothing 并重
虚拟化、资源池
SLA、资源动态供给
海量数据处理、高并行
高实时性、高并发
高扩展、高可靠
网络投诉、网络激活、服务开通、客户感知
综合网管
统一采集、数据总线
提纲
• 云计算与移动网管支撑系统发展趋势
• Oracle数据库云平台
• 端到端云管理和云治理
• 电信行业案例和总结
关系型数据库架构:Shared Nothing 和Shared Disk
Shared Disk和Shared Nothing是两种主要的数据库集群技术,各自都有自身特点
Shared Disk把数据传输到应用代码端 Shared Nothing把应用代码移到数据端运行
当应用代码量很大(高并发)、相关数据量比
较小时,Shared Disk更加适合这种典型的OLTP
应用;
主要特点:高并发、高可用性(由于数据共享
,当节点故障可以透明切换到其他数据库节点
运行作业)
当相关数据量很大(高并行)、而应用代码并
发量很小时,Shared Nothing更加适合这种典型
的OLAP应用;
主要特点:大数据量处理高并行、低并发、低可用性(由于数据非共享,当节点故障,其他节点要接管故障节点数据)
Oracle数据库云平台:服务器资源池和存储资源池
Exadata Cell
InfiniBand 交换网络
数据库服务池A 数据库服务池B
Exadata Cell Exadata Cell
智能存储层(Shared Nothing)
存储资源池
数据库处理层(Shared Disk)
数据库资源池
超高速并发网络层880Gb/s/机架
…….
Exadata提供一种混合式的数据库架构,能够有效解决两者的冲突,吸取两种架构长处; 既可以满足OLTP的高并发、高可用特点;又可以满足OLAP的大数据量处理要求;
高扩展高可靠OLTP海量数据处理SLA资源虚拟化架构优势
具备良好的普适性架构:Shared
Nothing and Shared Disk
Exadata全新的技术架构– Shared Nothing与Shared Disk的结合
• Exadata 智能存储服务器(Shared Nothing Architecture)- 在存储部件中实现数据密集型处理
- 进行表及索引扫描,过滤查询无关数据
• 数据库服务器承担计算密集型处理(Shared Disk Architecture)
- 求和, 统计, 数据转换, 等.
数据密集型处理智能存储池
计算密集型处理数据库服务池
Infiniband高速互联的数
据交换
全双工系统架构,完全消除单点故障
高扩展高可靠OLTP海量数据处理SLA资源虚拟化架构优势
静态的应用运行基础设施
100%
0%50
%
15% Utilized Servers
100%
0%50
%
10% Utilized Servers
100%
0%50
%
20% Utilized Servers
Cluster 1 Cluster 2 Cluster 3
55% Utilized Servers75% Utilized Servers100% Utilized Servers
Data Warehouse Data Mart Data Mining
高扩展高可靠OLTP海量数据处理SLA架构优势 资源虚拟化
Exadata数据库虚拟化—数据库动态资源池
Cluster 1 Cluster 2 Cluster 3
ESOP Data Mart
100%
0%50
%
55%* Utilized Servers
One Resource Pool
VGOP Data Warehouse
Data Mining
高扩展高可靠OLTP海量数据处理SLA架构优势 资源虚拟化
Exadata虚拟化和资源共享模式
Data Warehouse Data Mart/VGOP ESOP/Data Mining Free
Data Warehouse
Data Mart/VGOP
ESOP/Data Mining
Free
RAC One Node D
cpu_count=1
RAC One Node C
cpu_count=1
RAC One Node Bcpu_count=2
RAC One Node Acpu_count=4
8 core server
高扩展高可靠OLTP海量数据处理SLA架构优势 资源虚拟化
数据库虚拟资源池,更好支持数据库的集中与整合
• 许多不同的数据库可运行于同一数据库机器上
• DB服务器共享配置方式
• 应用以SERVICE服务的方式连接并运行于一个或多个动态的数据库节点上
• Services可以动态 Grow, Shrink, & Move
• 大型数据库可通过RAC技术跨越多个物理节点
• 多个小型数据库可以共享运行于同一个物理节点
• 共享环境下的可预测性能
• 但多个数据库运行于同一节点上时,Instance
Caging实例绑定技术提供可预知的CPU cores资源
• 可限制数据库运行于特定的处理器的子集上
Data
Mining VGOP
Data Warehouse
Data
Mart
ESOP
高扩展高可靠OLTP海量数据处理SLA架构优势 资源虚拟化
Oracle Confidential
Oracle数据库云的服务器资源池Database Server Pools
数据库云平台
综合告警 Service
综合资源Service
OSS 服务器池
CRM Service
BSS 服务器资源池 MSS 服务器池 空闲资源池
Database A Database B
ERP Service
• 通过业务策略动态管理数据库服务资源
• 可以通过制定最大资源、最小资源、重要程度策略等,动态管理服务可用性和服务质量
• 统一管理跨大规模、多主机的复杂数据库环境,易于实现“大分小”和“下合大”两种资源管理需求
HR ServiceCall Center Service 帐务Service
高扩展高可靠OLTP海量数据处理SLA架构优势 资源虚拟化
在数据库资源池内,进行自动化按需能力供应
部门应用程序1
部门应用程序2
共享服务
共享服务
Oracle
Enterprise
Manager
共享服务
部门应用程序 1
感知需求高峰
Oracle Exadata数据库虚拟服务池
数据库服务节点
感知需求高峰
调整容量
调整容量
高扩展高可靠OLTP海量数据处理SLA架构优势 资源虚拟化
存储虚拟化资源池:为 Oracle 数据库提供灵活可伸缩的存储
• 磁盘为数据库专用
• 无法共享容量
• 有些磁盘超过极限,有些还有剩余容量
• 存储成为瓶颈
• 存储在所有数据库间协调分配
• 共享存储容量
• 负载较重的数据库从所有磁盘借用存储容量
• 存储不再是瓶颈
虚拟化之前 虚拟化之后
DB1 DB2 DB4 DB5DB3
磁盘 1 磁盘 2 磁盘 3 磁盘 4 磁盘 5
DB1 DB2 DB4 DB5DB3
磁盘 1 磁盘 2 磁盘 3 磁盘 4 磁盘 5
高扩展高可靠OLTP海量数据处理SLA架构优势 资源虚拟化
Exadata数据库云服务质量管理Quality of Service Management
Recommendation: NA Performance Class has CPU Bottleneck.
Action: Move Server from Server Pool Back Office to Sales.
Sales Pool
Sales ClientsBack Office
Clients
Resource (CPU)
EMEANA
APAC
Response Time Objectives
Most Critical Least Critical
Back Office Pool
Recommendation: EMEA Performance Class has CPU Bottleneck.
Action: Promote EMEA Performance Class from Level 2 to Level 0.Recommendation: All Performance Objects being met.
Action: No action required.
高扩展高可靠OLTP海量数据处理架构优势 资源虚拟化 SLA
通过QoS监控和保护系统资源- Health Monitor 保护系统服务资源
Sales Pool
Sales ClientsBack Office
Clients
Most Critical Least Critical
Back Office Pool
!
Alert: Memory Pressure detected – Server at Risk.
Action: No new sessions accepted.
Memory
Physical
高扩展高可靠OLTP海量数据处理架构优势 资源虚拟化 SLA
OLTP
More resources
DSS
user
OLTP
user
Database resource manager
DSS Less resources Oracle
Database
动态按服务级别的资源分配
- 管理混合事务的资源负载
- 控制系统性能
高扩展高可靠OLTP海量数据处理架构优势 资源虚拟化 SLA
Exadata I/O Resource Management管理混合型数据库 – 库间、库内共享管理
• 确保共享的不同数据库被分配正确的I/O
资源
• Database A: 33% I/O资源
• Database B: 67% I/O资源
• 确保库间、库内的不同用户和任务被分配正确的I/O资源
• Database A:
• 报表: 60% of I/O资源
• ETL: 40% of I/O资源
• Database B:
• 交互作业: 30% of I/O资源
• 批处理: 70% of I/O资源
Exadata Cell
InfiniBand Switch/Network
Database A Database B
Exadata Cell Exadata Cell
高扩展高可靠OLTP海量数据处理架构优势 资源虚拟化 SLA
传统数据库扫描处理技术
•基于传统存储技术,全部的
数据库智能存在于数据库主
机。
•来源于存储的数据大部分被
数据库主机所丢弃。
•大量的废弃数据占用了宝贵
的数据库主机资源(IO、内
存和CPU),严重影响其它
任务执行,处理缓慢。
I/Os 执行:
返回 1 TB 数据
DB主机筛选1 TB数据,得到1000行客户要求的数据,计算并返回给客户端
返回数据行
SELECT
customer_name
FROM calls WHERE
amount > 200;
DB主机确定表的存储分区
发起I/Os请求
高扩展高可靠OLTPSLA资源虚拟化架构优势 海量数据处理
Oracle 数据库网格
Smart Scan 处理技术--Exadata为什么快10-100x倍?
问题:昨天的销售业绩如何?
Exadata 智能存储层
SUM
Select
sum(sales)
where
Date=’24-
Sept’ …
Smart Scan
在TB 级数据
中扫描匹配请求的数据
构建并发Smart Scan请求
仅仅返回满足条件的数据 智能扫描SmartScan
ROW使用“where‖谓词筛选行COLUMN列筛选JOIN联接筛选增量备份筛选
高扩展高可靠OLTPSLA资源虚拟化架构优势 海量数据处理
压缩的行 混合列
Row 1
Symbol Table
Row 2
Row 3
Database Block
•很好的随机行访问特性•OK 表访问•2x - 5x 压缩
Colum
n 1
Colum
n 2
Colum
n 3
列数据库
•很差的随机行访问特性•非常好的 Table Scan
•5x - 40x 压缩
Compression Unit 1
Colum
n 1
Colum
n 2
Colum
n 3
Compression Unit 2
C1
C2
C3
•很好的随机行访问特性•非常好的 Table Scan
•5x - 40x 压缩
行压缩 vs 列数据库 vs 混合列
11gR2
高扩展高可靠OLTPSLA资源虚拟化架构优势 海量数据处理
传送更少的数据- Exadata Storage Index消除不必要磁盘 I/O
• Exadata Storage Indexes 在内存中维护表数据的汇总信息
- 存储字段的MIN和 MAX值
- 每1M数据建一条索引项
• 如果最大和最小值不匹配查询的where子句,则取消磁盘I/O
• 完全自动和透明地维护
A B C D
1
3
5
5
8
3
Min B = 1
Max B =5
Table Index
Min B = 3
Max B =8
Select * from Table where B<2 - Only first set of rows can match
11gR2
高扩展高可靠OLTPSLA资源虚拟化架构优势 海量数据处理
对大型扫描的优化
1 TB
(压缩)10 TB 的用户数据需要10 TB 的IO
100 GB
(分区修剪)
20 GB
(存储索引)5 GB
(智能扫描)
在Database Machine
上实现亚秒级
数据减少10 倍,扫描加快2000 倍
高扩展高可靠OLTPSLA资源虚拟化架构优势 海量数据处理
Exadata Flash闪存解决磁盘随机I/O瓶颈
• 磁盘可存储大量数据
• 但每秒的随机I/O <200- 300 I/Os (8K块)
• Flash闪存技术可存储少量数据(但远大于DRAM)
• 但却能提供每秒几万级的I/O
• 数据库一体机提供总计 5.4 TB 的闪存• 每智能存储服务器配置4块高速闪存卡
• 采用flash cards,而非闪存Disk避免控制器瓶颈
• Smart Flash Cache缓存热数据,但• 不是采用简单的LRU算法,库逻辑感知
• 基于数据库数据使用逻辑,知道那些数据应该缓存,那些不应该缓存
• 允许基于应用表进行指定优化,如提示高优先级驻留于缓存
Oracle is the First Flash Optimized
Database
随机I/Os速度比1000块盘的企业级阵列(200K IOPS)快7倍
高扩展高可靠海量数据处理 OLTPSLA资源虚拟化架构优势
全双工设计避免数据库、网络、磁盘或Cell的单点故障
ASM镜像用于保护磁盘故障,可支持热插拔
ASM failure groups 用于保护存储Cell故障
双路网络交换
RAC TAF用于保护数据库服务器故障,做到应用零中断
双路电源模块
Exadata Cell Exadata Cell
Hot Hot Hot Hot Hot Hot
Cold Cold Cold Cold Cold Cold
ASM
Disk Group
ASM
Failure Group
ASM
Failure Group
OLTP 高扩展海量数据处理 高可靠
全双工系统架构,完全消除单点故障
InfiniBand 交换网络(双路)
RAC TAF
SLA资源虚拟化架构优势
Exadata完美的扩展能力—Scale Up and Scale Out
• Total Compute Cores 1408 20 IBM Power 595s
• TB of Disk 2640 13 Rack EMC Symmetrix
• InfiniBand Ports 864 4300 FC Ports
8 Rack Exadata Comparable To
水平扩展垂直扩展
• 可抵御任何单元的故障
• 跨存储单元的数据镜像
OLTP 高可靠海量数据处理 高扩展SLA资源虚拟化架构优势
Oracle+SUN Engineered :#1 in OLTP TPC-C
World Record: 30,249,688 tpmC:
“数据库为体,硬件技术为用”“体现为系统架构优势‖
Sun SPARC TPC-C性能纪录: 比IBM最好纪录快3倍,比HP快7.4倍
为什么快?Exadata革命性的设计---Before/After
InfiniBand请求
DB Servers
Exadata Storage
46
Exadata
高性能理由②“综合列压缩(EHCC)”:技术获得10x-50x 超高压缩比,并提高磁盘I/O效率
高性能理由③―Smart Flash Cache”:高达5.3TB 的 Flash Cache,随机I/O性能高达1M IOPS
高性能理由①“Smart Scan”:计算负载部分卸载至并行智能存储层,并只传输经筛选的有用数据
高性能理由④“Infiniband ”: 提供40Gb/s 端口带宽,聚合带宽高达880Gb/s , 端口延时(0.1um )小于以太网的1/1000
Smart Scan、EHCC、Smart Flash Cache等是Oracle Exadata 独有的关键性能突破技术
提纲
• 云计算与移动网管支撑系统发展趋势
• Oracle数据库云计算平台
• 端到端云管理和云治理
• 电信行业案例和总结
端到端集中可视化的云环境管理和监控Manage performance and change across all tiers
Firewall
Exalogic Elastic Cloud Exadata
`
End Users
Order Entry
A/C Update
Login
`
`
Oracle Enterprise Manager
Exalogic/MW Mgmt Exadata/DB MgmtUser Exp Monitoring SLM
• Transaction tracing and performance monitoring across all tiers
平台即服务PaaS
基础设施及服务IaaS
Oracle VM for x86
Operating Systems: Oracle Enterprise Linux
云管理
配置管理
生命周期管理
应用性能管理
服务器量管理QoS
数据库云
应用服务云
共享服务接口
集成:
SOA Suite
安全:
Identity Mgmt
流程管理:
BPM Suite
用户交互:
WebCenter
Oracle Enterprise LinuxOracle Solaris
Oracle VM for SPARC (LDom)Solaris Containers
Servers
Storage物理及虚拟系统管理
SaaS
Oracle 融合应用云应用商店
ISV
应用
Oracle端对端的云平台解决方案强调云管理和云治理
Copyright © 2010, Oracle Corporation and/or its affiliates – 49 –
资源计划
能力供应计划
Chargeback
自服务
通过Enterprise Manager进行云平台集中管理From Application Operations to Data Center Operations
Enterprise Manager Grid Control Enterprise Manager OpsCenter
Application
Operations
Data Center
Operations
Drill Between
Specific Views
Exadata数据库云平台
ILOMGC Agent
提纲
• 云计算与移动网管支撑系统发展趋势
• Oracle数据库云计算平台
• 端到端云管理和云治理
• 电信行业案例和总结
国内电信客户测试总结
CustomerProject Config poc results Competitor Timetable
AsiaInfo
BASS
system V1 10 times
P595(2x32CPU)+DB2
7 Days,
Sep 2009
陕西电信 账务V2,¼
Rack 20 Times N/A 7 Days
辽宁移动 BASS
V2, ¼
Rack 168 Times
SUN 25K*2,EMC Storage
Jul26-
Jul28,2010
黑龙江联通 BASS
V2, ½
Rack 62times N/A
Sep16-
Sep18,2010
浙江移动 BASS
V2, ¼
Rack 235 Times
2个IBM595(96
Core),EMC DMX-4
300
Sep8-
Sep15,2010
北京移动综合告警(DW)
V1, ¼
Rack 105 /352 times SUN M5000
Oct11-
18,2010
山西移动结算系统改造(DW)
V2,¼
Rack 5times
P570, IBM DS 8300-
1/12T Mar,2010
Customer Project Configuration
Data Compression
results
China Life EDW project V1 2.44times
平安银行 ODS project V2,¼ Rack 20times
SF-Express ODS/DW project V2,¼ Rack 10times
中远集运 集运运输(OLTP) V2,¼ Rack 10times
辽宁移动 BASS V2, ¼ Rack 10times
黑龙江联通 BASS V2, ½ Rack 10.07times
北京移动 综合告警(DW) V1, ¼ Rack 14times
数据压缩测试总结
HP Superdome
Server
Hitachi XP24000 Storage Array
Existing System 1/2 Database Machine
20X Average Performance Increase
LGR’s Test ResultsCall Data Records Warehouse
27B
rows
54B
rows
81B
rows
108B
rows
135B
rows
162B
rows
0
10
20
30
40
50
60
70
14 28 42 56 70 84Days of Data:
0
10
20
30
40
50
60
70
80
Elapsed Time Secs
Scan Rate(GB/Sec)
1TB user data
scanned in 3.5sec
Rate equal to 1PB
scanned in < 1h
LGR Extreme Performance TestElastic scalability with database machine
上海移动视频基地项目-- Exadata数据库云平台和Oracle BRM的结合
解决方案
手机视频指基于移动网络(GPRS、EDGE、TD等网络),通过手机终端,向
用户提供影视、娱乐、原创、体育、音乐等各类音视频内容直播、点播、下载服务的业务。
应用:Billing Revenue Management
配置:Sun Oracle Database Machine Half Rack
方案亮点: 数据库主机、存储、互联、软件等交付完整的系统架构 极限性能, 高可靠性 虚拟化、整合技术,SaaS平台,未来技术方向 冗余, 线性扩展 降低TCO成本
网格技术
虚拟化技术
极限性能处理技术
统一管理
综合告警
类别 系统名称
专业网管类 话务网管(亿阳)、数据网管(亿阳)、传输网管(亿阳)、综合告警(亿阳)、综合监控(亿阳)、信令检测CS/PS(中创)
信息管理类 地理信息系统(亿阳)、信息发布平台、集中运维平台(泰岳)、EMOS(泰岳)
综合类 综合分析系统(诺西)
北京移动OSS系统整合
• 专业网管无法面向全业务形成关联的业务监控视图,无法形成端到端的业务质量分析。
• 独立的系统和分散的数据,无法实现数据的共享,充分发挥数据的价值。
- 专业网管数据开放性不足,数据组织方式不同,造成数据的共享使用困难。
- 来自信令监测、业务拨测、EOMS 、BOSS 等系统的数据无法进行综合利用。
- 多系统数据存在冗余,给使用和维护都带来额外的工作量。
• 功能相似、风格不同的各专业网管系统无法适应集中管理的要求。
集中运行维护平台
话务网管
信息发布平台综合分析
EMOS
北京移动建设方案—Exadata数据库整合方案
专业网管
管理信息系统
信令监测
综合分析
DB
服务层
智能存储层
OSS数据库整合架构初期构建及最终目标
专业网管
综合分析
信令监测
管理信息系统
通过多节点集群技术,将OSS应用按类型和资源消耗分别部署在2~4节点上通过存储水平共享模式使各应用共享总存储容量,充分利用Exadata智能存储资源通过Exadata I/O resource manager管理所有存储资源,实现I/O和容量的分配和共享
分析类
交易类
其它
分析类
其它
交易类
本期目标 最终目标
北京移动Exadata性能对比分析
测试项目 现网设备测试设
备
现网数据容量(MB)
exadata查询压缩容量
exadata归档压缩容量
压缩比
现网测试时间(S)
exadata查询压缩测试时间(S)
exadata归档压缩测试时间(S)
性能比 性价比
测试用例一话务网管系统
小时级网优邻区性能数据汇总
SUN E4900Exadata 43156 1862 1507 23.18 150 7.97 12.65 18.82 4.39
测试用例二综合告警
月统计网元告警符合派单条件的派单量:
PRO_CORE_NETWORK_REPORT
SUN M5000 Exadata 1975 237 173 8.33 5040 40 80 126.00 25.20
综合告警系统,月统计网元告警符合派单条件
的派单量:PRO_WIRELESS_REPORT
SUN M5000 Exadata 18082 1796 1269 10.07 2880 8.17 28 352.51 70.50
北京移动将测试数据在现网与exadata上进行了测试对比,选取了话务网管、综合告警两个测试用例进行测试。测试结果如下:
数据压缩比最高23.18、最小8.33
性能提升比最高352.51、最小18.82
性价比最高70.50、最小4.39
*现网及测试设备中的价格为当前折算价格**压缩比:现网数据量/exadata查询压缩容量***性能比:现网测试时间/exadata归档压缩测试时间****性价比:性能比/(测试设备价格/现网设备价格)
广东移动网管测试性能
测试用例 生产运行时间 Exadata串行
E25K串行
与生产环境性能提升
与空载环境性能提升
告警SQL1 50小时 0:01:47 7:21:00 1682倍 238倍
告警SQL2 3小时13分钟 0:01:31 2:52:00 127倍 122倍
告警SQL3 29分钟 0:00:02 0:13:14 870倍 492倍
告警SQL4 17分钟 0:00:01 0:12:31 1020倍 931倍
告警SQL5 运行了5小时23分钟后报错 0:01:08 4:45:00 无穷倍(至少285倍)
312倍
性能SQL1 8分钟(每个进行平均时间),47分钟(6个并发进程总时间)
00:00:11 44倍
性能SQL2 6750秒 0:00:01 6750倍
性能SQL3 约12小时 0:00:12 3600倍
性能SQL1-
2
一个网元大约需3分钟,一个时间点有693个网元,所有网元串行计算完大约需要2000分钟.
0:01:16 40倍
结论:基于现网生产环境实际数据,测试数据库云平台的多类应用(OLTP+OLAP),对比生产环境性能提升从44倍到6750倍;对比空载生产环境性能提升从122倍到931倍。
广东移动网管测试:扩展性测试对比
测试用例 1/4配执行时间 1/2配执行时间
告警SQL5(CPU高负载SQL,SQL达34K) 0:01:08 0:00:31
60秒
1/4配Exadata存储节点CPU负载
告警SQL5(有340多行Where条件,存储服务器CPU负荷占用较高),扩展到1/2配Exadata,存储CPU峰值处理时间从60秒线性减少到30秒
30秒
1/2配Exadata存储节点CPU负载
Exadata所有存储节点CPU负载非常均匀,说明没有热点数据,数据被均匀分散到各个存储节点
告警SQL5
执行时间
告警SQL5
执行时间
广东移动性能提高分析总结
数据库时间
数据库等待时间
网络等待时间
数据库CPU时间
IO等待时间
Exadata 软件减少了循环执行次数,(SmartScan、存储索引、混合列压缩)带来数据规模减少,同时减少了循环执行次数
Exadata 硬件加快IO处理、网络处理和CPU处理
¼ Exadata 提供比生产系统高8
倍的IOPS和11倍的IO吞吐
¼ Exadata IB网络提供比生产高10
倍的吞吐和1/7的处理延时
¼ Exadata CPU处理能力是生产系统的2倍
数据库云平台与传统集群小型机计算环境比较
1台满配数据库云平台 3台集采高端满配服务器集群+5台集采高端存储阵列
结论:1台满配数据库云平台的处理能力=3台集采高端满配服务器+5台集采高端存储阵列,而功耗和占用机房空间分别仅是后者的1/6和1/7。
SPEC_CINT
2006 RatesIOPS MBPS 功耗 体积
1台满配数据库云平台 5,873 1,500,000 75,000 9.8kW 1 Rack
3台集采高端满配服务器集群合计 6,048 19.2kW(单台
6.4KW)2-3 Racks
5台集采高端存储阵列合计 900,000 36,23539kW(单台
7.8KW)5 Racks
传统手段 发展趋势
数据库最新技术发展方向Exadata集众多优势技术于一身
- Shared Nothing或Shared Disk架构 - Shared Nothing与Shared Disk混合架构VS
- 纵向构建独立数据库单元 - 数据库虚拟化、资源池VS
- 按照均衡化配置手工配置 - 一体机、零配置、高扩展能力、快速部署VS
- 主机和存储交换机互联 - 通过Infiniband高速主机和存储互联VS
- 传统磁盘IO - Smart Scan IO+Flash闪存IO,提升IO性能VS
- 行压缩或列压缩 - 混合压缩VS
Exadata 云平台价值总结
超级性能 节能减排
一体化云计算
规划视角
零配置、开箱即用、构件式部署
低能耗、绿色计算:一台满配Exadata (包含服务器、网络、存储)总能耗平均仅为9.8KW,相
当于传统服务器+存储+网络能耗的1/3,但计算能力和占地空间却相当于传统服务器+存储+
网络的2-8倍。
Infiniband网络
最佳数据仓库性能设计
智能存储技术
最佳OLTP性能设计
新一代绿色云计算平台(PAAS)
内置5.4TB闪存
10-50倍数据压缩算法
全双工设计、完全避免单点故障
在线热插拔部件
线性系统扩展
虚拟化资源池动态按需资源供应
集中管理