并行数据仓库解决方案 -...

4
04 推动实现无与伦比的用户体验 与行业领先的 BI 和 ETL 工具实现集成 应用功能完备的数据仓库解决方案 企业级数据仓库的优势 功能最为完备的解决方案 并行数据仓库解决方案 享用功能最为完备的数据仓库解决方案所带来的优势,该解决方案中 包括 Microsoft BI 工具及其相关工具,例如 Master Data Services 和 StreamInsight。 通过使用 PowerPivot for Excel,让所有人都能执行已同“并 行数据仓库”实现完整集成的 BI 任务。 通 过 与 诸 如 PowerPivot、SQL Server Analysis Services、 Reporting Services 以及 SSIS 这样的 Microsoft BI 工具进行 集成,来为 BI 应用程序的出现和存在提供便利条件。 通过使用 Report Builder 3.0 这一全面集成“并行数据仓库” 的报表生成器,就可以创建功能强大、专业的报表。 与微软的多种商业智能(BI)工具实现紧密集成,例如 SSIS、 Analysis Services 以及 Reporting Services。 充 分 利 用 并 行 数 据 仓 库 同 其 他 BI 以 及 ETL( 例 如, Informatica、SAP Business Objects、Microstrategy SAS)工具之间的交互性。 仅凭同一种技术,即可满足桌面笔记、数据集市以及企业数据 仓库的全部要求。 获 取 一 套 辅 助 工 具 集, 其 中 包 括 SSIS( 用 于 实 现 ETL)、 Analysis Services、Reporting Services、Master Data Services 以及 StreamInsight。 通过采用中心辐射型体系结构,来将 MPP 与对称多处理(SMP) 数据仓库进行集成。 使用“并行数据仓库”作为一种高性能、面向主题的数据集市。 充分利用“并行数据仓库”同其他 BI 工具以及 ETL 工具(例 如,Informatica、SAP Business Objects、Microstrategy 和 SAS)之间的交互性。 面对快速增长的数据量,企业需要具备切合实际、及时的业务洞察力。 通过使用 SQL Server 中的并行数据仓库及其大规模并行处理(MPP) 体系结构,就可以获得可伸缩的性能、灵活性以及硬件选择余地,同时, 享用现今功能最为全面的数据仓库解决方案。 对于那些需要更快处理性能、更大数据容量的数据仓库实施方案而言, 可以部署并行数据仓库。 充分利用企业级的规模优势 将现有数据仓库的规模从数十 TB 扩大到数百 TB。 利用多种集成产品,更快速地构建数据仓库。 通过使用已预先针对数据仓库技术而得到优化的硬件设备,来 实现对平衡硬件的安全投资。 随着数据量的增长,向现有设备添加更多容量——无需采用“叉 车式升级”。 通过使用高性能数据加载,来实现可预期的性能,并同时减少 加载时间和系统停机时间。 通过使用 MPP 体系结构、需要单独购买的优化器以及执行效 率更高的 Data Movement Services,更迅速地处理更多数据。

Upload: others

Post on 06-Mar-2020

17 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 并行数据仓库解决方案 - download.microsoft.comdownload.microsoft.com/documents/china/sql/201210/Big-Data-and-PDW... · 通过 Hadoop 扩展数据仓库: 两个用于连接

04

推动实现无与伦比的用户体验

与行业领先的 BI 和 ETL 工具实现集成

应用功能完备的数据仓库解决方案企业级数据仓库的优势

功能最为完备的解决方案

并行数据仓库解决方案

享用功能最为完备的数据仓库解决方案所带来的优势,该解决方案中

包括 Microsoft BI 工具及其相关工具,例如 Master Data Services

和 StreamInsight。

通过使用 PowerPivot for Excel,让所有人都能执行已同“并

行数据仓库”实现完整集成的 BI 任务。

通 过 与 诸 如 PowerPivot、SQL Server Analysis Services、

Reporting Services 以及 SSIS 这样的 Microsoft BI 工具进行

集成,来为 BI 应用程序的出现和存在提供便利条件。

通过使用 Report Builder 3.0 这一全面集成“并行数据仓库”

的报表生成器,就可以创建功能强大、专业的报表。

与微软的多种商业智能(BI)工具实现紧密集成,例如 SSIS、

Analysis Services 以及 Reporting Services。

充 分 利 用 并 行 数 据 仓 库 同 其 他 BI 以 及 ETL( 例 如,

Informatica、SAP Business Objects、Microstrategy 和

SAS)工具之间的交互性。

仅凭同一种技术,即可满足桌面笔记、数据集市以及企业数据

仓库的全部要求。

获 取 一 套 辅 助 工 具 集, 其 中 包 括 SSIS( 用 于 实 现 ETL)、

Analysis Services、Reporting Services、Master Data

Services 以及 StreamInsight。

通过采用中心辐射型体系结构,来将 MPP 与对称多处理(SMP)

数据仓库进行集成。

使用“并行数据仓库”作为一种高性能、面向主题的数据集市。

充分利用“并行数据仓库”同其他 BI 工具以及 ETL 工具(例

如,Informatica、SAP Business Objects、Microstrategy 和

SAS)之间的交互性。

面对快速增长的数据量,企业需要具备切合实际、及时的业务洞察力。

通过使用 SQL Server 中的并行数据仓库及其大规模并行处理(MPP)

体系结构,就可以获得可伸缩的性能、灵活性以及硬件选择余地,同时,

享用现今功能最为全面的数据仓库解决方案。

对于那些需要更快处理性能、更大数据容量的数据仓库实施方案而言,

可以部署并行数据仓库。

充分利用企业级的规模优势

将现有数据仓库的规模从数十 TB 扩大到数百 TB。

利用多种集成产品,更快速地构建数据仓库。

通过使用已预先针对数据仓库技术而得到优化的硬件设备,来

实现对平衡硬件的安全投资。

随着数据量的增长,向现有设备添加更多容量——无需采用“叉

车式升级”。

通过使用高性能数据加载,来实现可预期的性能,并同时减少

加载时间和系统停机时间。

通过使用 MPP 体系结构、需要单独购买的优化器以及执行效

率更高的 Data Movement Services,更迅速地处理更多数据。

Page 2: 并行数据仓库解决方案 - download.microsoft.comdownload.microsoft.com/documents/china/sql/201210/Big-Data-and-PDW... · 通过 Hadoop 扩展数据仓库: 两个用于连接

01

灵活的数据管理层,可支持所有数据类型,包括结构化、半结

构化和非结构化的静态或动态数据。

强大的扩充层,用于发现、转换、共享和监管数据。

令人瞩目的 BI 工具套件,可帮助用户通过分析获得洞察力。

更深入的洞察力,将企业的数据和来自外部源的数据及服务相

结合。

喜忧参半的大数据

微软大数据解决方案

如今,企业正竭尽全力地从他们捕获的海量数据中获取业务洞察力。

这些数据包括大量非结构化数据,例如文件、图片、视频、博客、点

击流和地理空间数据等。对企业来说,主要的挑战是如何在无需设置

复杂的分布式存储和计算集群的条件下,同时有效地处理结构化和非

结构化数据。

企业正在寻求一种可以将内部和外部的数据及服务结合起来的有效方

法。他们希望从 Twitter、Facebook 和 LinkedIn 等社交媒体网站中

挖掘数据 ;同时还希望根据这些捕获的数据做出更加及时有效的决定。

为实现此目的,企业需要实时分析其数据,而非简单地依赖于批量处理。

新出现的一些技术(例如 Apache Hadoop)使客户无需付出高昂费

用即可存储和分析海量的非结构化数据。此外,新出现的云计算和协

议标准(例如开放数据协议 (OData))可让企业比以往任何时候都更

加轻松地共享与合并数据。如今,许多供应商都提供了 Hadoop 部署,

但其中大部分都是在位于中央 IT 范围之外的孤立存储区运营的,尚不

适用于企业级应用。

微软早在大数据流行之前就开始对之加以利用了。例如 Microsoft

Bing 会分析超过 100 PB 的数据以提供高品质的搜索结果。企业可以

利用微软大数据解决方案从自己的结构化和非结构化数据中施展业务

洞察力。微软大数据解决方案可让任何人通过 Office 和 SharePoint

等熟悉的工具从他们所有的数据中施展可执行的洞察力 ;还能通过连

接到公用的全球数据和服务,让客户发现新价值。

微软的愿景是让所有用户都能从几乎任何数据中获得业务洞察力,包

括以前隐藏在非结构化数据中的洞察力。为实现此愿景,微软制定了

全面的大数据策略以解决以下关键的客户要求 :

微软大数据解决方案

数据爆炸导致洞察力下降 : 企业需要借助适当的工具来了

解由降低的硬件成本和复杂的数据源带来的海量数据,清

晰洞察数据背后的本质。

结构与非结构化数据混杂 : 企业需要同时分析关系型和非

关系型数据。捕获的数据中 85% 以上都是非结构化数据。

数 据 实 时 分 析 存 在 瓶 颈 : 新 的 数 据 源( 例 如 Twitter、

Facebook 和 LinkedIn 之类的社交媒体网站)会实时生成

海量数据,而这些数据无法通过简单的批量处理进行有效

地分析。

实现简化部署和管理 : 企业需要更加简单顺畅的部署和设

置体验。理想情况下,他们希望使用包含 Hadoop 相关项

目的少量安装文件,而不是自己从项目中进行选择。

主要挑战

Page 3: 并行数据仓库解决方案 - download.microsoft.comdownload.microsoft.com/documents/china/sql/201210/Big-Data-and-PDW... · 通过 Hadoop 扩展数据仓库: 两个用于连接

02

为 帮 助 企 业 快 速 采 用 其 大 数 据 解 决 方 案, 微 软 将 在 Microsoft

Windows Azure 平台上提供基于云端的 Hadoop 服务,同时在

Windows Server 上提供基于本地的 Hadoop 版本。

微软新的 Hadoop 版本使得客户可以从几乎任何规模的结构化和非结

构化数据中获得业务洞察力并应用新型数据,而无需考虑其具体位置。

Hadoop 的丰富洞察可以与 BI 平台无缝结合,使客户能够借助熟悉的

工具(例如 Office 和 SharePoint 等)以及公用的数据和服务来丰富

他们的模型。

微软大数据解决方案还通过简单的部署以及与 Active Directory 和

System Center 等组件的集成,为 Hadoop 提供了 Windows 的易

用性和可管理性。凭借 Windows Azure 上基于 Hadoop 的服务,微

软为其大数据解决方案在云端提供了灵活性。

方案的主要优势与价值

随时随地获得深入的洞察力微软大数据解决方案可让客户用熟悉的 BI 工具从他们的结构化和非结

构化数据中获得可执行的洞察力。值得一提的是,微软的解决方案可

让客户 :

与全世界的数据连接微软大数据解决方案将数据和模型与公用的数据和服务(包括

Twitter、Facebook 和 LinkedIn 等社交媒体网站)相结合,从而

能 够 实 现 突 破 性 的 发 现。 这 使 得 客 户 能 够 使 用 Windows Azure

Marketplace 上的应用程序和挖掘算法来发现隐藏的模式。

使用熟悉的 Office 和 BI 工具从任何数据中随时随地获得深入

的洞察力。

与全世界的数据连接,从而发现隐藏的价值。通过将内部与公

用的数据和服务(包括社交媒体网站)相结合来实现这一目标。

通过支持任何数据的现代数据管理平台随时随地处理任意大小

的任何数据,该平台不仅具有 Windows 和 SQL Server 的易

用性,同时具有云的弹性和可扩展性。

使用熟悉的工具分析 Hadoop 数据 : 微软可让用户利用 Excel

的 Hive 组件在熟悉的 Excel 环境中与 Hadoop 中的非结构化

数据进行交互并加以分析。

通过任何数据获得深入的洞察力 : 企业可以用熟悉的 BI 工

具( 例 如 Microsoft SQL Server Analysis Services (SSAS)、

PowerPivot 和 Power View) 通 过 Hive Open Database

Connectivity (ODBC) Driver 来分析 Hadoop 中的非结构化

数据。企业还可以用 SQL Server 2012 上的 PowerPivot 和

Power View 对关系型数据采用自助服务的 BI 产品。

通 过 简 化 的 编 程 驱 动 洞 察 力 : 微 软 通 过 与 .NET 和 新 的

JavaScript 库集成简化了 Hadoop 的编程。开发人员可以在

JavaScript 中使用新的 JavaScript 库来轻松编写 MapReduce

程序,然后通过简单的浏览器来部署他们的 JavaScript 代码。

通过 Windows Azure Marketplace 进行共享和协作 : 微软

大数据解决方案可让客户通过 Windows Azure Marketplace

共享数据并发现新的洞察力,Windows Azure Marketplace

可通过开放数据协议 (OData) 展露数百种来自微软和第三方的

应用程序和数据挖掘算法。

Page 4: 并行数据仓库解决方案 - download.microsoft.comdownload.microsoft.com/documents/china/sql/201210/Big-Data-and-PDW... · 通过 Hadoop 扩展数据仓库: 两个用于连接

03

随时随地处理任意大小的任何数据通过现代数据管理平台,微软可让客户无缝存储和处理所有类型的

数据,包括结构化、非结构化和实时数据。它为 Hadoop 提供了

Windows 和 SQL Server 的易用性,通过 Hadoop 扩展了数据仓库,

还提供了大数据在云端的弹性和可扩展性。

回馈 Hadoop 社区与其他的竞争对手不同,微软通过回馈 Hadoop 社区扩展了访问权限。

微软致力于提倡改变 Apache Hadoop,以拓宽 Hadoop 社区的使用

范围。通过与 Hortonworks 通力合作,微软已向 Apache 提交了首

份提议,并且正在拟定有关适用于 Hadoop 的新 JavaScript 库(由

微软开发)以及 Hive ODBC Driver 的深度提议。

为 Hadoop 提供 Windows 和 SQL Server 的易用性和可管

理性 : 通过智能化打包,微软使得在 Windows 上安装和设置

Hadoop 更加简单 ;安装完毕只需不到三小时,而无需花费数

周的时间。Windows Azure 平台上基于 Hadoop 的服务进一

步简化了部署,可让客户在 10 分钟内在云端部署 Hadoop 集

群。通过与 Microsoft System Center 集成,可让 IT 人员像

管理其他任何 IT 资产一样轻松管理他们的 Hadoop 集群。与

Active Directory 的集成可让 IT 人员使用基于企业的安全策略

来保护他们的 Hadoop 集群。

通过 Hadoop 扩展数据仓库 : 两个用于连接 SQL Server 和

SQL Server 并行数据仓库的新型双向 Hadoop 连接器可让客

户轻松将 Hadoop 与微软企业数据仓库及 BI 解决方案相集成,

以便从结构化和非结构化数据中获取更加深入的业务洞察力。

获取云端的弹性和可扩展性 : 微软提供了两种在 Windows

Server 上部署 Hadoop 的选项 :在基于云的环境中或在本

地部署。Windows Azure 平台是一种基于云的服务,可在微

软的云平台上提供灵活的千兆级分析。对于希望将数据保留

在其数据中心的客户,微软将提供 Windows Server 上基于

Hadoop 的版本。

与社交媒体集成 : 微软大数据解决方案可让客户通过来自社交

媒体网站(例如 Twitter 和 Facebook)的公用数据来扩展他

们的分析。微软的一款代号为“Social Analytics”的基于云的

项目允许企业将社交媒体信息与业务应用程序相集成。

借助 Hadoop 执行高级分析 : 微软大数据解决方案支持传统

的 BI 以及高级分析(例如数据挖掘和图形挖掘),从而可让

客户从他们所有的数据中发现新价值。Hive ODBC Driver 可

让客户使用 SQL Server 数据挖掘工具执行预测分析。微软还

将支持 Mahout 等其他高级分析工具,以及使用 C++、C#、

Python、Ruby 和 Pearl 编写的挖掘算法。

更多资源

有关微软大数据解决方案的更多信息,请访问 :

www.microsoft.com/bigdata

下载 SQL Server Connector for Apache Hadoop,请访问 :

www.microsoft.com/download/en/details.aspx?id=27584