Serengeti專案和最新的Apache Hadoop促成VMware vSphere®
成為高度彈性可靠最佳企業級Hadoop平台
全球虛擬化和雲端運算基礎架構領導廠商VMware (NYSE:VMW) 公布最新開放原始碼專案Serengeti,支援企業能夠在虛擬和雲端環境中快速部署、管理和擴展Apache Hadoop。此外,VMware與Apache Hadoop社群共同合作開發,讓主要元件有「感知虛擬化」(virtualization-aware) 能力以支援彈性擴充,並進一步提高Hadoop在虛擬環境中的效能。
VMware雲端應用服務副總裁陳志璋表示 ,Apache Hadoop具有推動業務轉型的潛力,能讓企業充分運用巨量資料取得競爭優勢。Apache Hadoop呈現應用的重大變化,而企業也在尋找把這些新技術整合到自身產品組合的方式。VMware和Apache Hadoop社群合作,支援企業IT部門能夠在虛擬和雲端環境中輕鬆部署和管理 Hadoop。
Apache Hadoop事實上逐漸形成巨量資料處理的標準,但部署和維運的複雜性、特殊的硬體需求、安全上的考量和服務水準的保障,讓很多企業無法充分發揮Hadoop的能力。藉由Apache Hadoop節點從底層實體基礎架構分離,VMware將雲端基礎架構的優勢如快速部署、高可用性 (high availability) 、最佳資源利用率、彈性和安全的多重用戶 (multi-tenancy) 帶給Hadoop。
擁有Apache 2.0授權的用户可以免費下載Serengeti單鍵 (one-click) 部署工具包,支援企業能夠利用VMware vSphere®平台在幾分鐘內部署Apache Hadoop叢集,包括Apache Pig和Apache Hive等常見的Hadoop元件。透過使用Serengeti在VMware vSphere®上執行Hadoop,企業可以輕易地使用值得信賴、全球廣泛部署的虛擬平台的高可用性 (high availability) 、容錯力 (fault tolerance) 和即時遷移能力,進一步使用並管理Hadoop叢集。
OVUM首席分析Tony Baer表示,如欲成為企業IT基礎架構中的頂尖的公民,Hadoop必須符合企業IT部門的技術和實務需求。巨量資料叢集的資源密集性促使Hadoop必須支援虛擬化。VMware參與Apache Hadoop專案和VMware最新Serengeti Apache專案都是非常重要的佈局,為企業提供在Hadoop原型開發和部署時所需的彈性。
VMware與Cloudera、Greenplum、Hortonworks、IBM和MapR等業界領先的Apache Hadoop通路夥伴合作,並進行大範圍銷售。
虛擬化擴展、Spring的更新幫助企業建置和維運巨量資料應用
為了簡化並加速企業使用Apache Hadoop,VMware與Apache Hadoop社群合作更新Hadoop分散式文件系统 (HDFS) 和Hadoop MapReduce專案,使其能夠感知虛擬化 (virtualization-aware) ,進而支援資料和運算工作在虛擬基礎架構中可以進行分布最佳化,讓企業能夠實現更具彈性、更安全且高可用的Hadoop叢集。
VMware同時發布Spring for Apache Hadoop (2012年2月首次發布的開放原始碼專案) 更新,讓企業開發者能容易地利用Apache Hadoop開發分散式處理解決方案。上述的更新支援Spring開發者能輕鬆地開發可以與HBase資料庫、Cascading元件庫和Hadoop安全相整合的企業應用。Spring for Apache Hadoop可免费下载,目前可透過開放原始碼Apache 2.0授權取得。
這些專案和新功能可加速採用Hadoop,並支援企業充分使用Cetas等巨量資料分析應用軟體能從巨量資料中獲得即時、智慧的洞察力。VMware在2012年4月收購Cetas,Cetas分析服務目前可以在www.cetas.net網站取得。