首頁技術(shù)文章正文

Spark的部署方式多少種?

更新時(shí)間:2022-04-22 來源:黑馬程序員 瀏覽量:

Spark部署模式分為Local模式(本地單機(jī)模式)和集群模式,在Local模式下,常用于本地開發(fā)程序與測(cè)試,而集群模式又分為Standalone模式(集群單機(jī)模式)、Yarn模式和Mesos模式,關(guān)于這三種集群模式的相關(guān)介紹具體如下:

1.Standalone模式

Standalone模式被稱為集群單機(jī)模式。Spark框架與Hadoop1.0版本框架類似,本身都自帶了完整的資源調(diào)度管理服務(wù),可以獨(dú)立部署到一個(gè)集群中,無需依賴任何其他的資源管理系統(tǒng),在該模式下,Spark集群架構(gòu)為主從模式,即一臺(tái)Master節(jié)點(diǎn)與多臺(tái)Slave節(jié)點(diǎn),Slave節(jié)點(diǎn)啟動(dòng)的進(jìn)程名稱為Worker,此時(shí)集群會(huì)存在單點(diǎn)故障問題,后續(xù)將在Spark HA集群部署小節(jié)講解利用Zookeeper解決單點(diǎn)問題的方案。

2.Yarn模式

Yarn模式被稱為Spark on Yarn模式,即把Spark作為一個(gè)客戶端,將作業(yè)提交給Yarn服務(wù),由于在生產(chǎn)環(huán)境中,很多時(shí)候都要與Hadoop使用同一個(gè)集群,因此采用Yarn來管理資源調(diào)度,可以有效提高資源利用率,Yarn模式又分為Yarn Cluster模式和Yarn Client模式,具體介紹如下:

lYarn Cluster:用于生產(chǎn)環(huán)境,所有的資源調(diào)度和計(jì)算都在集群上運(yùn)行。

lYarn Client:用于交互、調(diào)試環(huán)境。

3.Mesos模式

Mesos模式被稱為Spark on Mesos模式,Mesos與Yarn同樣是一款資源調(diào)度管理系統(tǒng),可以為Spark提供服務(wù),由于Spark與Mesos存在密切的關(guān)系,因此在設(shè)計(jì)Spark框架時(shí)充分考慮到了對(duì)Mesos的集成,但如果你同時(shí)運(yùn)行Hadoop和Spark,從 兼 容 性 的 角 度 來 看 ,Spark on Yarn是更好的選擇。

上述三種分布式部署方案各有利弊,通常需要根據(jù)實(shí)際情況決定采用哪種方案。由于學(xué)習(xí)階段我們是在虛擬機(jī)環(huán)境下模擬小規(guī)模集群,因此可以考慮選擇Standalone模式。





猜你喜歡:

RDD在Spark中是怎樣運(yùn)行的?

在數(shù)據(jù)處理中哪些場景可以使用Spark?

Spark Shell讀取HDFS文件的步驟有哪些?

Spark的集群安裝部署【大數(shù)據(jù)技術(shù)文章】

黑馬程序員python+大數(shù)據(jù)開發(fā)工程師培訓(xùn)

分享到:
在線咨詢 我要報(bào)名
和我們?cè)诰€交談!