国产一区二区精品-国产一区二区精品久-国产一区二区精品久久-国产一区二区精品久久91-免费毛片播放-免费毛片基地

千鋒教育-做有情懷、有良心、有品質的職業教育機構

手機站
千鋒教育

千鋒學習站 | 隨時隨地免費學

千鋒教育

掃一掃進入千鋒手機站

領取全套視頻
千鋒教育

關注千鋒學習站小程序
隨時隨地免費學習課程

當前位置:首頁  >  技術干貨  > 【操作教程】累加器和廣播變量在哪些場景使用

【操作教程】累加器和廣播變量在哪些場景使用

來源:千鋒教育
發布人:syq
時間: 2022-07-22 17:55:00 1658483700

  累加器和廣播變量在哪些場景使用?累加器是分布式的并且共享只寫變量。如果在轉換運算符中調用了累加器,并且沒有后續的動作運算符,則不會執行累加器。如果后面兩次調用action操作符,累加器會被執行兩次,導致過度加法。

累加器和廣播變量在哪些場景使用

  1、廣播變量的使用介紹

  解決的場景:

1

  將Driver進程的共享數據發送給所有子節點的Executor進程的每個任務。如果不使用廣播變量技術,Driver端默認會將共享數據分發給各個[Task],對網絡分發造成很大壓力。

  如果采用廣播變量技術,Driver端的共享數據只會發送給每個[Executor]。 Executor 中的所有任務都重用這個對象。確保共享對象是[可序列化的]。因為跨節點傳輸的數據必須是可序列化的。

  將共享對象廣播到Driver端的每個Executor:

  val bc = sc.broadcast(共享對象)

  在執行器中獲得:

  bc.值

  2、累加器的使用方法

  集群中的所有 Executor 對同一個變量執行累積操作。 Spark 目前只支持累加 [add] 操作。內置3個累加器:【LongAccumulator】、【DoubleAccumulator】、【CollectionAccumulator】。

  如何使用整數累加器?

  在Driver端定義整數累加器并賦初值。

  acc=sc.accumulator(0)

  Executor端每次累加1

  acc+=1

  或者 acc.add(1)

2

  3、綜合案例

3

4

  以上代碼不僅練習了累加器和廣播變量在哪些場景使用,還練習了如何使用函數式編程(Map、Filter),如何創建上下文變量,以及如何使用并行性。這些練習比較全面,希望能幫助你學習更多技能。更多關于IT大數據培訓的問題,歡迎咨詢千鋒教育在線名師,如果想要了解我們的師資、課程、項目實操的話可以點擊咨詢課程顧問,獲取試聽資格來試聽我們的課程,在線零距離接觸千鋒教育大咖名師,讓你輕松從入門到精通。

tags:
聲明:本站稿件版權均屬千鋒教育所有,未經許可不得擅自轉載。
10年以上業內強師集結,手把手帶你蛻變精英
請您保持通訊暢通,專屬學習老師24小時內將與您1V1溝通
免費領取
今日已有369人領取成功
劉同學 138****2860 剛剛成功領取
王同學 131****2015 剛剛成功領取
張同學 133****4652 剛剛成功領取
李同學 135****8607 剛剛成功領取
楊同學 132****5667 剛剛成功領取
岳同學 134****6652 剛剛成功領取
梁同學 157****2950 剛剛成功領取
劉同學 189****1015 剛剛成功領取
張同學 155****4678 剛剛成功領取
鄒同學 139****2907 剛剛成功領取
董同學 138****2867 剛剛成功領取
周同學 136****3602 剛剛成功領取
相關推薦HOT