Apache Pulsar原理解析與應用實踐|快訊
鏈接:https://pan.baidu.com/s/1Z2C3Tu4LihzoMTB7uPoFRw?pwd=u4cb?
提取碼:u4cb
本書從項目背景、基本概念、架構設計和工程實踐等多角度出發,全面解讀Pulsar的核心原理與應用方法。作為云原生的分布式消息隊列和流數據平臺,Pulsar不僅支持云原生、多租戶、跨區域數據復制等高級功能,還支持消息隊列事務、分層存儲、可插拔的消息隊列協議、Pulsar Function、Pulsar I/O、Pulsar SQL等拓展功能,且可與Apache Spark、Apache Flink等計算引擎,及Apache Flume、Apache Kafka、Logstash等社區生態相結合。所以,通過Pulsar可以輕松構建出一整套的數據服務。本書對這些內容均進行了詳細介紹。
(資料圖)
本書包括3篇11章。*基礎篇(第1~4章)首先對Pulsar的背景進行簡單介紹,并對多種消息隊列進行重點比較分析;然后對Pulsar的基本概念和基本架構進行分析,讓讀者對Pulsar有一個總體的了解;接著分享了Pulsar安裝與部署的方法,以方便讀者快速上手并構建自己的服務;最后深度解讀了Pulsar的基本使用方法。
*原理篇(第5~7章)首先深度解讀了Pulsar的核心組件Broker、Bookie、ManagedLedger、主題管理等的原理;然后分析了構建在這些核心組件之上的高級特性,如事務管理、消息協議拓展、分層存儲設計、消息延遲傳遞與主題壓縮;最后對Pulsar提供的輕量化流數據處理引擎Pulsar Function及I/O功能進行剖析。
*應用篇(第8~11章)首先分享了Pulsar在結構化數據查詢與實時處理引擎技術方面的實踐,介紹了Pulsar如何與Trino、Flink、Spark等引擎相結合;接著對Pulsar安全配置、服務管理、服務監控等進行討論;最后介紹了Pulsar服務的應用模式,以及Pulsar在數據集成、動態數據捕獲和高可靠性配置等方面的實踐。
內容簡介
這是一本從實踐角度解讀Apache Pulsar相關組件、工作原理和落地實踐的專業指導書。本書主要面向的是初中級讀者,從基礎概念講起,逐漸擴展到基本操作、核心技術、常用工具及典型應用等。
本書共分為10章:
第1章主要介紹與Apache Pulsar相關的基礎知識,比如發展歷史、適用場景、優勢與不足,以及與消息隊列框架相關的知識等。
第2章主要介紹Apache Pulsar的核心概念和架構。
第3~9章主要介紹進行實操必須具備的內容,比如Apache Pulsar安裝部署的方法、基本操作、核心組件、高級特性、輸入/輸出、Pulsar SQL、運維方法等。
第10章是實操落地的方法,包括Pulsarde 應用模式、flink配合實現實時處理、構建實時消息管道得具體實踐等。
作者簡介
楊國棟騰訊軟件工程師,Apache Pulsar、Apache Flink等項目的核心貢獻者,Apache Pulsar社區開源愛好者,杭州電子科技大學碩士。曾參與某大型數據中臺建設項目,以及消息隊列服務(Pulsar、Kafka)及其相關數據總線服務的開發與建設工作。在Apache Pulsar、Apache Flink落地實踐方面具有豐富的經驗。公眾號“大數據技術事務所”運營者。專注于技術積累,熱愛技術分享,活躍于多個技術論壇。
精彩書評
*使用消息隊列可以在很大程度上解決海量數據吞吐、削峰填谷、系統耦合等問題。對于大數據場景下的流式數據處理,Pulsar無疑是好的選擇。本書對Pulsar的基本概念、架構和常用技巧進行了詳細描述,并深入淺出地介紹了Pulsar的核心基礎,同時結合作者在國內外一線互聯網公司實際工作經驗,系統性講解了Pulsar的搭建和使用方法、運行原理。本書內容包羅萬象,講解深入淺出,是研發人員的參考指南。從業者通讀本書一定能得到啟發。張建海 博士,教授,杭州電子科技大學計算機學院副院長,浙江省腦機協同智能重點實驗室副主任*Pulsar是目前開源項目里較為年輕的消息隊列引擎,它既強大又神秘,且讓很多初學者無從下手。相信這本書的出現能在很大程度上改變這種狀況。從運行原理到使用方法再到安裝部署和運維監控,本書從實踐角度詳細介紹了關于Pulsar的方方面面。通過本書你可以更好地進入Pulsar的世界。鄒博 睿客邦創始人,中國地質科學院資源所人工智能團隊負責人,中海油工技數字中心顧問*隨著流數據處理技術的普及與發展,Pulsar正逐漸展露出強大的消息處理和服務能力,越來越多的公司選擇使用Pulsar作為消息服務。本書從原理和實踐兩個角度深入介紹了Pulsar技術,同時注重介紹Pulsar與Flink、Trino等生態的整合,可幫助讀者基于Pulsar快速構建云原生流數據平臺和應用,非常值得推薦。張利兵 《Flink原理、實戰與性能優化》《Flink設計與實現》作者*本書從基本概念、核心原理、應用實踐等多個層面出發,對Apache Pulsar進行了剖析,并特別注重理論與實踐的結合,值得推薦。朱凱 明源云 天際數據平臺技術總監
目錄
前 言
基礎篇
第1章 Pulsar概述 2
1.1 Pulsar是什么 2
1.2 Pulsar的優勢 3
1.2.1 Pulsar不只是消息隊列 4
1.2.2 存儲與計算分離 4
1.2.3 云原生架構 5
1.2.4 Pulsar的存儲特性 6
1.2.5 消息傳輸協議 8
1.2.6 消費方式 8
1.2.7 豐富的功能與生態 9
1.3 消息隊列對比 9
1.3.1 消息隊列簡介 10
1.3.2 性能與可靠性 11
1.3.3 功能特性對比 14
1.4 快速體驗 17
1.4.1 下載安裝 17
1.4.2 單機服務啟動 17
1.4.3 生產與消費 18
第2章 Pulsar的基本概念和架構
詳解 20
2.1 Pulsar的基本概念 20
2.1.1 多租戶與命名空間 20
2.1.2 主題 21
2.1.3 生產者 22
2.1.4 消費者與訂閱 24
2.1.5 消息的保留與過期 27
2.2 Pulsar的邏輯架構 28
2.2.1 主題的配置管理 29
2.2.2 主題的數據流轉 30
2.2.3 主題的數據存儲 31
2.3 Pulsar物理架構 32
2.3.1 物理架構概述 32
2.3.2 核心組件與服務 35
第3章 Pulsar安裝與部署 39
3.1 依賴環境 39
3.1.1 安裝Java 39
3.1.2 Pulsar安裝包 40
3.2 分布式部署 42
3.2.1 資源分配規劃 42
3.2.2 集群搭建實戰 44
3.3 Docker部署 47
3.3.1 Docker單機部署 47
3.3.2 Docker分布式部署 48
3.4 Kubernetes部署 48
3.4.1 minikube環境安裝 48
3.4.2 Helm Chart安裝 49
3.4.3 在Kubernetes中使用
Pulsar 51
3.5 源碼的結構與編譯 52
3.5.1 源碼結構 52
3.5.2 源碼編譯 52
第4章 Pulsar的基本操作 54
4.1 生產者開發 54
4.1.1 生產者概覽 54
4.1.2 構建客戶端對象 56
4.1.3 構建生產者 58
4.1.4 數據發送路由規則 60
4.1.5 分批發送 63
4.1.6 分塊發送 64
4.1.7 生產者攔截器 64
4.2 消費者開發 65
4.2.1 構建消費者 65
4.2.2 數據確認 68
4.2.3 消費者攔截器 72
4.2.4 消費者監聽器 72
4.3 Reader開發 73
4.4 模式管理 74
4.4.1 模式類型 75
4.4.2 自動模式 78
4.4.3 模式管理 79
原理篇
第5章 Pulsar核心組件原理 84
5.1 Broker原理 84
5.1.1 通信協議層 84
5.1.2 主題查找服務 89
5.1.3 租戶與命名空間管理 90
5.1.4 負載管理 92
5.2 BookKeeper原理 94
5.2.1 BookKeeper簡介 94
5.2.2 BookKeeper的使用 100
5.3 ManagedLedger組件 100
5.3.1 ManagedLedger簡介 101
5.3.2 消息積壓的配額管理 102
5.3.3 消息的保留與清理 103
5.3.4 消息的寫入 104
5.3.5 消息的緩存與讀取 104
5.4 主題管理 105
5.4.1 Pulsar主題管理架構 106
5.4.2 生產者原理 108
5.4.3 訂閱與消費者原理 110
5.4.4 消息生存時間與持久化
控制 114
第6章 Pulsar高級特性 115
6.1 Pulsar事務 115
6.1.1 消息隊列事務隔離級別 116
6.1.2 Pulsar事務簡介 117
6.1.3 Pulsar事務的使用方法 118
6.1.4 Pulsar事務實現原理及關鍵
流程 119
6.2 消息隊列協議層 122
6.2.1 協議處理器 122
6.2.2 Pulsar上的Kafka簡介 125
6.2.3 Pulsar上的Kafka使用 126
6.2.4 Pulsar上的Kafka工作
原理 128
6.3 分層存儲 130
6.3.1 分層存儲的設計 130
6.3.2 分層存儲的使用 131
6.3.3 分層存儲的原理 133
6.4 消息延遲傳遞 133
6.5 主題壓縮 134
6.5.1 主題壓縮應用 135
6.5.2 主題壓縮原理 135
第7章 Pulsar Function與
Pulsar I/O 137
7.1 Pulsar Function簡介 137
7.1.1 Pulsar Function編程模型 137
7.1.2 Pulsar Function邏輯結構與
應用場景 140
7.2 Pulsar Function應用實踐 141
7.2.1 Pulsar Function的部署與
使用 141
7.2.2 自定義Pulsar Function
開發 146
7.2.3 Pulsar Function語義支持 148
7.3 Pulsar Function原理 150
7.3.1 Pulsar Function運行流程 150
7.3.2 Function Worker組件工作
原理 152
7.3.3 Pulsar運行時 153
7.4 Pulsar I/O 154
7.4.1 Pulsar I/O概述 154
7.4.2 使用內置的Pulsar連接器 155
7.4.3 開發自定義連接器 156
7.4.4 實例層原理 160
應用篇
第8章 Pulsar SQL架構、配置與
實現原理 164
8.1 Trino簡介 164
8.1.1 Trino架構簡介 165
8.1.2 存儲與計算分離 168
8.2 Pulsar SQL配置 169
8.2.1 單機體驗Pulsar SQL 169
8.2.2 數據查詢 170
8.3 Pulsar連接器工作原理 171
8.4 Pulsar聯邦查詢 172
8.4.1 準備數據源 173
8.4.2 聯邦查詢 175
第9章 管理你的Pulsar 176
9.1 Pulsar安全配置 176
9.1.1 數據加密 176
9.1.2 授權與認證 180
9.1.3 自定義權限插件 186
9.2 Pulsar監控配置 189
9.2.1 Pulsar監控概述 189
9.2.2 Prometheus部署 190
9.2.3 Grafana儀表盤配置 191
9.3 Pulsar管理工具 192
9.3.1 pulsar-admin工具 192
9.3.2 Pulsar Manager工具 196
9.3.3 性能壓測工具 197
9.3.4 ManagedLedger管理 199
9.4 集群管理 201
9.4.1 配置管理 201
9.4.2 Pulsar資源配置 203
第10章 Pulsar與Flink生態 206
10.1 Flink簡介 207
10.1.1 Flink的概念 207
10.1.2 Flink基本組件 212
10.2 Flink Pulsar源連接器 214
10.2.1 源連接器的使用 214
10.2.2 源連接器原理 218
10.3 Flink Pulsar輸出連接器 220
10.3.1 統一接收器API 221
10.3.2 Flink Pulsar Sink API的
使用 221
10.3.3 PulsarSink原理 223
第11章 Pulsar應用實踐 224
11.1 Pulsar應用模式 224
11.1.1 Pulsar數據總線概述 224
11.1.2 Pulsar數據集成 226
11.2 Pulsar與Spark集成 230
11.3 Pulsar與Kafka集成 231
11.3.1 Kafka客戶端適配器 231
11.3.2 Pulsar I/O Kafka 233
11.3.3 Pulsar Connector適配器 234
11.4 Pulsar CDC 236
11.4.1 Pulsar Canal CDC 236
11.4.2 Pulsar Debezium CDC 238
11.5 可靠性優先場景 239
11.5.1 冪等性、消息確認與
事務 239
11.5.2 可靠性與一致性 240
查看全部↓
前言/序言
【為什么要寫本】
Pulsar是一個集消息傳遞、消息存儲、輕量化函數式計算于一體的云原生流數據平臺。Pulsar提供數據存儲與消費能力,憑借優秀的架構設計、強大的可擴展性,在消息隊列、流數據處理等多個領域被廣泛使用。
筆者最初接觸Pulsar時其社區版本是2.4,彼時的Pulsar已嶄露頭角。但當時關于Pulsar的中文資料相當少,更不用說中文圖書了,很多問題需要通過求助于社區和閱讀源碼來解決。那時的Pulsar雖然優秀,但是對于初學者來說學習與使用成本較高。在實際項目中,筆者及團隊伙伴使用Pulsar構建了數據服務,也發掘出Pulsar在工程實踐中的價值。筆者在學習與工作的過程中有意識地整理了大量與Pulsar相關的資料。
Pulsar在2016年發布了第一個社區版本,經過多年的發展,越來越多的頭部公司使用Pulsar來構建消息服務。截至本書寫作時,Pulsar已經迭代到2.10版本,功能日益完善,社區生態方興未艾。通過Pulsar,你不僅可以構建消息隊列服務,還可以構建可靠的、高吞吐量的大數據應用,甚至可以為金融場景提供高可靠、高性能的服務支持。
圖片
-
LOLS11劍圣天賦推薦(S11打
河南是南方還是北方啊_河南
閩南理工學院宿舍_閩南理工
-
又一造車新勢力面臨退市!市
頭條:笹垣怎么讀_笹
省自然資源廳 省農業農村廳
深圳寶安:愛心阿姨收廢品籌
中國代表團:美國才是南海局
津巴布韋經濟分析師:非洲不
-
保利發展(600048):6月2日
外媒:中國在航空和汽車領域
世界球精選!會計核算的流程
廣西壯族自治區柳州市2023-0
中國科學家牽頭,取得重大進
今日最新!南寧市第四職業技
-
東鵬特飲造富,林木勤家族先
江西“高考愛心車隊”數量將
旅游 | 貴州鄉村旅游發展
當前播報:分享大樂透曬票第0
【新視野】萊茵生物:公司美
鐢佃剳妗岄潰鍥炬爣涓嬮槾褰
精彩推送
- Apache Pulsar原理解析與應用實踐|快訊
- LOLS11劍圣天賦推薦(S11打野劍圣天賦符文搭配)_世界觀天下
- 世界快訊:韓國慕色北京店官網(韓國慕色)
- 速看:2022餐廳紙十大品牌排行榜_餐廳紙哪個牌子好
- 河南是南方還是北方啊_河南是南方還是北方_焦點速看
- 金拱門桶買一送一_金拱門桶
- 想知道張玉環案是怎么回事_了解一下張玉環案
- 閩南理工學院宿舍_閩南理工學院怎么樣 焦點速看
- 能藏75個孩子!交警實測車輛盲區有多可怕
- 又一造車新勢力面臨退市!市值蒸發98%!
- 天天視點!dd373游戲交易平臺手機版_dd373游戲交易平臺
- 當前視訊!打印機出現系統顯示您尚未安裝打印機是怎么回事_尚未安裝打印機是怎么回事
- 戴爾筆記本攝像頭怎么打開捕捉不到硬件(戴爾筆記本攝像頭怎么打開) 每日信息
- 頭條:笹垣怎么讀_笹
- 曳舟(關于曳舟介紹)
- 廣州笑翻天樂園穿搭_廣州笑翻天樂園
- 省自然資源廳 省農業農村廳 省林業局聯合督導張家界市重點工作反饋會召開 天天看點
- 稀奇!3000個農業“尖板眼”亮相武漢種博會
- 深圳寶安:愛心阿姨收廢品籌善款,6年帶動周邊居民獻愛心 獨家
- 中國科學家在大腦中找到“生物鐘”位置 或有助于睡眠障礙等方面新藥研發
- 有困難打電話!河南交警公布保障高考服務熱線-天天速讀
- 第七屆寶山區定向坐標挑戰賽舉行-環球快資訊
- 快資訊:碳酸鋰價格狂飆70%,鋰電池板塊暴漲
- 中國代表團:美國才是南海局勢緊張的真正推手
- 南沙能吹填島礁,為什么黃巖島就難造?看海底結構圖就明白了…… 簡訊
- 津巴布韋經濟分析師:非洲不應該被美元綁架
- 從“不擅長”,到高數滿分!陜西“男神”學霸:初試443分逆襲985_世界熱文
- 天天訊息:巴黎官方:拉莫斯合同到期離隊
- 顧斌替補登場完成浙江隊百場里程碑,俱樂部官方發文祝賀
- 《中國珍稀瀕危植物種子》發行 眾多種子信息公開
- 微資訊!財神客棧粵語_財神客棧粵語
- 多位論文作者要求刪除署名!原因是:恥于與他同列
- 舌下取栓的替代法|當前速訊
- 世界短訊!承諾戒煙 共享無煙環境
- 工行河池都安支行成功發放轄內首筆“資產支持貸”
- 國資委詳解央企發債為何不再“一事一批”
- 天天新動態:四項商代重要考古成果重磅發布
- 最新:一季度北京市文化產業收入實現兩位數增長
- 微速訊:聯合國安理會召開朝鮮半島核問題公開會
- 廣東:“一戶多人口”家庭用電優惠認定條件放寬
- 連續3天超1000萬畝 “三夏”大規模小麥機收全面展開
- 河南洛陽高技術制造業增加值增長超15%
- 快看點丨上海環資案件涉及類型多樣,刑事案件數量同比下降43%
- 酷狗概念版怎么添加本地歌曲 酷狗概念版》、添加本地歌曲方法|全球焦點
- 穿越山海,華為WATCHUltimate非凡大師智能守護
- 特寫:三個小小的心愿,40個藏族孩子的六一
- ons是什么意思中文_ons的中文意思 天天快資訊
- 當前聚焦:新黎明過會:今年IPO過關第133家 華泰聯合過5單
- 怪物狂潮什么武器最好用?
- 泰豐智能過會:今年IPO過關第134家 一創投行過3單
- 硅動力上會前夕撤回IPO申請 保薦機構為安信證券
- 每日快報!本周生豬價格相對平穩 全國生豬交易均重繼續降低
- 安卓鬧鐘
- 熱點評!安全證書查詢官方網站(消防證書查詢官方網站)
- 連簽五人!季后賽還沒打完!他們就定了…_天天亮點
- 拔牙后的「推薦食物清單」,冰淇淋排在前列
- 網傳女博士生“介入導師婚姻”,四川大學:該女博士生尚未入職
- 【天天報資訊】小學生學習軟件推薦(小學生學習)
- :全新大眾速騰1.4T怎么樣及林肯航海家現在報價多少錢 世界最新
- 武生名家親授京劇《鐘馗嫁妹》 “90后”青年演員傳承獻演
- 數字治理進社區!虹口的公租房有了“智慧大腦”
- 焦點!蘭州大學網絡教育學院學生平臺登錄入口_蘭州大學網絡教育學院學生平臺
- 竹籃打水一場空_竹籃打水 全球新資訊
- 前海人壽廣州總醫院榮獲國際醫療旅游試點示范基地稱號
- 全球熱推薦:中陽金融美股跌15.45%
- 華住酒店集團美股漲7.84%
- 橙子與橘子功效的區別大嗎(橙子與橘子功效有什么區別) 全球快播報
- 三千口醫藥科技新品榮獲第四屆全國中醫藥傳承創新發展大會創新獎
- 高途美股漲9.41%
- 招聘簡章模板_招聘簡章-天天新資訊
- 叮咚買菜美股漲10.82%
- 小i機器人美股跌8.42% 環球熱訊
- 海參崴對華開放,中國東北迎來哪些機遇?|視訊
- 天天消息!永久禁言!多個賬號因網暴武漢被撞身亡學生母親被封禁
- 歷屆歐冠冠軍得主隊長_歷屆歐冠冠軍得主-快播報
- 嬰幼兒配方奶粉新國標實施 “最嚴”國標更益于中國寶寶-天天快消息
- 減負增效優化營商環境 多地出招力挺民營經濟發展
- 吉林樺甸村級集體經濟倍增行動入選全國典型
- 淘氣甜心(關于淘氣甜心介紹)_當前熱聞
- 怎樣養蚯蚓(怎樣養蚯蚓又肥又大)
- 天天百事通!4月完成交通固定資產投資3150億元,同比增長13.6%
- 微速訊:央行精準“滴灌”呵護流動性 資金面平穩跨月
- 房地產類集合信托規模持續萎縮 存量業務風險或隨樓市回暖下降-環球熱點評
- 我國首艘國產郵輪建造接近尾聲 將于6月6日出塢_世界通訊
- 資訊:“剛剛失去了孩子,又遭受網絡暴力。”武漢校內遭碾壓致死男童的母親,被證實墜樓離世
- 環球聚焦:3年期、5年期存款利率普遍降至3%以下 有何影響?
- 世界熱門:馬斯克與特斯拉的第二條鯰魚
- Patriot擁有Gen5NVMESSD帶有微型風扇和令人難以置信的低調
- 環球快消息!建設田間“大冰箱” 存住土特產鮮味
- 保利發展(600048):6月2日北向資金增持306.9萬股
- 【環球報資訊】石墓陣怎么走最簡單_石墓陣怎么走
- 外媒:中國在航空和汽車領域頻頻得分-全球資訊
- 解除勞動合同協議書丟了怎么辦_解除勞動合同協議書
- 世界球精選!會計核算的流程和方法體系_會計核算流程與程序圖
- 資深產科護士表示:產后一周就能洗頭洗澡 不過有講究|今亮點
- 世界播報:鄭欽文失誤太多葬送比賽,排名提升不如預期
- 張韶涵的褲子有點短啊,看出里面又穿了一層,別說還挺時髦的 天天熱頭條
- 廣西壯族自治區柳州市2023-06-02 11:46發布高溫橙色預警
- 未來三天 北方大部氣溫低于常年同期 華南等地有高溫天氣
- 中國科學家牽頭,取得重大進展
金融
財經
要聞
公司
5月29日,在500強企業對話山西主題論壇上,山西省太平洋煤層氣研究院院長張遂安作了題為《樹立正確的能源環
詳細>>近日,內蒙古自治區郵政管理局印發了《內蒙古自治區郵政快遞業塑料污染治理三年行動方案(2023-2025)》(
詳細>>泡菜爽脆可口,很多人都非常喜歡吃。在四川,泡菜更是被譽為川菜之根,受到食客們熱烈追捧,人們戲稱它是“
詳細>>進入5月以來,受供應不足影響,六氟磷酸鋰價格接連上漲,從不足10萬元(噸價,下同)飆升至目前的14 8萬~16
詳細>>記者從中國科學院、中國工程院網站獲悉,2023年,兩院院士增選工作啟動。2023年度中國科學院院士增選指南、
詳細>>5月24日,國家藥監局公布2023年醫療器械行業標準制修訂計劃項目,共包括117項醫療器械行業標準。其中,制定
詳細>>