小林coding - 去蝦皮面試，被問麻了。。。－鑽石舞台

Jun 18 Sat 2022 22:00
小林coding - 去蝦皮面試，被問麻了。。。

刷題網站：xiaolincoding.com

最近有位讀者去蝦皮面試啦，所以今天給大家推薦一篇整理了 15 道蝦皮面試真題答案的文章。

文中比較長，大家可以收藏慢慢看。

排序鍊表

對稱與非對稱加密算法的區別

TCP如何保證可靠性

聊聊五種IO模型

hystrix 工作原理

延時場景處理

https請求過程

聊聊事務隔離級別，以及可重複讀實現原理

聊聊索引在哪些場景下會失效？

什麼是虛擬內存

排行榜的實現，比如高考成績排序

分布式鎖實現

聊聊零拷貝

聊聊synchronized

分布式ID生成方案

1. 排序鍊表

給你鍊表的頭結點head ，請將其按升序排列並返回排序後的鍊表。

圖片

實例1：

輸入：head=[4,2,1,3]輸出：[1,2,3,4]

實例2：

圖片輸入：head=[-1,5,3,4,0]輸出：[-1,0,3,4,5]

這道題可以用雙指針+歸併排序算法解決，主要以下四個步驟

\1. 快慢指針法，遍歷鍊表找到中間節點

\2. 中間節點切斷鍊表

\3. 分別用歸併排序排左右子鍊表

\4. 合併子鍊表

完整代碼如下：

classSolution{publicListNodesortList(ListNodehead){//如果鍊表為空，或者只有一個節點，直接返回即可，不用排序if(head==null||head.next==null)returnhead;//快慢指針移動，以尋找到中間節點ListNodeslow=head;ListNodefast=head;while(fast.next!=null&&fast.next.next!=null){fast=fast.next.next;slow=slow.next;}//找到中間節點，slow節點的next指針，指向midListNodemid=slow.next;//切斷鍊表slow.next=null;//排序左子鍊表ListNodeleft=sortList(head);//排序左子鍊表ListNoderight=sortList(mid);//合併鍊表returnmerge(left,right);}publicListNodemerge(ListNodeleft,ListNoderight){ListNodehead=newListNode(0);ListNodetemp=head;while(left!=null&&right!=null){if(left.val<=right.val){temp.next=left;left=left.next;}else{temp.next=right;right=right.next;}temp=temp.next;}if(left!=null){temp.next=left;}elseif(right!=null){temp.next=right;}returnhead.next;}}2.對稱與非對稱加密算法的區別

先複習一下相關概念：

明文：指沒有經過加密的信息/數據。

密文：明文被加密算法加密之後，會變成密文，以確保數據安全。

密鑰：是一種參數，它是在明文轉換為密文或將密文轉換為明文的算法中輸入的參數。密鑰分為對稱密鑰與非對稱密鑰。

加密：將明文變成密文的過程。

解密：將密文還原為明文的過程。

對稱加密算法:加密和解密使用相同密鑰的加密算法。常見的對稱加密算法有AES、3DES、DES、RC5、RC6等。

圖片

非對稱加密算法：非對稱加密算法需要兩個密鑰（公開密鑰和私有密鑰）。公鑰與私鑰是成對存在的，如果用公鑰對數據進行加密，只有對應的私鑰才能解密。主要的非對稱加密算法有：RSA、Elgamal、DSA、D-H、ECC。

圖片3. TCP如何保證可靠性

首先，TCP的連接是基於三次握手，而斷開則是四次揮手。確保連接和斷開的可靠性。

其次，TCP的可靠性，還體現在有狀態;TCP會記錄哪些數據發送了，哪些數據被接受了，哪些沒有被接受，並且保證數據包按序到達，保證數據傳輸不出差錯。

再次，TCP的可靠性，還體現在可控制。它有報文校驗、ACK應答、超時重傳(發送方)、失序數據重傳（接收方）、丟棄重複數據、流量控制（滑動窗口）和擁塞控制等機制。

4. 聊聊五種IO模型 4.1 阻塞IO 模型

假設應用程序的進程發起IO調用，但是如果內核的數據還沒準備好的話，那應用程序進程就一直在阻塞等待，一直等到內核數據準備好了，從內核拷貝到用戶空間，才返回成功提示，此次IO操作，稱之為阻塞IO。

圖片4.2 非阻塞IO模型

如果內核數據還沒準備好，可以先返回錯誤信息給用戶進程，讓它不需要等待，而是通過輪詢的方式再來請求。這就是非阻塞IO，流程圖如下：

圖片4.3 IO多路復用模型

IO多路復用之select

應用進程通過調用select函數，可以同時監控多個fd，在select函數監控的fd中，只要有任何一個數據狀態準備就緒了，select函數就會返回可讀狀態，這時應用進程再發起recvfrom請求去讀取數據。

圖片

select有幾個缺點：

最大連接數有限，在Linux系統上一般為1024。

select函數返回後，是通過遍歷fdset，找到就緒的描述符fd。

IO多路復用之epoll

為了解決select存在的問題，多路復用模型epoll誕生，它採用事件驅動來實現，流程圖如下：

圖片

epoll先通過epoll_ctl()來註冊一個fd（文件描述符），一旦基於某個fd就緒時，內核會採用回調機制，迅速激活這個fd，當進程調用epoll_wait()時便得到通知。這裡去掉了遍歷文件描述符的坑爹操作，而是採用監聽事件回調的機制。這就是epoll的亮點。

4.4 IO模型之信號驅動模型

信號驅動IO不再用主動詢問的方式去確認數據是否就緒，而是向內核發送一個信號（調用sigaction的時候建立一個SIGIO的信號），然後應用用戶進程可以去做別的事，不用阻塞。當內核數據準備好後，再通過SIGIO信號通知應用進程，數據準備好後的可讀狀態。應用用戶進程收到信號之後，立即調用recvfrom，去讀取數據。

圖片4.5 IO 模型之異步IO(AIO)

AIO實現了IO全流程的非阻塞，就是應用進程發出系統調用後，是立即返回的，但是立即返回的不是處理結果，而是表示提交成功類似的意思。等內核數據準備好，將數據拷貝到用戶進程緩衝區，發送信號通知用戶進程IO操作執行完畢。

流程如下：

圖片5. hystrix 工作原理

Hystrix 工作流程圖如下:

圖片

構建命令

Hystrix 提供了兩個命令對象：HystrixCommand和HystrixObservableCommand，它將代表你的一個依賴請求任務，向構造函數中傳入請求依賴所需要的參數。

執行命令

有四種方式執行Hystrix命令。分別是：

R execute()：同步阻塞執行的，從依賴請求中接收到單個響應。

Future queue()：異步執行，返回一個包含單個響應的Future對象。

Observable observe()：創建Observable後會訂閱Observable，從依賴請求中返回代表響應的Observable對象

Observable toObservable()：cold observable，返回一個Observable，只有訂閱時才會執行Hystrix命令，可以返回多個結果

檢查響應是否被緩存

如果啟用了 Hystrix緩存，任務執行前將先判斷是否有相同命令執行的緩存。如果有則直接返回包含緩存響應的Observable；如果沒有緩存的結果，但啟動了緩存，將緩存本次執行結果以供後續使用。

檢查迴路器是否打開迴路器(circuit-breaker)和保險絲類似，保險絲在發生危險時將會燒斷以保護電路，而迴路器可以在達到我們設定的閥值時觸發短路(比如請求失敗率達到50%)，拒絕執行任何請求。

如果迴路器被打開，Hystrix將不會執行命令，直接進入Fallback處理邏輯。

檢查線程池/信號量/隊列情況 Hystrix 隔離方式有線程池隔離和信號量隔離。當使用Hystrix線程池時，Hystrix 默認為每個依賴服務分配10個線程，當10個線程都繁忙時，將拒絕執行命令,，而是立即跳到執行fallback邏輯。

執行具體的任務通過HystrixObservableCommand.construct() 或者 HystrixCommand.run() 來運行用戶真正的任務。

計算迴路健康情況每次開始執行command、結束執行command以及發生異常等情況時，都會記錄執行情況，例如：成功、失敗、拒絕和超時等指標情況，會定期處理這些數據，再根據設定的條件來判斷是否開啟迴路器。

命令失敗時執行Fallback邏輯在命令失敗時執行用戶指定的 Fallback 邏輯。上圖中的斷路、線程池拒絕、信號量拒絕、執行執行、執行超時都會進入Fallback處理。

返回執行結果原始對象結果將以Observable形式返回，在返回給用戶之前，會根據調用方式的不同做一些處理。

6. 延時場景處理

日常開發中，我們經常遇到這種業務場景，如：外賣訂單超30分鐘未支付，則自動取消訂單；用戶註冊成功15分鐘後，發短信消息通知用戶等等。這就是延時任務處理場景。針對此類場景我們主要有以下幾種處理方案：

JDK的DelayQueue延遲隊列

時間輪算法

數據庫定時任務（如Quartz）

Redis ZSet 實現

MQ 延時隊列實現

7.https請求過程

HTTPS = HTTP + SSL/TLS，即用SSL/TLS對數據進行加密和解密，Http進行傳輸。

SSL，即Secure Sockets Layer（安全套接層協議），是網絡通信提供安全及數據完整性的一種安全協議。

TLS，即Transport Layer Security(安全傳輸層協議)，它是SSL 3.0的後續版本。

http請求流程

用戶在瀏覽器里輸入一個https網址，然後連接到server的443端口。

服務器必須要有一套數字證書，可以自己製作，也可以向組織申請，區別就是自己頒發的證書需要客戶端驗證通過。這套證書其實就是一對公鑰和私鑰。

服務器將自己的數字證書（含有公鑰）發送給客戶端。

客戶端收到服務器端的數字證書之後，會對其進行檢查，如果不通過，則彈出警告框。如果證書沒問題，則生成一個密鑰（對稱加密），用證書的公鑰對它加密。

客戶端會發起HTTPS中的第二個HTTP請求，將加密之後的客戶端密鑰發送給服務器。

服務器接收到客戶端發來的密文之後，會用自己的私鑰對其進行非對稱解密，解密之後得到客戶端密鑰，然後用客戶端密鑰對返回數據進行對稱加密，這樣數據就變成了密文。

服務器將加密後的密文返回給客戶端。

客戶端收到服務器發返回的密文，用自己的密鑰（客戶端密鑰）對其進行對稱解密，得到服務器返回的數據。

8. 聊聊事務隔離級別，以及可重複讀實現原理 8.1 數據庫四大隔離級別

為了解決並發事務存在的髒讀、不可重複讀、幻讀等問題，數據庫大叔設計了四種隔離級別。分別是讀未提交，讀已提交，可重複讀，串行化（Serializable）。

讀未提交隔離級別：只限制了兩個數據不能同時修改，但是修改數據的時候，即使事務未提交，都是可以被別的事務讀取到的，這級別的事務隔離有髒讀、重複讀、幻讀的問題；

讀已提交隔離級別：當前事務只能讀取到其他事務提交的數據，所以這種事務的隔離級別解決了髒讀問題，但還是會存在重複讀、幻讀問題；

可重複讀：限制了讀取數據的時候，不可以進行修改，所以解決了重複讀的問題，但是讀取範圍數據的時候，是可以插入數據，所以還會存在幻讀問題；

串行化：事務最高的隔離級別，在該級別下，所有事務都是進行串行化順序執行的。可以避免髒讀、不可重複讀與幻讀所有並發問題。但是這種事務隔離級別下，事務執行很耗性能。

四大隔離級別，都會存在哪些並發問題呢

隔離級別髒讀不可重複讀幻讀讀未提交√√√讀已提交×√√可重複讀××√串行化×××

8.2 Read View可見性規則

變量描述m_ids當前系統中那些活躍(未提交)的讀寫事務ID, 它數據結構為一個List。max_limit_id表示生成Read View時，系統中應該分配給下一個事務的id值。min_limit_id表示在生成Read View時，當前系統中活躍的讀寫事務中最小的事務id，即m_ids中的最小值。creator_trx_id創建當前Read View的事務ID

Read View的可見性規則如下：

如果數據事務ID trx_id < min_limit_id，表明生成該版本的事務在生成Read View前，已經提交(因為事務ID是遞增的)，所以該版本可以被當前事務訪問。

如果trx_id>= max_limit_id，表明生成該版本的事務在生成Read View後才生成，所以該版本不可以被當前事務訪問。

如果 min_limit_id =<trx_id< max_limit_id,需要分3種情況討論

1）如果m_ids包含trx_id,則代表Read View生成時刻，這個事務還未提交，但是如果數據的trx_id等於creator_trx_id的話，表明數據是自己生成的，因此是可見的。

2）如果m_ids包含trx_id，並且trx_id不等於creator_trx_id，則Read View生成時，事務未提交，並且不是自己生產的，所以當前事務也是看不見的；

3）如果m_ids不包含trx_id，則說明你這個事務在Read View生成之前就已經提交了，修改的結果，當前事務是能看見的。

8.3 可重複讀實現原理

數據庫是通過加鎖實現隔離級別的，比如，你想一個人靜靜，不被別人打擾，你可以把自己關在房子，並在房門上加上一把鎖！串行化隔離級別就是加鎖實現的。但是如果頻繁加鎖，性能會下降。因此設計數據庫的大叔想到了MVCC。

可重複讀的實現原理就是MVCC多版本並發控制。在一個事務範圍內，兩個相同的查詢，讀取同一條記錄，卻返回了不同的數據，這就是不可重複讀。可重複讀隔離級別，就是為了解決不可重複讀問題。

查詢一條記錄，基於MVCC，是怎樣的流程呢？

獲取事務自己的版本號，即事務ID

獲取Read View

查詢得到的數據，然後Read View中的事務版本號進行比較。

如果不符合Read View的可見性規則，即就需要Undo log中歷史快照;

最後返回符合規則的數據

InnoDB 實現MVCC，是通過Read View+ Undo Log實現的，Undo Log保存了歷史快照，Read View可見性規則幫助判斷當前版本的數據是否可見。

可重複讀（RR）隔離級別，是如何解決不可重複讀問題的？

假設存在事務A和B，SQL執行流程如下

圖片

在可重複讀（RR）隔離級別下，一個事務里只會獲取一次read view，都是副本共用的，從而保證每次查詢的數據都是一樣的。

假設當前有一張core_user表，插入一條初始化數據,如下：

圖片

基於MVCC，我們來看看執行流程

A開啟事務，首先得到一個事務ID為100

B開啟事務，得到事務ID為101

事務A生成一個Read View，read view對應的值如下

變量值m_ids100，101max_limit_id102min_limit_id100creator_trx_id100

然後回到版本鏈：開始從版本鏈中挑選可見的記錄：

圖片

由圖可以看出，最新版本的列name的內容是孫權，該版本的trx_id值為100。開始執行read view可見性規則校驗：

min_limit_id(100)=<trx_id（100）<102;creator_trx_id=trx_id=100;

由此可得，trx_id=100的這個記錄，當前事務是可見的。所以查到是name為孫權的記錄。

事務B進行修改操作，把名字改為曹操。把原數據拷貝到undo log,然後對數據進行修改，標記事務ID和上一個數據版本在undo log的地址。

圖片

事務B提交事務

事務A再次執行查詢操作，因為是RR（可重複讀）隔離級別，因此會復用老的Read View副本，Read View對應的值如下

變量值m_ids100，101max_limit_id102min_limit_id100creator_trx_id100

然後再次回到版本鏈：從版本鏈中挑選可見的記錄：

圖片

從圖可得，最新版本的列name的內容是曹操，該版本的trx_id值為101。開始執行read view可見性規則校驗：

min_limit_id(100)=<trx_id（101）<max_limit_id（102);因為m_ids{100,101}包含trx_id（101），並且creator_trx_id(100)不等於trx_id（101）

所以，trx_id=101這個記錄，對於當前事務是不可見的。這時候呢，版本鏈roll_pointer跳到下一個版本，trx_id=100這個記錄，再次校驗是否可見：

min_limit_id(100)=<trx_id（100）<max_limit_id（102);因為m_ids{100,101}包含trx_id（100），並且creator_trx_id(100)等於trx_id（100）

所以，trx_id=100這個記錄，對於當前事務是可見的，所以兩次查詢結果，都是name=孫權的那個記錄。即在可重複讀（RR）隔離級別下，復用老的Read View副本，解決了不可重複讀的問題。

9. 聊聊索引在哪些場景下會失效？

1. 查詢條件包含or，可能導致索引失效

2. 如何字段類型是字符串，where時一定用引號括起來，否則索引失效

3. like通配符可能導致索引失效。

4. 聯合索引，查詢時的條件列不是聯合索引中的第一個列，索引失效。

5. 在索引列上使用mysql的內置函數，索引失效。

6. 對索引列運算（如，+、-、*、/），索引失效。

7. 索引字段上使用（！= 或者 < >，not in）時，可能會導致索引失效。

8. 索引字段上使用is null， is not null，可能導致索引失效。

9. 左連接查詢或者右連接查詢查詢關聯的字段編碼格式不一樣，可能導致索引失效。

10. mysql估計使用全表掃描要比使用索引快,則不使用索引。

10. 什麼是虛擬內存

虛擬內存，是虛擬出來的內存，它的核心思想就是確保每個程序擁有自己的地址空間，地址空間被分成多個塊，每一塊都有連續的地址空間。同時物理空間也分成多個塊，塊大小和虛擬地址空間的塊大小一致，操作系統會自動將虛擬地址空間映射到物理地址空間，程序只需關注虛擬內存，請求的也是虛擬內存，真正使用卻是物理內存。

現代操作系統使用虛擬內存，即虛擬地址取代物理地址，使用虛擬內存可以有2個好處：

虛擬內存空間可以遠遠大於物理內存空間

多個虛擬內存可以指向同一個物理地址

零拷貝實現思想，就利用了虛擬內存這個點：多個虛擬內存可以指向同一個物理地址，可以把內核空間和用戶空間的虛擬地址映射到同一個物理地址，這樣的話，就可以減少IO的數據拷貝次數啦，示意圖如下：

圖片11. 排行榜的實現，比如高考成績排序

排行版的實現，一般使用redis的zset數據類型。

使用格式如下：

zaddkeyscoremember[scoremember...]，zrankkeymember

層內部編碼：ziplist（壓縮列表）、skiplist（跳躍表）

使用場景如排行榜，社交需求（如用戶點讚）

實現demo如下：

圖片12.分布式鎖實現

分布式鎖，是控制分布式系統不同進程共同訪問共享資源的一種鎖的實現。秒殺下單、搶紅包等等業務場景，都需要用到分布式鎖，我們項目中經常使用Redis作為分布式鎖。

選了Redis分布式鎖的幾種實現方法，大家來討論下，看有沒有啥問題哈。

命令setnx + expire分開寫

setnx + value值是過期時間

set的擴展命令（set ex px nx）

set ex px nx + 校驗唯一隨機值,再刪除

Redisson

12.1 命令setnx + expire分開寫if（jedis.setnx(key,lock_value)==1）{//加鎖expire（key，100）;//設置過期時間try{dosomething//業務請求}catch(){}finally{jedis.del(key);//釋放鎖}}

如果執行完setnx加鎖，正要執行expire設置過期時間時，進程crash掉或者要重啟維護了，那這個鎖就「長生不老」了，別的線程永遠獲取不到鎖啦，所以分布式鎖不能這麼實現。

12.2 setnx + value值是過期時間longexpires=System.currentTimeMillis()+expireTime;//系統時間+設置的過期時間StringexpiresStr=String.valueOf(expires);//如果當前鎖不存在，返回加鎖成功if(jedis.setnx(key,expiresStr)==1){returntrue;}//如果鎖已經存在，獲取鎖的過期時間StringcurrentValueStr=jedis.get(key);//如果獲取到的過期時間，小於系統當前時間，表示已經過期if(currentValueStr!=null&&Long.parseLong(currentValueStr)<System.currentTimeMillis()){//鎖已過期，獲取上一個鎖的過期時間，並設置現在鎖的過期時間（不了解redis的getSet命令的小夥伴，可以去官網看下哈）StringoldValueStr=jedis.getSet(key_resource_id,expiresStr);if(oldValueStr!=null&&oldValueStr.equals(currentValueStr)){//考慮多線程並發的情況，只有一個線程的設置值和當前值相同，它才可以加鎖returntrue;}}//其他情況，均返回加鎖失敗returnfalse;}

筆者看過有開發小夥伴就是這麼實現分布式鎖的，但是這種方案也有這些缺點：

過期時間是客戶端自己生成的，分布式環境下，每個客戶端的時間必須同步。

沒有保存持有者的唯一標識，可能被別的客戶端釋放/解鎖。

鎖過期的時候，並發多個客戶端同時請求過來，都執行了jedis.getSet()，最終只能有一個客戶端加鎖成功，但是該客戶端鎖的過期時間，可能被別的客戶端覆蓋。

12.3 set的擴展命令（set ex px nx）（注意可能存在的問題）if（jedis.set(key,lock_value,"NX","EX",100s)==1）{//加鎖try{dosomething//業務處理}catch(){}finally{jedis.del(key);//釋放鎖}}

這個方案可能存在這樣的問題：

鎖過期釋放了，業務還沒執行完。

鎖被別的線程誤刪。

12.4 set ex px nx + 校驗唯一隨機值,再刪除if（jedis.set(key,uni_request_id,"NX","EX",100s)==1）{//加鎖try{dosomething//業務處理}catch(){}finally{//判斷是不是當前線程加的鎖,是才釋放if(uni_request_id.equals(jedis.get(key))){jedis.del(key);//釋放鎖}}}

在這裡，判斷當前線程加的鎖和釋放鎖是不是一個原子操作。如果調用jedis.del()釋放鎖的時候，可能這把鎖已經不屬於當前客戶端，會解除他人加的鎖。

一般也是用lua腳本代替。lua腳本如下：

ifredis.call('get',KEYS[1])==ARGV[1]thenreturnredis.call('del',KEYS[1])elsereturn0end;

這種方式比較不錯了，一般情況下，已經可以使用這種實現方式。但是存在鎖過期釋放了，業務還沒執行完的問題（實際上，估算個業務處理的時間，一般沒啥問題了）。

12.5 Redisson

分布式鎖可能存在鎖過期釋放，業務沒執行完的問題。有些小夥伴認為，稍微把鎖過期時間設置長一些就可以啦。其實我們設想一下，是否可以給獲得鎖的線程，開啟一個定時守護線程，每隔一段時間檢查鎖是否還存在，存在則對鎖的過期時間延長，防止鎖過期提前釋放。

當前開源框架Redisson就解決了這個分布式鎖問題。我們一起來看下Redisson底層原理是怎樣的吧：

圖片

只要線程一加鎖成功，就會啟動一個watch dog看門狗，它是一個後台線程，會每隔10秒檢查一下，如果線程1還持有鎖，那麼就會不斷的延長鎖key的生存時間。因此，Redisson就是使用Redisson解決了鎖過期釋放，業務沒執行完問題。

13. 零拷貝

零拷貝就是不需要將數據從一個存儲區域複製到另一個存儲區域。它是指在傳統IO模型中，指CPU拷貝的次數為0。它是IO的優化方案

傳統IO流程

零拷貝實現之mmap+write

零拷貝實現之sendfile

零拷貝實現之帶有DMA收集拷貝功能的sendfile

13.1 傳統IO流程

流程圖如下：

圖片

用戶應用進程調用read函數，向操作系統發起IO調用，上下文從用戶態轉為內核態（切換1）

DMA控制器把數據從磁盤中，讀取到內核緩衝區。

CPU把內核緩衝區數據，拷貝到用戶應用緩衝區，上下文從內核態轉為用戶態（切換2），read函數返回

用戶應用進程通過write函數，發起IO調用，上下文從用戶態轉為內核態（切換3）

CPU將應用緩衝區中的數據，拷貝到socket緩衝區

DMA控制器把數據從socket緩衝區，拷貝到網卡設備，上下文從內核態切換回用戶態（切換4），write函數返回

從流程圖可以看出，傳統IO的讀寫流程，包括了4次上下文切換（4次用戶態和內核態的切換），4次數據拷貝（兩次CPU拷貝以及兩次的DMA拷貝)。

13.2 mmap+write實現的零拷貝

mmap 的函數原型如下：

void*mmap(void*addr,size_tlength,intprot,intflags,intfd,off_toffset);

addr：指定映射的虛擬內存地址

length：映射的長度

prot：映射內存的保護模式

flags：指定映射的類型

fd:進行映射的文件句柄

offset:文件偏移量

mmap使用了虛擬內存，可以把內核空間和用戶空間的虛擬地址映射到同一個物理地址，從而減少數據拷貝次數！

mmap+write實現的零拷貝流程如下：

圖片

用戶進程通過mmap方法向操作系統內核發起IO調用，上下文從用戶態切換為內核態。

CPU利用DMA控制器，把數據從硬盤中拷貝到內核緩衝區。

上下文從內核態切換回用戶態，mmap方法返回。

用戶進程通過write方法向操作系統內核發起IO調用，上下文從用戶態切換為內核態。

CPU將內核緩衝區的數據拷貝到的socket緩衝區。

CPU利用DMA控制器，把數據從socket緩衝區拷貝到網卡，上下文從內核態切換回用戶態，write調用返回。

可以發現，mmap+write實現的零拷貝，I/O發生了4次用戶空間與內核空間的上下文切換，以及3次數據拷貝。其中3次數據拷貝中，包括了2次DMA拷貝和1次CPU拷貝。

mmap是將讀緩衝區的地址和用戶緩衝區的地址進行映射，內核緩衝區和應用緩衝區共享，所以節省了一次CPU拷貝『』並且用戶進程內存是虛擬的，只是映射到內核的讀緩衝區，可以節省一半的內存空間。

sendfile實現的零拷貝

sendfile是Linux2.1內核版本後引入的一個系統調用函數，API如下：

ssize_tsendfile(intout_fd,intin_fd,off_t*offset,size_tcount);

out_fd:為待寫入內容的文件描述符，一個socket描述符。，

in_fd:為待讀出內容的文件描述符，必須是真實的文件，不能是socket和管道。

offset：指定從讀入文件的哪個位置開始讀，如果為NULL，表示文件的默認起始位置。

count：指定在fdout和fdin之間傳輸的字節數。

sendfile表示在兩個文件描述符之間傳輸數據，它是在操作系統內核中操作的，避免了數據從內核緩衝區和用戶緩衝區之間的拷貝操作，因此可以使用它來實現零拷貝。

sendfile實現的零拷貝流程如下：

sendfile實現的零拷貝

用戶進程發起sendfile系統調用，上下文（切換1）從用戶態轉向內核態

DMA控制器，把數據從硬盤中拷貝到內核緩衝區。

CPU將讀緩衝區中數據拷貝到socket緩衝區

DMA控制器，異步把數據從socket緩衝區拷貝到網卡，

上下文（切換2）從內核態切換回用戶態，sendfile調用返回。

可以發現，sendfile實現的零拷貝，I/O發生了2次用戶空間與內核空間的上下文切換，以及3次數據拷貝。其中3次數據拷貝中，包括了2次DMA拷貝和1次CPU拷貝。那能不能把CPU拷貝的次數減少到0次呢？有的，即帶有DMA收集拷貝功能的sendfile！

sendfile+DMA scatter/gather實現的零拷貝

linux 2.4版本之後，對sendfile做了優化升級，引入SG-DMA技術，其實就是對DMA拷貝加入了scatter/gather操作，它可以直接從內核空間緩衝區中將數據讀取到網卡。使用這個特點搞零拷貝，即還可以多省去一次CPU拷貝。

sendfile+DMA scatter/gather實現的零拷貝流程如下：

圖片

用戶進程發起sendfile系統調用，上下文（切換1）從用戶態轉向內核態

DMA控制器，把數據從硬盤中拷貝到內核緩衝區。

CPU把內核緩衝區中的文件描述符信息（包括內核緩衝區的內存地址和偏移量）發送到socket緩衝區

DMA控制器根據文件描述符信息，直接把數據從內核緩衝區拷貝到網卡

上下文（切換2）從內核態切換回用戶態，sendfile調用返回。

可以發現，sendfile+DMA scatter/gather實現的零拷貝，I/O發生了2次用戶空間與內核空間的上下文切換，以及2次數據拷貝。其中2次數據拷貝都是包DMA拷貝。這就是真正的零拷貝（Zero-copy) 技術，全程都沒有通過CPU來搬運數據，所有的數據都是通過DMA來進行傳輸的。

14. synchronized

synchronized是Java中的關鍵字，是一種同步鎖。synchronized關鍵字可以作用於方法或者代碼塊。

一般面試時。可以這麼回答：

反編譯後，monitorenter、monitorexit、ACC_SYNCHRONIZED

monitor監視器

Java Monitor 的工作機理

對象與monitor關聯

14.1 monitorenter、monitorexit、ACC_SYNCHRONIZED

如果synchronized作用於代碼塊，反編譯可以看到兩個指令：monitorenter、monitorexit，JVM使用monitorenter和monitorexit兩個指令實現同步；如果作用synchronized作用於方法,反編譯可以看到ACCSYNCHRONIZED標記，JVM通過在方法訪問標識符(flags)中加入ACCSYNCHRONIZED來實現同步功能。

同步代碼塊是通過monitorenter和monitorexit來實現，當線程執行到monitorenter的時候要先獲得monitor鎖，才能執行後面的方法。當線程執行到monitorexit的時候則要釋放鎖。

同步方法是通過中設置ACCSYNCHRONIZED標誌來實現，當線程執行有ACCSYNCHRONIZED標誌的方法，需要獲得monitor鎖。每個對象都與一個monitor相關聯，線程可以占有或者釋放monitor。

14.2 monitor監視器

monitor是什麼呢？操作系統的管程（monitors）是概念原理，ObjectMonitor是它的原理實現。

圖片

在Java虛擬機（HotSpot）中，Monitor（管程）是由ObjectMonitor實現的，其主要數據結構如下：

ObjectMonitor(){_header=NULL;_count=0;//記錄個數_waiters=0,_recursions=0;_object=NULL;_owner=NULL;_WaitSet=NULL;//處於wait狀態的線程，會被加入到_WaitSet_WaitSetLock=0;_Responsible=NULL;_succ=NULL;_cxq=NULL;FreeNext=NULL;_EntryList=NULL;//處於等待鎖block狀態的線程，會被加入到該列表_SpinFreq=0;_SpinClock=0;OwnerIsThread=0;}

ObjectMonitor中幾個關鍵字段的含義如圖所示：

圖片14.3 Java Monitor 的工作機理

圖片

想要獲取monitor的線程,首先會進入_EntryList隊列。

當某個線程獲取到對象的monitor後,進入Owner區域，設置為當前線程,同時計數器count加1。

如果線程調用了wait()方法，則會進入WaitSet隊列。它會釋放monitor鎖，即將owner賦值為null,count自減1,進入WaitSet隊列阻塞等待。

如果其他線程調用 notify() / notifyAll() ，會喚醒WaitSet中的某個線程，該線程再次嘗試獲取monitor鎖，成功即進入Owner區域。

同步方法執行完畢了，線程退出臨界區，會將monitor的owner設為null，並釋放監視鎖。

14.4 對象與monitor關聯

圖片

在HotSpot虛擬機中,對象在內存中存儲的布局可以分為3塊區域：對象頭（Header），實例數據（Instance Data）和對象填充（Padding）。

對象頭主要包括兩部分數據：Mark Word（標記字段）、Class Pointer（類型指針）。

Mark Word 是用於存儲對象自身的運行時數據，如哈希碼（HashCode）、GC分代年齡、鎖狀態標誌、線程持有的鎖、偏向線程 ID、偏向時間戳等。

圖片

重量級鎖，指向互斥量的指針。其實synchronized是重量級鎖，也就是說Synchronized的對象鎖，Mark Word鎖標識位為10，其中指針指向的是Monitor對象的起始地址。

15. 分布式id生成方案有哪些？什麼是雪花算法？

分布式id生成方案主要有：

UUID

數據庫自增ID

基於雪花算法（Snowflake）實現

百度（Uidgenerator）

美團（Leaf）

什麼是雪花算法？

雪花算法是一種生成分布式全局唯一ID的算法，生成的ID稱為Snowflake IDs。這種算法由Twitter創建，並用於推文的ID。

一個Snowflake ID有64位。

第1位：Java中long的最高位是符號位代表正負，正數是0，負數是1，一般生成ID都為正數，所以默認為0。

接下來前41位是時間戳，表示了自選定的時期以來的毫秒數。

接下來的10位代表計算機ID，防止衝突。

其餘12位代表每台機器上生成ID的序列號，這允許在同一毫秒內創建多個Snowflake ID。

雪花算法

圖解系列文章：

小林的網站上線啦！

小林的圖解系統，大曝光！

不鴿了，小林的「圖解網絡 3.0 」發布！

撿田螺的小男孩

鑽石舞台

鑽石舞台發表在痞客邦留言(0) 人氣()

全站分類：不設分類
個人分類：不設分類
此分類上一篇：安在 - 在看 | 國家網信辦修訂《移動互聯網應用程序信息服務管理規定》發布施行
此分類下一篇：小林coding - 經典書《Java核心技術》，再次升級！
上一篇：安在 - 在看 | 國家網信辦修訂《移動互聯網應用程序信息服務管理規定》發布施行
下一篇：小林coding - 經典書《Java核心技術》，再次升級！

鑽石舞台

鑽石鑽石亮晶晶

小林coding - 去蝦皮面試，被問麻了。。。

歷史上的今天

留言列表

文章搜尋

最新文章

熱門文章

誰來我家

參觀人氣

鑽石舞台

鑽石鑽石亮晶晶

小林coding - 去蝦皮面試，被問麻了。。。

歷史上的今天

留言列表

文章搜尋

最新文章

熱門文章

誰來我家

參觀人氣

贊助商連結