Bài viết được sự cho phép của tác giả Kiên Nguyễn
Gì chứ nhắc tới Transaction Processing thì không một Software Engineer nào là không hiểu tường, hiểu tận. Biết có thể chỉ là một phần kiến thức nhỏ, nhưng những khái niệm đặc biệt như transaction cần phải nắm thật vững.
Bài viết này cung cấp một cái nhìn toàn diện, từ cơ bản cho tới nâng cao về Transaction Processing. Thứ được biết đến như là khái niệm cốt lỗi của Database actions, Payment Steps,…
Bắt đầu ngay thôi!
1. Transaction là gì?
Rõ luôn là phải hiểu transaction là gì trước khi bắt tay vào tìm hiểu Transaction Processing. Ok, khái niệm. Có 3 thứ cần nhớ.
A unit of information processing that is indivisible.
Transaction là một đơn vị của “tiến trình xử lý thông tin” không thể phân chia
Đọc rõ khó hiểu, nhưng túm cái váy lại: transaction là một đơn vị, nó độc lập và không thể chia nhỏ hơn được.
It must either success or fail as a complete unit.
Nó phải thành công hoặc thất bại như là một đơn vị hoàn chỉnh
Đã nhắc tới transaction processing thì lúc kết thúc process, transaction nhất định phải có kết quả là thành công (sucess) hoặc thất bại (fail). Các transaction pending ta thường thấy cũng là đang quá trình chờ đợi. Nói về status khi kết thúc transaction, luôn nhớ rằng một là thành công hai là thất bại. Không có chuyện giữa giữa.
It can never only partically complete.
Transaction không bao giờ hoàn thành một phần
Ví dụ như giao dịch ở ngân hàng. Nếu success -> tiền chuyển đi, nếu fail -> thực hiện transaction mới. Giao dịch kiểu transaction không bao giờ có chuyện thành công một nửa, hoặc chỉ thất bại ở một step nào đó.
Đã fail dù chỉ một tiến trình nhỏ trong transaction cũng khiến cả transaction bị fail.
2. Ví dụ về Transaction Processing
Lý thuyết rõ dài, thôi thì cho xin cái ví dụ để dễ hiểu hơn.
Đây là ví dụ đơn giản nhất về mua vé máy bay. Hiện tại đang còn 5 vé có giá tốt. Mà các ông thì đã mua vé rồi, giờ làm sao để mua được vé giá tốt?.
Có 3 bước phải tiến hành như sau:
- 1. Trả lại vé cũ đã mua với giá hơi chát.
- 2. Cập nhật số lượng chuyến bay còn giảm giá khi đã mua.
- 3. Thanh toán vé đã mua với số tiền “thơm”.
Hoàn thành cả 3 bước được gọi là một transaction. Trường hợp này, trong một unit, ta phải thực hiện thành công cả 3 actions. Chỉ một trong đó fail cũng khiến transaction thất bại -> vé không mua được.
Ví dụ thì dễ hiểu rồi, giờ tới vấn đề của chữ Processing.
3. Transaction process được hiện thực như thế nào?
Nhắc tới transaction mà focus vào process thì luôn phải nhớ “Two Phase Commit”. Từ khóa này đặc biệt quan trọng, cũng là thứ để biết Sofware Engineer đã hiểu rõ về Transaction Processing hay chưa.
Phase ở đây mang nghĩa là “giai đoạn”, một transaction sẽ trải qua hai giai đoạn để hoàn thành.
3.1 Commit request
Giả sử ta có 3 database A,B và C. Thiết kế cho Scalable Web Application chẳng hạn. Bước đầu tiên của Two Phase Commit là “Commit Request”.
Ở bước này, services hay workers sẽ gửi request tới từng database A,B,C. Request này gần giống như request thật về nội dung. Nói vậy nghĩa là sao.
Khi nhận được request từ phase 1 -> tất cả đều thực hiện thử cập nhật. Trả kết quả về cho services.
3.2 Commit
Sau khi kết thúc Commit Request và nhận về được tất cả kết quả từ A,B,C (Return Result). Process Commit sẽ đưa ra phán định cho biết commit của Transaction Processing có thành công hay không?.
Nếu cả 3 đều PASS -> Rõ ràng là transaction thành công. Trường hợp một trong 3 fail -> transaction sẽ phán định fail và thực hiện xử lý tiếp theo.
Xử lý tiếp theo ở đây là rollback. Từ rollback thì quen quá rồi.
Trường hợp thất bại, tất nhiên ta không muốn bất cứ dòng dữ liệu nào xuất hiện ở A và B, mặc dù Commit Request báo PASS. Lúc này phase số 3 (có phase 3 tuy nhiên vẫn gọi Two-phase vì nó là chính).
Việc thực hiện Commit Request để lấy result tất nhiên không thực hiện luôn ở Global Database. Sau khi có kết quả Success -> Global sẽ trả lại data như ban đầu trước khi gửi request success.
- After receiving notice from the global coordinator that all nodes have committed, the commit point site erases status information about this transaction. – Sau khi nhận được thông báo từ Global rằng tất cả được commit, thông báo cuối cùng về trạng thái commit được trả về.
- The commit point site informs the global coordinator that it has erased the status information. – Global lúc này sẽ xóa đi thông tin commit
- The global coordinator erases its own information about the transaction. – Sau đó cũng xóa luôn đi thông tin của cả transaction.
4. Tham khảo
- Two-Phase Commit Mechanism
- Two-Phase Commit (2PC)
- Reducing the Blocking in Two-Phase Commit Protocol Employing Backup Sites
Thank you for your attention – Have a good day. Happy Coding!
Bài viết gốc được đăng tải tại kieblog.vn
Có thể bạn quan tâm:
- NoSQL Key Value Stores must know
- Distributed Data Processing using MapReduce
- Modern C++ binary RPC framework gọn nhẹ, không cần code generation
Xem thêm Việc làm Developer hấp dẫn trên TopDev