Câu hỏi phỏng vấn Database Developer/ Database Administrator thường gặp

2543

Với sự phát triển của công nghệ, trí thông minh nhân tạo AI và dữ liệu lớn Big Data thì ngành lập trình viên cơ sở dữ liệu Database Developer đang trở nên hot với nhu cầu tuyển dụng và chỗ độ đãi ngộ cao từ các công ty, doanh nghiệp. Hôm nay chúng ta cùng nhau điểm qua danh sách những câu hỏi cho vị trí Database Developer/ Database Administrator thường gặp để có thể chuẩn bị tốt nhất cho buổi phỏng vấn của mình nhé.

Database là gì? Phân loại database

Database hay cơ sở dữ liệu là một tập hợp có tổ chức các thông tin có cấu trúc hoặc dữ liệu, thường được lưu trữ trực tuyến trong một hệ thống máy tính. Đối với các cơ sở dữ liệu phức tạp, chúng sẽ được phát triển bằng cách sử dụng các kỹ thuật thiết kế và mô hình hóa để đáp ứng yêu cầu về nghiệp vụ cùng khả năng mở rộng về sau.

Để phân loại Database chúng ta có nhiều cách, mặc dù vậy thì thường sẽ dựa theo mục đích sử dụng của cơ sở dữ liệu. Cụ thể:

  • Database dạng file: dữ liệu được lưu trữ dưới dạng file như .mdb, .dbf,…
  • Database quan hệ: dữ liệu được lưu trữ trong các bảng dữ liệu có mối liên hệ với nhau. Các hệ quản trị CSDL phổ biến như MySQL, MS SQL, Oracle, …
  • Database hướng đối tượng: giống như CSDL quan hệ thì dữ liệu được lưu vào các bảng, nhưng đối tượng Database hướng đối tượng thì các bảng sẽ có thêm các tính năng hướng đối tượng ví dụ như lưu trữ thêm một số hành vi của đối tượng.
  • Database bán cấu trúc: dữ liệu được lưu trữ dưới dạng XML, thông tin được trình bày trong các thẻ tags. Ưu điểm của loại CSDL này là khả năng lưu trữ được nhiều loại data khác nhau.

Phân biệt SQL và NoSQL

SQL viết tắt của Structured Query Language – Ngôn ngữ truy vấn có cấu trúc là ngôn ngữ chuẩn để xử lý cơ sở dữ liệu quan hệ. Các hệ quản trị cơ sở dữ liệu quan hệ phổ biến như MySQL, Oracle, MS SQL Server, … sử dụng SQL cho các thao tác thêm mới, tìm kiếm, câp nhật, xóa (CRUD) các bản ghi cơ sở dữ liệu.

SQL và NoSQL
Nguồn: https://www.scalablepath.com/back-end/sql-vs-nosql

Ngược lại thì NoSQL không sử dụng SQL cho việc truy vấn, thao tác với dữ liệu và được sử dụng với loại cơ sở dữ liệu phân tán (distributed) và không ràng buộc (non-relational). NoSQL được phát triển dựa trên nhu cầu về việc Database hiện nay cần khả năng lưu trữ dữ liệu cực lớn, truy vấn dữ liệu tốc độ cao mà không đòi hỏi quá nhiều về năng lực phần cứng. Một số hệ quản trị CSDL NoSQL phổ biến như MongoDB, Redis, Neo4j, Hbase, …

Đối với một dự án, nếu có yêu cầu dữ liệu rõ ràng, xác định quan hệ logic từ trước thì lựa chọn SQL là hợp lý. Ngược lại, với các dự án mà yêu cầu dữ liệu không liên quan, khó xác định, đơn giản mềm dẻo khi đang phát triển thì chúng ta nên cân nhắc NoSQL.

  Hướng dẫn xử lý database trong Spring MVC 5 với Hibernate

Mô tả quy trình ETL tải kho dữ liệu

ETL là quá trình kết hợp dữ liệu từ nhiều nguồn thành một kho lưu trữ lớn trung tâm được gọi là kho dữ liệu. Đây cũng là một công việc dành cho Database Developer nhằm mang lại lợi ích thu thập thông tin kinh doanh, khách hàng, nội bộ, … cho doanh nghiệp. Tùy từng tổ chức, công ty sẽ có những quy trình áp dụng cụ thể chi tiết dành cho việc này nhưng sẽ đều đảm bảo cơ bản gồm ba bước sau:

  • Bước 1: Trích xuất dữ liệu có liên quan từ cơ sở dữ liệu nguồn
  • Bước 2: Chuyển đổi dữ liệu để phù hợp hơn cho việc phân tích
  • Bước 3: Tải dữ liệu vào cơ sở dữ liệu đích

Data Warehouse là gì? Các loại Data Warehouse

Data Warehouse hay kho dữ liệu là một cơ sở dữ liệu được thiết kế để hỗ trợ việc truy vấn và phân tích dữ liệu cho mục đích thống kê và phân tích kinh doanh; trong thực tế nó thường được sử dụng để lưu trữ dữ liệu lịch sử và dữ liệu hiện tại của tổ chức, doanh nghiệp và cho phép người dùng truy vấn và thống kê dữ liệu theo nhiều cách khác nhau.

  Database Seeding là gì?

Data Warehouse

Các loại Data Warehouse thường được sử dụng bao gồm:

  • Cloud data warehouse: kho dữ liệu đám mây – hoạt động lưu trữ điện toán đám mây (Cloud Computing) cung cấp cho khách hàng như một dịch vụ được quản lý
  • Data warehouse software: phần mềm kho dữ liệu – doanh nghiệp sẽ mua giấy phép (licenses) để sử dụng kho dữ liệu và triển khai cơ sở hạ tầng tại trụ sở của họ.
  • Data warehouse appliance: kho dữ liệu thiết bị – là một gói phần cứng kết hợp phần mềm tích hợp sẵn. Nó sử dụng hệ điều hành, phần mềm kho dữ liệu mà một doanh nghiệp có thể kết nối với mạng của nó và bắt đầu sử dụng.

Xem thêm Việc làm database hấp dẫn trên TopDev

Làm thế nào để đảm bảo an toàn khi dịch chuyển dữ liệu

Khi khách hàng muốn dịch chuyển dữ liệu giữa các vị trí hay chuyển đổi sang các định dạng khác thì vấn đề an toàn thông tin cho cơ sở dữ liệu là ưu tiên hàng đầu. Để tăng khả năng đảm bảo an toàn dữ liệu, cần tuần thủ các nội dung như sau:

  • Đảm bảo tất cả dữ liệu được mã hóa an toàn trước khi dịch chuyển
  • Xác nhận vị trí của dữ liệu quan trọng
  • Lập kế hoạch di chuyển theo giai đoạn gồm trích xuất, chuyển đổi và truyền tải
  • Sao lưu dữ liệu trước tiên
  • Duy trì các yêu cầu tuân thủ và truy cập cần thiết
  • Cắt giảm rủi ro khi di chuyển dữ liệu

Các chứng chỉ Database Administrator phổ biến

Đối với lập trình viên Database thì các chứng chỉ phổ biến nhất được cấp bởi Microsoft và Oracle chứng nhận kĩ năng, kinh nghiệm làm việc trên các hệ thống quản trị cơ sở dữ liệu của 2 ông lớn này:

  • Microsoft DP-900 Exam: Microsoft Azure Data Fundamentals
  • Microsoft Certified: Azure for SAP Workloads Specialty
  • Microsoft Certified: Azure Database Administrator Associate
  • Oracle Database PL/SQL Developer Certified Professional
  • Oracle Certified Professional MySQL 8.0 Database Administrator

Azure for SAP Workloads Specialty

Ngoài ra còn 1 số chứng chỉ dành cho các hệ thống Database khác như:

  • MongoDB Associate DBA Exam
  • Teradata Vantage Developer Exam
  • EDB PostgreSQL 12 Associate Certification
  • SAP Certified Development Associate – SAP HANA 2.0 SPS05

Kết bài

Trên đây là danh sách những câu hỏi phỏng vấn thường gặp cho vị trí Database Developer/ Database Administrator. Hy vọng bài viết hữu ích dành cho bạn, hẹn gặp lại các bạn trong các bài viết tiếp theo của mình.

Tác giả: Phạm Minh Khoa

Có thể bạn quan tâm: