Khám phá Quy trình tuyển dụng Data Engineer

4346

Đọc bài viết dưới đây của TopDev từ kinh nghiệm của anh Calvin Cảnh Trần – Senior Data Engineer tại Grab, để hiểu rõ hơn về Quy trình và kinh nghiệm phỏng vấn Data Engineer cập nhật mới nhất trong năm 2020. 

Data Engineer (Kỹ sư dữ liệu) hiện đang là ngành phát triển và nhận được sự quan tâm lớn. Nhiều cơ hội bắt đầu mở ra cho các ứng viên theo đuổi ngành nghề này. Và để có sự chuẩn bị tốt nhất, bạn cần nắm bắt rõ quy trình tuyển dụng của vị trí này.

Cùng TopDev khám phá ngày những điều thú vị xoay quanh cuộc tuyển chọn cho vị trí Data Engineer nhé!

Những hiểu biết cơ bản về Data Engineer

Kỹ sư dữ liệu (Data Engineer) là người phát triển, xây dựng, kiểm tra và duy trì kiến trúc. Đồng thời, họ cũng là người đề xuất và đôi khi đảm nhậm việc cải thiện chất lượng dữ liệu. Để hoàn thiện và phát triển nguồn dữ liệu, nhóm những Data Engineer cần cải biến các quy trình thiết lập dữ liệu để mô hình hóa, khai thác và sản xuất dữ liệu.

Data Engineer

Nhóm các công cụ mà một Kỹ sư dữ liệu cộng tác bao gồm: SAP, Oracle, Cassandra, MySQL, Redis, Riak, PostgreSQL,…

Xét về tiềm năng phát triển, ngành Kỹ sư dữ liệu dường như phát triển mạnh mẽ hơn tại thị trường quốc tế. Tại Việt Nam, nguồn lực tuyển dụng của ngành này chưa nhiều. Mức lương trung bình dành cho vị trí này cũng lên đến $124.000/năm. Song, với những đặc thù công việc, tính khoa học thực tiễn, ngành Kỹ sư dữ liệu hứa hẹn là một ngành rất có triển vọng trong tương lai.

Quy trình tuyển dụng Data Engineer

Bài viết là những trải nghiệm thực tế của quy trính tuyển dụng vị trí Data Engineer tại thị trường quốc tế. Tại Việt Nam, việc tuyển vị trí này vẫn chưa trở thành xu hướng. Tuy nhiên, mô hình tuyển dụng vẫn đảm bảo những vòng thi cơ bản. Vì thế, bài viết này sẽ khá hữu ích cho bạn dù bạn apply vị trí tại Việt Nam hay thị trường nước ngoài.

Vòng 01 – Thách thức HackerRank

HackerRank là một trong những trang web thực hành – đánh giá coding hàng đầu hiện nay. 

Data Engineer

Nền tảng tích hợp đánh giá ứng viên IT mới TopDev x HackerRank

Bài test HackerRank sẽ được diễn ra trong vòng 90 phút, gồm 3 câu hỏi giải thuật và 1 câu SQL. Đặc biệt, chỉ các ứng viên hoàn thành trên 80% tổng số bài thi mới được nhận cơ hội tham gia vòng tiếp theo.

Các bài tập này là những thách thức được xây dựng trên nền tảng lập trình tích hợp. Thách thức được đặt ra chủ yếu tập trung vào thuật toán và cấu trúc dữ liệu đơn giản, không quá phức tạp. Các lời giải cho thách thức gửi đi sẽ được chấm tự động và kết quả được gửi về nhà tuyển dụng nhân sự IT xem xét, đánh giá.

Vòng 02 – Giải toán lập trình trên bảng trắng (Whiteboard Coding)

Khi vượt qua vòng đầu tiên, bạn sẽ tiếp tục phỏng vấn vòng 2. Ở vòng này, ứng viên sẽ được gặp trực tiếp một Engineer nào đó của công. Đồng thời, thực hiện thử thách qua 2 phần nhỏ như sau: 

Phần 1: Câu hỏi về phân tích chuyên môn

Với phần này, nhà tuyển dụng muốn đánh giá sự am hiểu của bạn về mức độ phức tạp của thuật toán; cách bạn lựa chọn, xử lý giải thuật ra sao.

  Tìm hiểu về giải thuật: Một số phương pháp sắp xếp cơ bản
  10 thuật toán hàng đầu dành cho lập trình viên

Data Engineer

Các bạn sẽ phải giải toán lập trình trên bảng trắng thông qua mã giả. Các giàm khảo – nhà tuyển dụng sẽ yêu cầu ứng viên tối ưu hóa câu trả lời của mình.

Ví dụ:

Mức độ phức tạp (Compacity) thay vì O(n)^2, nhà tuyển dụng phỏng vấn sẽ yêu cầu ứng viên tối ưu hóa thành O(nlogn) hoặc O(n).

Phần 2: Câu hỏi về thiết kế hệ thống (System Design)

Một điểm lưu ý: Phần phỏng vấn có thể thay đổi tùy vào mục đích của nhà tuyển dụng. Thông thường, 70 – 90% các thách thức sẽ rơi vào các dạng câu hỏi về kỹ thuật (Technical Questions). Cụ thể bao gồm: Câu hỏi về thuật toán (Algorithms); câu hỏi về cấu trúc dữ liệu (Data Structure);Câu hỏi về khả năng thiết kế hệ thống (System Design)

Trong phần này, giám khảo sẽ đưa ra một số bài toán kinh điển dành cho bạn như: thiết kế thang máy, thiết kế máy bán hàng tự động, tthiế kế ứng dụng uber,… Và tổng thời lượng dành cho bài test này sẽ vào khoảng 2 tiếng.

Đây đều là 2 vòng khá cơ bản mà các bạn cần phải lưu tâm. Vì hầu như nó được áp dụng cho hầu hết các vị trí: Backend, Frondend, Software Engineer,…

Vòng 03 – Phỏng vấn với Data Engineer

Sau khi vượt qua vỏng 2, ứng viên sẽ được phỏng vấn trực tiếp với Data Engineer. 

Hỏi về những trải nghiệm thực tế

Mục đích của vòng 3 chính là thảo luận để tăng sự tương tác. Đồng thời, làm rõ hơn về những mong muốn từ phía nhà tuyển dụng lẫn ứng viên.

Xem thêm: Top những câu hỏi phỏng vấn “ngược” nhà tuyển dụng 

Data Engineer

Người phỏng vấn sẽ xem xét liệu ứng viên có thật sự phù hợp với vị trí này hay không. Trong khi đó, ứng viên cũng cân nhắc về tính  việc những công việc ở công ty có đúng với những yêu cầu mà bản thân mong muốn trải nghiệm.

Người phỏng vấn sẽ hỏi ứng viên về những dự án đã từng tham gia hoặc các công việc nào mà họ tâm đắc nhất. Đây là cách khai thác các kỹ năng chuyên môn thông qua việc kích thích sự gợi nhớ đối với ứng viên.

Càng về sau, các câu hỏi ngày càng cụ thể hơn. Khả năng vận hành, tổ chức, xử lý các dự án, công việc đó ra? Hỏi càng xoáy, ứng viên càng có nhiều “đất” để thể hiện bản lĩnh của mình. Điều này cũng đồng nghĩa, nhiều ứng viên “chém gió” suốt cuộc hội thoại sẽ nhanh chóng bị loại bỏ.

Xem thêm: Kinh nghiệm Phỏng vấn Data Engineer của anh Calvin Cảnh Trần

Thách thức về lĩnh vực chuyên môn

Dường như ít nhà tuyển dụng sẽ hỏi về tool. Điều họ đặc biệt quan tâm hơn là về MapReduce. Mục đích của nhà tuyển dụng là tìm hiểu mức độ chuyên môn cách ứng viên giải quyết một vấn đề thực tế.

Xem thêm: 26 công cụ và kỹ thuật trong big data có thể bạn chưa biết

Data Engineer

Các thách thức có thể được đặt ra xoay quanh các vấn đề như sau:

1. MapReduce: Ứng viên sẽ thực hiện yêu cầu code một đoạn nhỏ trên giấy, trên máy tính hoặc thậm chí bảng trắng về MapReduce. Thách thức đặt ra: Đọc số lượng chữ xuất hiện trong một câu? 

2.Tối ưu hóa Spark Job: 1 Spark Job với 1 column với format tương đương là year/month/day. Thách thức đặt ra: Hãy chuyển sang 3 column khác nhau ngày/tháng/năm. Điều kiện đi kèm: Spark Job được xử lý trên một nguồn dữ liệu nặng 50 TB. Đồng thời, ứng viên cần đảm bảo Spark Job được chạy với thời gian ít nhất.

3. Schema: Ứng viên được cung cấp 1 schema. Và toàn bộ thông tin của schema đó. Thách thức đặt ra: Thiết kế một Data Mark hoặc Data Warehouse với các yêu cầu tương ứng a,b,c,…

Nếu vượt qua vòng 3, các ứng viên sẽ được gặp Hiring Manager. Ứng viên sẽ được đánh giá về tính cách, khả năng đồng hành và phát triển với team. Sau cùng, nhân sự liên lạc chính thức với ứng viên để thương lương về lương và kế hoạch làm việc chi tiết. 

Lời kết

Quy trình phỏng vấn tuyển dụng Data Engineer có thể thay đổi tùy vào các vị trí tuyển dụng. Nếu vị trí là fresher, kiến thức nền tảng và khả năng học hỏi sẽ được chú trọng nhiều hơn. Nếu vị trí cần tuyển là junior hoặc mid-level, tính trải nghiệm thực tế lại là yếu tố được nhà tuyển dụng ưu tiên khai thác. Do vậy, yêu cầu tuyển dụng sẽ khắc khe hơn.

TopDev hi vọng với những chia sẻ từ bài viết, các ứng viên sẽ có những hình dung cơ bản về quy trình tuyển dụng. Từ đó, các bạn sẽ có sự chuẩn bị kỹ lưỡng nhất cho cuộc phỏng vấn của mình.

Có thể bạn quan tâm

Xem thêm Top Việc làm Developer trên TopDev

Báo cáo bài viết vi phạm bản quyền>>