TopDev
job-image
AI Engineer (Speech Processing)Login to view salary
Quận Cầu Giấy, Hà Nội
Junior, Middle Fulltime1 năm
Application deadline: 03-12-2025

Aimesoft là nơi quy tụ những chuyên gia ứng dụng AI nhằm giải quyết những vấn đề thực tiễn. Sứ mệnh của Aimesoft là đồng hành trong đời sống con người thông qua các ứng dụng trí tuệ nhân tạo đa thể thức chân thực và sống động. Tài sản lớn nhất của Aimesoft là đội ngũ hơn 50 chuyên gia và kĩ sư nghiên cứu với nền tảng lập trình vững chắc và kinh nghiệm thực chiến các dự án “khó nhằn”. Dưới dự dẫn dắt của TS. Nguyễn Tuấn Đức (CEO) và cố vấn của các chuyên gia đến từ Đại học Tokyo, Nhật Bản, Aimesoft đang có những bước chuyển mình mạnh mẽ nhằm khẳng định vị trí số 1 về cung cấp giải pháp ứng dụng Trí tuệ nhân tạo.

Hiện tại, Aimesoft đang tìm kiếm các Kỹ sư xử lý tiếng nói (Speech Processing Engineer) và nhiều vị trí khác để tham gia vào đội ngũ kĩ sư tài năng của chúng tôi.

1
Your role & responsibilities
  • Nghiên cứu và phát triển các thuật toán Xử lý tiếng nói: xoá/lọc nhiễu, nhận dạng tiếng nói, tổng hợp tiếng nói, voice cloning, nhận diện người nói, tách tiếng (Speaker Diarization), dịch trực tiếp tiếng nói cho tiếng Nhật, Anh, Việt, Hàn.
  • Xây dựng mô hình âm học (acoustic model), mô hình ngôn ngữ (language model), decoder, tối ưu hoá từ điển, ...
  • Nghiên cứu và phát triển các mô hình Nhận dạng tiếng nói dựa trên neural networks.
  • Nghiên cứu và xây dựng các bộ cơ sở dữ liệu huấn luyện từ vựng lớn đảm bảo độ phủ về chất giọng vùng miền, độ tuổi, giới tính, môi trường... phù hợp với từng bài toán cụ thể.
  • Nghiên cứu và phát triển các mô hình học máy cho Tổng hợp tiếng nói, voice clone,voice converter... dựa trên các mô hình như HMM, DNN, Transformers.
2
Your skills & qualifications
  • Nắm được các kiến thức cơ bản về Xử lý tín hiệu số, cơ sở Toán học cho Xử lý tín hiệu số (Fast Fourier Transform, spectrogram, trích chọn đặc trưng tín hiệu, sử dụng bộ lọc tín hiệu,...)
  • Nắm được các kiến thức cơ bản về xây dựng các mô hình Nhận diện/ Tổng hợp tiếng nói (acoustic model, language model, feature bank,...)
  • Có kiến thức cơ bản về học máy, nắm được các mô hình cơ bản thường dùng trong Xử lý tiếng nói: HMM, DNN, DTW.
  • Có kiến thức cơ bản về học máy với mô hình mạng nơ-ron (neural networks), các mô hình seq2seq,…
  • Có kinh nghiệm làm việc với các Deep Learning frameworks như Pytorch hay Tensorflow.
  • Có kinh nghiệm sử dụng các framework/toolkits cho Nhận diện và Tổng hợp tiếng nói như: Kaldi, Tacotron, FastSpeech, Whisper,...
  • Lập trình hướng đối tượng thành thạo với một trong các ngôn ngữ sau : C++/C, Python, Java.
  • Tiếng Anh tốt là một lợi thế.
3
Benefits
  • Thưởng Tết và lương tháng 13.
  • Bảo hiểm, chương trình khám sức khỏe.
  • Review thường xuyên, liên tục để tăng lương dựa trên thành tích thực tế.
  • Bạn được đảm bảo xây dựng lộ trình phát triển sự nghiệp và kỹ năng ngay tại công ty, review liên tục để cập nhật tiến độ phát triển và điều chỉnh khi cần.
  • Được đào tạo, training với các khóa đào tạo miễn phí của công ty bởi các giảng viên, chuyên gia hàng đầu.
  • Tham gia teambuilding, du lịch hằng năm.
  • Thời gian làm việc: từ thứ 2 - thứ 6 (8h30 -18h00). Không OT.
  • Address: 10F, Viet A Tower, 9 Duy Tan Street, Cau Giay, Hanoi, Vietnam.
More jobs for you
job-image
Login to view salary
job-image
Login to view salary
job-image
Login to view salary
job-image
Login to view salary
job-image
Login to view salary
job-image
Login to view salary
⚙️ Candidates supporters
🧑🏾‍💻 Prepare for interviewsChecking TopDev QnA tool to practice your answers to common interview questions.Read QnA for interviews