Khoa học dữ liệu – Đòn bẩy cho Ngân hàng 4.0 toàn diện

2562

Khoa học dữ liệu là một trong những chiếc chìa khóa giúp nhiều doanh nghiệp cũng như các tổ chức tài chính lớn như ngân hàng đột phá trong kỷ nguyên 4.0. Càng ngày việc thu thập và hiểu dữ liệu dần trở thành một kim chỉ nam giúp các doanh nghiệp tạo ra tính đột phá trong tương lai. 

Anh Nguyễn Hoàng Huy hiện đang là Giám đốc khoa học dữ liệu, và đã được trao bằng tiến sĩ ngành Khoa học máy tính của Đại học tổng hợp Greifswald. Năm 2012, anh được giải thưởng bài báo xuất sắc nhất của Hội khoa học dữ liệu CHLB Đức. Sau đó anh trở về Việt Nam tham gia nhiều công ty được đầu tư bài bản vào dữ liệu lớn.

Ứng dụng Data Science: dữ liệu là nguồn nhiên liệu cho trí tuệ nhân tạo

Theo anh, dữ liệu quan trọng như thế nào với tương lai của Digital Banking?

“Thực ra dữ liệu quan trọng trong mọi lĩnh vực nói chung, khi chúng ta phải ra quyết định chứ không chỉ với Digital Banking “

Để đơn giản chúng ta hình dung thế này: trong sinh tồn, một con khỉ tinh mắt thấy được vài nải chuối đang treo trên cây nhưng cũng thấy một con sư tử đang gần đó. Khi đó con khỉ phải tính toán các xác suất chết đói nếu không ăn chuối so với xác suất bị sư tử vồ dựa trên rất nhiều dữ liệu ví dụ như: mình cách nải chuối bao xa? cách con sư tử bao xa? bản thân có thể chạy nhanh đến đâu? sư tử có thể chạy nhanh như nào? con sư tử thức hay ngủ, có vẻ đói hay no? nải chuối đó có bao nhiêu quả, quả lớn hay nhỏ, xanh hay chín? rồi thông tin về điều kiện bên trong cơ thể, bản thân đang đói không? có cần liều lĩnh ăn những quả chuối không?. Trong tất cả các lĩnh vực, đặc biệt trong các giao dịch kinh tế, tài chính, bên sở hữu nhiều kiến thức, thông tin, dữ liệu thực tế đều có nhiều lợi thế hơn so với bên còn lại.

Như chúng ta biết, hoạt động ngân hàng diễn ra mọi lúc mọi nơi trong cuộc sống hàng ngày của khách hàng, ví dụ như giao dịch mua bán, chuyển tiền, thanh toán dịch vụ v.v, những hoạt động này được thực hiện theo thời gian thực trong nhiều bối cảnh khác nhau, thông qua nhiều dịch vụ công nghệ khác nhau. Vì vậy nếu chúng ta có những dữ liệu giàu bối cảnh đó, AI có thể hỗ trợ chúng ta để gỡ bỏ những rào cản trong gắn kết, tiếp cận khách hàng, gợi ý sản phẩm phù hợp với bối cảnh cá nhân, chuyển các quy trình thẩm định cũng như phân phối sản phẩm lên môi trường số, theo thời gian thực, khi đó việc đi đầu và mở rộng thị trường không nằm ngoài tầm tay.

“Phiên bản ngân hàng số (digital banking) 4.0, mục tiêu mà tất cả các ngân hàng ở những nước tiên tiến hiện đang hướng đến, Việt Nam cũng không nằm ngoài câu chuyện này”

Phiên bản ngân hàng tương lai chủ yếu vận hành đa kênh số, không có yêu cầu về việc phân phối sản phẩm/dịch vụ qua kênh vật lý, hướng đến trải nghiệm khách hàng trong từng bối cảnh, cá nhân hóa trải nghiệm, loại bỏ ma sát ra khỏi trải nghiệm khách hàng. Ngân hàng này sẽ vận hành dựa trên nhiên liệu là dữ liệu, nhưng không chỉ loại dữ liệu giao dịch, hay dữ liệu tham chiếu tín dụng mà các ngân hàng đang sở hữu hiện nay mà phải xoay quanh các dữ liệu cung cấp theo bối cảnh. Từ đó, ngân hàng có thể cung cấp sản phẩm/dịch vụ dựa trên bối cảnh “Ở đâu, khi nào, vì sao và như thế nào?”, theo thời gian thực.

Cụ thể, dữ liệu và AI sẽ là phần cốt lõi trong sự dịch chuyển mô hình hoạt động tư vấn tài chính của ngân hàng. Lời tư vấn có khả năng biến thành trải nghiệm theo thời gian thực được thực hiện bằng AI thông qua hiểu rõ về hành vi, khẩu vị rủi ro của khách hàng, cũng như tìm ra được công cụ, sản phẩm tốt nhất giải quyết vấn đề của khách hàng. Công nghệ giọng nói sẽ dần dần giúp khách hàng tin tưởng vào trợ lý AI của mình trong việc đưa ra những gợi ý về giải pháp tài chính hàng ngày cho họ, thay vì họ phải tự đi tìm kiếm giải pháp. Ví dụ trợ lý AI có thể đưa ra tư vấn như: Bạn đang thanh toán qua thẻ tín dụng quá nhiều rồi đấy, tôi có những phương án khác giúp bạn có tiền mua sắm tiết kiệm được 1,2 triệu đồng mỗi tháng bằng cách tự động liên kết với ví Apple Pay của bạn, bạn muốn xem không?. Thậm chí ngân hàng Emirates NBD đề xuất sản phẩm tiết kiệm với lãi suất dựa trên số bước chân mà khách hàng đi hoặc chạy bộ mỗi ngày, để khích lệ họ tiếp tục lối sống lành mạnh hơn cả về thể chất lẫn tài chính. Bạn thậm chí không cần phải làm hồ sơ mở tài khoản tiết kiệm thì mới bắt đầu tiết kiệm được mà chỉ cần xin quyền truy cập vào ứng dụng của ngân hàng số như Moven.

Với nhiều ứng dụng ngân hàng số đột phá, tất yếu trong tương lai, nếu không có chiến lược dữ liệu áp dụng xuyên suốt toàn bộ tổ chức, bạn sẽ chỉ có 1 ốc đảo dữ liệu riêng rẽ và không biết khách hàng của mình là ai, nhu cầu, hoàn cảnh của họ để đưa ra những dịch vụ tốt nhất. Như chúng ta đã thấy gần đây, hiện tượng tư vấn up-sale, cross-sale các sản phẩm bảo hiểm, đầu tư một cách cứng nhắc, chạy theo KPI, gây một số điều tiếng tại các ngân hàng thương mại trong nước gần đây là do chúng ta thiếu dữ liệu bối cảnh, hành vi theo thời gian thực của khách hàng để đề xuất đúng sản phẩm theo kịp thời gian, nhu cầu của khách hàng dẫn đến giảm sự gắn kết, lòng trung thành của khách hàng.

Như trên chúng ta đã thấy xu hướng ngân hàng số, nhúng toàn diện, ngân hàng mở là tất yếu. Trong cuộc dịch chuyển về ngân hàng số trở nên hoàn thiện, thì những ngân hàng hàng đầu không phải là những ngân hàng sở hữu mạng lưới phân phối lớn, mà là những ngân hàng có năng lực dữ liệu quy mô lớn, mang lại những lợi thế cung cấp bối cảnh cho hoạt động ngân hàng hàng ngày.

Vì vậy, các ngân hàng phải có nền tảng công nghệ mở, xây dựng mối quan hệ hợp tác với đối tác bên ngoài lĩnh vực ngân hàng, đi đôi với khả năng tiếp cận, sở hữu và tận dụng dữ liệu có được. Từ đó mang đến sự khác biệt thực sự trong việc gợi ý sản phẩm/dịch vụ ngân hàng theo thời gian thực dựa trên dự đoán hành vi khách hàng. Ví dụ ngân hàng Emirates NBD hợp tác với mạng xã hội Twitter xây dựng ngân hàng xã hội, cải thiện trải nghiệm dịch vụ ngân hàng dựa trên phân tích nhu cầu khách hàng kịp thời từ dữ liệu mạng xã hội.

Ngày nay nếu muốn thu hút khách hàng sử dụng dịch vụ ngân hàng của mình, bạn phải tiếp cận họ xung quanh một giao dịch hoặc sự tương tác nào đó, khi họ cần tín dụng để hoàn tất một cuộc mua bán nào đó chẳng hạn. Ngoài ra, một khi người tiêu dùng đã sử dụng dịch vụ ngân hàng nhúng trong một nền tảng khác, các ngân hàng sẽ không còn biết khách hàng đang làm gì, cần gì, do ngân hàng hoàn toàn không có dữ liệu của khách hàng trên nền tảng đó. Ngân hàng sẽ hoàn toàn mất dấu, bối cảnh khách hàng, do đó ngân hàng cần chiến lược hợp tác tích hợp các sản phẩm, dữ liệu của các công ty Fintech, hoặc các công ty công nghệ nền tảng. 

Những thử thách của người làm dữ liệu “thực địa”

Có rất nhiều thách thức ở “thực địa” đối với các nhà khoa học dữ liệu. Đầu tiên là vấn đề chất lượng dữ liệu cho xây dựng các mô hình học máy, dự báo, sản phẩm trí tuệ nhân tạo. Đối với các tổ chức có lịch sử phát triển lâu dài, các quy trình nghiệp vụ phải tuân thủ các quy trình chặt chẽ, phức tạp, đặc biệt như các ngân hàng, dữ liệu thường silos. Dữ liệu quá khứ có thể đến từ nhiều nguồn, hệ thống cũ, bộ phận khác nhau không liên thông với nhau, mô hình dữ liệu không nhất quán, meta data thiếu hoặc không được định nghĩa đầy đủ. Điều này dẫn đến sự mất kết nối giữa nguồn dữ liệu với cách sử dụng dữ liệu sao cho đúng, mất manh mối với bối cảnh kinh doanh. Thậm chí mã chương trình, tài liệu của các luồng xử lý dữ liệu không đầy đủ, không được cập nhật. Những điều này gây ra rất nhiều những khó khăn cho việc tiền xử lý, khảo sát dữ liệu từ quá khứ, lên ý tưởng, xây dựng các đầu vào cho các mô hình dự báo. Tất nhiên còn nhiều khó khăn khác như phải xử lý, xây dựng các mô hình dự báo trên dữ liệu lớn, luôn cập nhật. Tuy nhiên với nền tảng công nghệ của mình, Techcombank đã giảm thiểu một cách tối đa những khó khăn này cho các nhà khoa học dữ liệu.

Thử thách lớn thứ hai là phải rút ngắn thời gian phát triển một vòng đời của một mô hình dự báo, đặc biệt rút ngắn thời gian xây dựng mô hình từ khi xác định được các yêu cầu, mục tiêu của bộ phận kinh doanh. Để làm được điều này, chúng ta phải có một nền tảng tính toán xử lý, lưu trữ các thuộc tính, đặc điểm (biến đầu vào của các mô hình dự báo) cơ bản, đầy đủ, toàn diện của khách hàng, cũng như các kỹ thuật xây dựng mô hình dự báo tương đối phổ quát cho đa dạng các sản phẩm, yêu cầu nhanh của các bên kinh doanh. Tất nhiên không thể có mô hình, hệ thống thuộc tính luôn tốt nhất, thậm chí phù hợp cho mọi bài toán, yêu cầu kinh doanh. Hơn nữa những kỹ thuật xây mô hình này còn phải đảm bảo tính khái quát hoá, giữ được hiệu năng trong sự thay đổi của dữ liệu thực tế, trong điều kiện chất lượng dữ liệu không cao, dữ liệu không được xử lý đồng bộ. Suy cho cùng, hiệu năng thực sự của mô hình dự báo chỉ được đánh giá trong tương lai. Nhưng có lẽ thách thức hơn cả, có những bài toán, yêu cầu khoa học dữ liệu thực tế của bên kinh doanh hóc búa ngay cả trong điều kiện lý tưởng, lý thuyết và rất khó đưa ra giải pháp thích hợp trong điều kiện thực tế.

Xuất phát nhu cầu am hiểu khách hàng, cung cấp sản phẩm/dịch vụ, cải thiện trải nghiệm khách hàng trong bối cảnh, vòng đời khách hàng, Techcombank tiên phong phát triển một nền tảng dữ liệu khách hàng tổng thể trên Cloud. Và để giảm thiểu khó khăn như trao đổi ở trên, cũng như đảm bảo sự tuân thủ, bảo mật khi khai thác dữ liệu, một bộ khung về quản trị dữ liệu với Collibra đã được tiên phong triển khai đồng bộ ở ngân hàng. Khi đó chất lượng, độ tin cậy, xác thực của dữ liệu được quản lý, tạo thuận lợi cho triển khai các dự án về khoa học dữ liệu. Đặc biệt một nền tảng về học máy trên Cloud với SageMaker đang được ngân hàng đầu tư và triển khai. Rồi sự chuẩn bị nền tảng dữ liệu mở, dữ liệu bối cảnh từ các đối tác, hệ sinh thái mới được bổ xung. Tất cả những điều này giúp ươm mầm những dự án khoa học dữ liệu lớn hơn, tạo nhiều ảnh hưởng tích cực đến ngân hàng, khách hàng.

Techcombank là một trong những ngân hàng đầu tiên trong nước đầu tư mạnh mẽ các tài năng dữ liệu nói chung hay khoa học dữ liệu nói riêng. Có lẽ Techcombank là một trong những ngân hàng có khối dữ liệu riêng đầu tiên với đông đảo hơn 200 nhân sự, chuyên gia tài năng nhiều kinh nghiệm. Khối có cấu trúc với năm phòng: 

  • Sản phẩm dữ liệu
  • Hoạch định dữ liệu
  • Phân tích và am hiểu dữ liệu kinh doanh
  • Phân tích nâng cao và sáng tạo (AAI)
  • Quản trị dữ liệu như những ngân hàng tiên tiến trên thế giới. 

Phòng phân tích nâng cao và sáng tạo với trách nhiệm xây dựng các công cụ, năng lực, mô hình phân tích nâng cao, dự báo, học máy, có nhiều chuyên gia quốc tế, như từ Google DeepMind đến làm việc. Quan trọng hơn cả Techcombank đang phát triển văn hoá dữ liệu từ tất cả các khối, phòng ngoài dữ liệu, từ đó có thể thúc đẩy nhiều hơn nữa những dự án khoa học dữ liệu sáng tạo, có sức ảnh hưởng lớn.   

Theo anh, đâu là những kỹ năng và kiến thức cần có dành cho những bạn muốn trở thành một Data Scientist trong tương lai?

Techcombank có nhiều bạn Intern, sinh viên mới ra trường đang theo đuổi trở thành nhà khoa học dữ liệu. Cũng như mọi ngành nghề khác chúng ta đều cần tư duy giải quyết vấn đề sáng tạo, tư duy thiết kế, phản biện. Đầu tiên nhà khoa học dữ liệu luôn phải thiết kế, chuyển đổi các yêu cầu, mục tiêu của các bài toán kinh doanh thành các bài toán học máy, trí tuệ nhân tạo. Cụ thể chúng ta cần một số kiến thức, kỹ năng như:

  • Kiến thức về Khoa học dữ liệu, Học máy, Tính toán, Thống kê
  • Kiến thức, kỹ năng về lập trình, tính toán phân tán cho dữ liệu lớn
  • Kiến thức, kỹ năng về cấu trúc, kiến trúc dữ liệu, tiền xử lý, trực quan hoá dữ liệu 
  • Kỹ năng nghiên cứu, thích khám phá, thử nghiệm, tập trung, tỉ mỉ
  • Kỹ năng giao tiếp, trình bày, do trong vòng đời phát triển mô hình học máy chúng ta luôn phải kết hợp, đánh giá hiệu quả mô hình, nhận phản hồi với/từ các đơn vị kinh doanh 
  • Kiến thức đại cương về các nguyên lý cơ bản trong kinh tế, tài chính, các sản phẩm trong ngân hàng

Cảm ơn anh về những chia sẻ rất bổ ích giúp đem lại nhiều góc nhìn tích cực cho những ai đang muốn tham gia vào lĩnh vực Khoa học dữ liệu tại ngân hàng, hy vọng team AAI của Techcombank sẽ gặt hái được nhiều thành công trong tương lai. 

Một ngày làm việc của một Data Scientist ở Techcombank

  • Cũng như những công việc trong ngành IT nói chung, chúng tôi cũng có buổi daily standup hàng sáng trao đổi về những công việc đang tập trung, những khó khăn đang gặp phải, rồi các buổi sprint retro, review hàng tuần.
  • Tuy nhiên có lẽ công việc yêu thích nhất mỗi ngày của một nhà khoa học dữ liệu là được đắm chìm vào trong các thử nghiệm, đánh giá các ý tưởng trên dữ liệu, phát hiện ra những mẫu hình, xu hướng, bản chất bên trong dữ liệu.
  • Rồi những buổi seminar chia sẻ kiến thức, giờ đào tạo thú vị hàng tuần, những buổi brainstorming để chuyển đổi yêu cầu kinh doanh thành bài toán học máy, tìm các hướng tiếp cận, thuật toán phù hợp, hiệu quả, đề xuất những ý tưởng biểu diễn, trực quan hoá những mẫu hình, bản chất tìm được, hay hơn là lựa chọn các giải pháp toàn diện, viễn kiến, thách thức lớn cần giải quyết trong tương lai. 

 


Thuộc dự án Inside GemTechnology do TopDev hợp tác cùng Techcombank triển khai, chuỗi nội dung thuần “Tech” độc quyền được chia sẻ bởi đội ngũ chuyên gia Công nghệ & Dữ liệu tại Techcombank sẽ được cập nhật liên tục tại chuyên mục Tech Blog | Techcombank Careers x TopDev. Cùng theo dõi & gặp gỡ các chuyên gia bạn nhé!

 

Các cơ hội việc làm tại Techcombank

Bài viết liên quan

Hơn cả một phương pháp, DevSecOps chính là “triết lý bảo mật” tại Techcombank

Là một thành viên mới tại Techcombank, anh Bùi Nguyễn Tuấn Minh hiện đang là Giám đốc DevSecOps, đây cũng là công việc đầu tiên của anh sau những năm tháng làm việc tại Singapore. Anh cũng là một trong những người góp phần mang lại những góc nhìn mới trong các phương pháp phát triển phần mềm của Techcombank. Được biết, Techcombank là một trong những đơn vị tiên phong ứng dụng phương pháp DevSecOps trong việc phát triển sản phẩm. Đây cũng được xem là một trong những định hướng giúp các ngân hàng số hóa và phát triển mạnh mẽ trong tương lai. Sau đây là những chia sẻ của anh Bùi Nguyễn Tuấn Minh về công việc DevSecOps tại Techcombank. Anh có thể chia sẻ một chút về môi trường làm việc tại Techcombank? Khi chuyển công tác từ Singapore về Việt Nam, mình nhận thấy môi trường và cách thức làm việc [...]

DevSecOps Philosophy (Triết lý DevSecOps)

Bài viết đến từ Ngô Doãn Thông - DevSecOps Engineer    DevSecOps team @Techcombank Giới thiệu Trong 20 năm qua, DevOps đã cùng với Agile, thay thế cho mô hình phát triển Waterfall. Microservices được coi là công nghệ tiên tiến nhất để triển khai kiến trúc dịch vụ. Thời gian phát triển sản phẩm đã được giảm đi, triển khai tự động được thực hiện hàng tuần hoặc hàng ngày và cloud thì cung cấp khả năng tính toán, cơ sở hạ tầng, lưu trữ và mạng rất mạnh mẽ. Triết lý DevOps thường được tóm tắt bằng khẩu hiệu "move fast and break things", điều này có nghĩa là triển khai mọi thứ nhanh hơn, mạnh dạn hơn và sẵn sàng, phá bỏ các cấu trúc silo, rào cản, chấp nhận rủi ro và khắc phục nhanh từ những rủi ro đó. Tuy nhiên, có một yếu tố quan trọng chưa được đề cập tới. Các tổ chức áp dụng DevOps vẫn cần đáp ứng tiêu chuẩn an [...]