1
a) Tên Dự án: Ứng dụng học máy (Machine Learning) vào xử lý dữ liệu trong hoạt động thông tin tín dụng tại Việt Nam
Mã số: DANH.001/21
b) Tổ chức chủ trì thực hiện: Thông tin tín dụng quốc gia Việt Nam
c) Chủ nhiệm và người tham gia chính:
- Chủ nhiệm: ThS. Phan Huy Thắng, Phó Tổng Giám đốc Trung tâm Thông tin tín dụng quốc gia Việt Nam, Ngân hàng Nhà nước Việt Nam.
- Thư ký: ThS. Vũ Thị Phương Thảo - Trưởng phòng, Trung tâm Thông tin tín dụng Quốc gia Việt Nam, Ngân hàng Nhà nước Việt Nam.
- Thành viên tham gia:
d) Các chủ đề nghiên cứu chính:
- Cơ sở lý luận về ứng dụng Học máy vào xử lý dữ liệu trong hoạt động thông tin tín dụng.
- Thực trạng ứng dụng Học máy vào xử lý dữ liệu trong hoạt động thông tin tín dụng tại Việt Nam.
- Giải pháp ứng dụng Học máy vào xử lý dữ liệu trong hoạt động thông tin tín dụng tại Việt Nam.
đ) Thời gian bắt đầu và thời gian kết thúc:
- Thời gian bắt đầu: Tháng 6/2021
- Thời gian kết thúc: Tháng 10/2022
e) Kinh phí thực hiện: 220 triệu đồng.
g) Kết quả thực hiện: Khá
h) Mô tả tóm tắt:
Nhằm mục tiêu nghiên cứu, ứng dụng công nghệ mới để xử lý dữ liệu trong hoạt động thông tin tín dụng (TTTD), rút ngắn thời gian xử lý dữ liệu, hạn chế ảnh hưởng của con người trong việc ra quyết định cũng như cho phép khả năng nâng cấp, cải tiến giải pháp thường xuyên hơn trong hoạt động TTTD, dự án DANH.001/21 đã triển khai các nội dung nghiên cứu cụ thể như sau:
Chương 1 nghiên cứu các vấn đề cơ sở lý luận cho việc ứng dụng học máy vào xử lý dữ liệu trong hoạt động TTTD như (i) Khái niệm, đặc điểm, yêu cầu và quy trình tổng quát xử lý dữ liệu trong hoạt động TTTD; (ii) Khái niệm, phương pháp, các thuật toán, ứng dụng học máy vào xử lý dữ liệu trong hoạt động TTTD, các yếu tố ảnh hưởng đến việc ứng dụng học máy vào xử lý dữ liệu trong hoạt động TTTD cũng như các tiêu chí đánh giá tính hiệu quả của việc ứng dụng. Chương 1 cũng nghiên cứu kinh nghiệm ứng dụng học máy vào xử lý dữ liệu trong hoạt động TTTD tại một số quốc gia trên thế giới trong các khâu chấm điểm tín dụng, phát hiện gian lận hoặc các bất thường hay trong xây dựng chính sách phát triển trí tuệ nhân tạo. Qua đó nhóm nghiên cứu rút ra một số bài học kinh nghiệm cho Việt Nam.
Chương 2 đánh giá thực trạng xử lý dữ liệu trong hoạt động thông tin tín dụng, thực trạng ứng dụng Học máy trong ngành ngân hàng và khả năng ứng dụng Học máy vào xử lý dữ liệu trong hoạt động thông tin tín dụng tại Việt Nam. Từ đó, nhóm nghiên cứu chỉ ra một số mặt tích cực và hạn chế trong ứng dụng Học máy trong hoạt động xử lý dữ liệu, cụ thể:
(i) Về mặt tích cực, CIC đã chủ động triển khai các Dự án hiện đại hóa CNTT, ứng dụng nền tảng CNTT hiện đại trong các hoạt động nghiệp vụ, xây dựng các quy trình xử lý dữ liệu các thông tin định danh khách hàng. Đến nay, việc xây dựng CSDL trên nền tảng công nghệ hiện đại đã căn bản thay thế phương pháp thủ công. CIC đã trở thành một ngân hàng TTTD phủ sóng toàn ngành dựa trên nguyên lý chia sẻ thông tin, thiết kế thành những dòng sản phẩm mang tin về tư cách khách hàng vay theo nhu cầu đa dạng, chính xác, kịp thời không chỉ cung cấp cho các đơn vị trong ngành mà còn cung cấp cả cho các đơn vị ngoài ngành và cơ quan an ninh quốc gia... Các TCTD cũng triển khai ứng dụng công nghệ cao vào một số công đoạn chính trong quy trình hoạt động nghiệp vụ ngân hàng, vì vậy chất lượng thông tin báo cáo cho CIC cũng không ngừng được tăng lên.
(ii) Về mặt hạn chế: Quá trình triển khai các dự án hiện đại hóa CNTT vẫn gặp phải một số vấn đề về môi trường pháp lý; hạ tầng cơ sở CNTT; nguồn nhân lực; nguồn dữ liệu cũng như tính đồng bộ quy trình của các TCTD và tổ chức hoạt động TTTD. Trong đó, vấn đề nhân lực và cơ sở pháp lý là các vấn đề nổi trội.
Trong chương 3, nhóm tác giả đề xuất mục tiêu tổng quát của các giải pháp ứng dụng Học máy vào xử lý dữ liệu trong hoạt động TTTD tại Việt Nam là nhằm nâng cao hiệu quả xử lý dữ liệu trong hoạt động TTTD, tạo điều kiện phát triển, cải tiến sản phẩm, dịch vụ TTTD hiện đại phù hợp với yêu cầu quản lý nhà nước, của các chủ thể hoạt động trong ngành TC-NH. Để đáp ứng mục tiêu này, nhóm tác giả đưa ra đề xuất một số giải pháp về xây dựng hệ thống văn bản QPPL liên quan đến ứng dụng khoa học công nghệ; xây dựng cơ chế tạo điều kiện thúc đẩy ứng dụng Học máy trong hoạt động TTTD; Phát triển nguồn nhân lực chất lượng cao về ứng dụng Học máy, phân tích dữ liệu; Mở rộng CSDL phù hợp với chiến lược phát triển, nhu cầu ứng dụng Học máy trong tương lai... Nhóm nghiên cứu cũng quả xây dựng hệ thống thử nghiệm xử lý dữ liệu trong hoạt động thông tin tín dụng có ứng dụng Học máy tại CIC thông qua bài toán tìm kiếm, xác định tài sản đảm bảo là xe ô tô được thu thập từ các TCTD. Kết quả thử nghiệm của nhóm nghiên cứu cho thấy việc ứng dụng học máy để giải quyết bài toán nghiệp vụ này là khả thi. Qua đó, nhóm nghiên cứu đã đề xuất triển khai ứng dụng Học máy vào xử lý dữ liệu TTTD qua hai hướng:
- Mở rộng bài toán trích xuất dữ liệu đối với các loại TTTD khác như: Mô tả tài sản đảm bảo là bất động sản, Địa chỉ khách hàng vay, … từ đó chuẩn hóa các TTTD thu thập được, sử dụng được với nhiều mục tiêu khác nhau như: Phân nhóm khách hàng theo địa chỉ; Chuẩn hóa thông tin trong các trả lời; …
- Tăng cường tự động hóa trong việc đánh giá, xem xét các hồ sơ TTTD có nghi ngờ về số liệu: Ứng dụng Học máy làm giảm tỷ lệ hồ sơ cần chuyển cán bộ xử lý xem xét thủ công, từ đó tăng năng suất lao động, hiệu quả làm việc.
Trên cơ sở kết quả nghiên cứu, Chương 3 cũng đưa ra một số kiến nghị đối với Chính phủ, NHNN, các tổ chức hoạt động TTTD và các doanh nghiệp CNTT, Fintech./.