Áp dụng mô hình ngôn ngữ lớn (LLM) trong các dịch vụ tài chính

Tóm tắt cuộc thảo luận sôi nổi về mô hình LLM tại sự kiện “Định hướng sự hỗn loạn”.

Tôi có nên tự xây dựng công cụ ChatGPT? Áp dụng mô hình ngôn ngữ lớn trong dịch vụ tài chính

Tuần trước Celent đã tổ chức một sự kiện mang tên “Định hướng sự hỗn loạn”, tại thành phố New York. Số lượng khách tham dự lên đến gần 100. Sau các phiên thảo luận tích cực về Tài sản kỹ thuật số và ESG, chúng tôi đã thảo luận rộng rãi về những rủi ro và lợi ích từ việc sử dụng Mô hình ngôn ngữ lớn (LLM).

Cuộc thảo luận này là một trong những cuộc thảo luận sôi nổi nhất trong ngày. Công nghệ này đã tạo ra sự quan tâm sâu sắc trong cộng đồng dịch vụ tài chính, cũng như đối với công chúng nói chung. Nhóm đã đưa ra và tập trung thảo luận giải đáp một số câu hỏi thú vị sau:

Tôi có muốn tự xây dựng mô hình LLM?

Với việc phát hành ChatGPT-4 vào tháng 3, các công ty hiện có thể cấp phép cho các mô hình ChatGPT-3 và bản xem trước của ChatGPT-4 để xây dựng mô hình LLM của riêng mình. Cho phép kết hợp cơ sở kiến thức, xử lý ngôn ngữ tự nhiên và lý luận với các bộ dữ liệu của riêng họ. Nhiều FI đã thực hiện việc này. Chúng tôi đã thảo luận về cách Morgan Stanley sử dụng mô hình LLM để quản lý và phát hành các nghiên cứu đầu tư của mình (xem trường hợp điển hình của Celent). Một số người khác đề cập đến BloombergGPT cũng như FMG sử dụng GPT để viết bài đăng trên mạng xã hội cho các cố vấn đầu tư của mình. Một số người tham gia cho biết, công ty của họ đang lập kế hoạch hoặc đang tiến hành những dự án tương tự.

Tôi nên sử dụng mô hình LLM nào?

Trong khi hầu hết các cuộc thảo luận thực tế tập trung vào ChatGPT của OpenAI, chúng tôi cũng thảo luận về sự cạnh tranh từ Google, Meta, Baidu và mã nguồn mở Hugging Face. Những người may mắn có được bản xem trước Bard từ Google cho biết nó không tương thích với ChatGPT4. Liên quan đến việc thiết lập LLM, những người tham gia đang tự hỏi liệu họ có nên đợi các phiên bản được cấp phép thương mại tương tự từ các nhà cung cấp khác trước khi thực hiện LLM độc quyền hay không.

Tuần này, Google đã công bố ra mắt PaLM2, mô hình LLM mới nhất của hãng với khả năng suy luận được cải tiến và một bộ ngôn ngữ rộng rãi. Như dự kiến, phiên bản này có sẵn cho các nhà phát triển để kết hợp vào mô hình LLM độc quyền mà các công ty có thể cập nhật bằng dữ liệu của riêng họ. Google cũng đã công bố MusicLM. Hậu tố “LM” và “GPT” sẽ phổ biến trong thập niên 20 giống như tiền tố “i” có trong các mặt hàng (iRobot, iHome, iBaby…)

Những rủi ro của việc sử dụng LLM là gì?

Hầu hết khách tham dự sự kiện đều coi tính chính xác của các câu trả lời là rủi ro lớn nhất. Cho dù sử dụng mô hình LLM công khai có sẵn hay LLM độc quyền. Làm thế nào bạn có thể tin tưởng vào câu trả lời mình nhận được? Đã có những ví dụ hài hước về ảo giác ChatGPT, nhưng cả phòng nhận thấy nguy cơ này sẽ giảm dần khi các phiên bản LLM mới hơn (như của Bing) cung cấp nguồn cho câu trả lời mà công cụ ChatGPT đưa ra.

Một rủi ro đáng lo ngại hơn cả là mất quyền kiểm soát dữ liệu được nhập vào LLM khi đặt câu hỏi. Đã có những lo ngại về việc mất quyền kiểm soát dữ liệu độc quyền của công ty – chúng tôi đã nói về việc Samsung đưa mã nguồn có giá trị vào phạm vi công khai khi một trong các kỹ sư của họ sử dụng khả năng mã hóa của ChatGPT.

Chúng tôi cũng thảo luận về mối lo ngại mất quyền kiểm soát thông tin nhận dạng cá nhân (PII) – điều gì sẽ xảy ra nếu một nhân viên đưa nhầm PII của khách hàng vào câu hỏi cho LLM công khai? Sau khi dữ liệu được nhập vào Chat GPT, không có cách nào để xóa dữ liệu đó khỏi kho dữ liệu. Điều này khiến ChatGPT không tuân thủ luật GDPR của EU, vì một trong những nguyên tắc cốt lõi của GDPR là các cá nhân có quyền xóa tất cả dữ liệu của họ khỏi cơ sở dữ liệu của công ty. Đây là lý do tại sao kể từ ngày 1 tháng 4, Cơ quan bảo vệ dữ liệu Ý đã cấm sử dụng ChatGPT trên toàn quốc.

Các rủi ro khác được thảo luận bao gồm:

Vi phạm bản quyền bằng cách sử dụng LLM cơ sở được đào tạo đối với dữ liệu mà nó không có quyền

Vi phạm các quy định của SEC nếu một chatbot AI tổng quát được cho là đã đưa ra lời khuyên

Email lừa đảo hiệu quả hơn khi không còn các gợi ý từ lỗi ngữ pháp và chính tả

Mô hình LLM trong rủi ro và tuân thủ

Ngoài các trường hợp sử dụng trong kinh doanh, chúng tôi đã thảo luận về cách mô hình LLM có thể trợ giúp tự động hóa quy trình làm việc trong quản lý rủi ro và tuân thủ, như quản lý thay đổi quy định, rủi ro hoạt động/GRC, chống tội phạm tài chính (AML và gian lận), thực hiện trong các lĩnh vực như lạm dụng và bán nhầm thị trường, mạng lưới các mối đe dọa. Việc sử dụng mô hình LLM trong các lĩnh vực nhạy cảm với rủi ro sẽ phụ thuộc vào việc giải quyết các vấn đề khó khăn – đối với một số trường hợp nhạy cảm và vào việc các cơ quan quản lý chấp nhận nó.

Rủi ro gián đoạn là gì?

Nhưng có lẽ rủi ro lớn nhất là không làm gì cả. Có nhiều quan điểm khác nhau về việc Trí tuệ nhân tạo tạo sinh là công nghệ gia tăng hay đột phá trong các dịch vụ tài chính. Các trường hợp sử dụng cho đến nay trong ngành ngày càng gia tăng – cải thiện khả năng tiếp cận thông tin và giúp các cố vấn trở nên thông minh hơn. Nhưng chỉ vì chúng tôi chưa thấy trường hợp sử dụng đột phá nào trong các dịch vụ tài chính không có nghĩa là nguy cơ gián đoạn là không có thật. Ví dụ rõ ràng nhất chính là ChatGPT. Ai có thể nghĩ rằng vị trí nhà vô địch tìm kiếm không thể tranh cãi của Google lại có thể bị thách thức một cách đột ngột như vậy?

 

Xem chi tiết tại: celent.com