Lĩnh vực Trí tuệ nhân tạo (AI), bao gồm các phân ngành Học máy (ML) và Học sâu (DL), đã chứng kiến sự tăng trưởng chưa từng có trong những năm gần đây. Trong khi nền tảng lý thuyết của các công nghệ này đã được thiết lập tốt và liên tục phát triển, thì việc ứng dụng AI vào các tình huống thực tế thường bộc lộ những khoảng cách đáng kể. Bài viết này đi sâu vào những thách thức và sự khác biệt giữa kiến thức lý thuyết và việc triển khai thực tế trong các lĩnh vực ML, DL và AI.
Mặt lý thuyết của AI tập trung vào việc phát triển các mô hình, thuật toán và khuôn khổ toán học để mô phỏng trí thông minh của con người. Bao gồm:
- Học máy: Bao gồm việc thiết kế các thuật toán có khả năng học từ dữ liệu, chẳng hạn như các mô hình học có giám sát, không giám sát và học tăng cường.
- Học sâu: Một tập hợp con của ML sử dụng mạng nơ-ron với nhiều lớp để học các mẫu và biểu diễn phức tạp.
- Triết lý AI: Giải quyết các câu hỏi cơ bản về nhận thức, lý luận và ra quyết định.
Trong bối cảnh học thuật, trọng tâm thường là:
- Hiệu quả thuật toán: Tối ưu hóa thuật toán để tăng tốc độ và độ chính xác.
- Độ chính xác toán học: Chứng minh tính hợp lý về mặt lý thuyết của các mô hình.
- Bộ dữ liệu tổng hợp: Kiểm tra các mô hình trên các bộ dữ liệu sạch, được gắn nhãn tốt như MNIST hoặc ImageNet.
Mặc dù hiểu biết về mặt lý thuyết này rất quan trọng, nhưng nó thường tách biệt khỏi bản chất lộn xộn, không thể đoán trước của dữ liệu và các tình huống trong thực tế.
Dữ liệu thực tế hiếm khi sạch hoặc đơn giản như các tập dữ liệu học thuật. Các vấn đề thực tế bao gồm:
- Chất lượng dữ liệu: Dữ liệu bị thiếu, nhiễu hoặc sai lệch có thể ảnh hưởng đáng kể đến hiệu suất của mô hình. Các bộ dữ liệu thường được dùng khí chạy thử nghiêm thường gặp tình trạng này ở tỉ lệ rất nhỏ, tuy nhiên trên thực tế, tỉ lệ này lớn hơn, tậm chí có thể là rất lớn
- Khối lượng dữ liệu: Nhiều ứng dụng yêu cầu lượng dữ liệu lớn để đạt được độ chính xác chấp nhận được, điều này có thể không phải lúc nào cũng khả dụng.
- Quyền riêng tư dữ liệu: Các ràng buộc theo quy định như GDPR hoặc HIPAA hạn chế cách dữ liệu có thể được thu thập, lưu trữ và sử dụng.
Ràng buộc tính toán
Triển khai các mô hình AI trong bối cảnh thực tế thường đòi hỏi phải cân bằng giữa tài nguyên tính toán và hiệu quả. Những thách thức bao gồm:
- Hạn chế về tài nguyên: Các thiết bị biên hoặc hệ thống nhúng có thể không có khả năng chạy các mô hình học sâu phức tạp.
- Tiêu thụ năng lượng: Đào tạo và triển khai các mô hình quy mô lớn, chẳng hạn như GPT hoặc BERT, đòi hỏi năng lượng và sức mạnh tính toán đáng kể, làm dấy lên mối lo ngại về tính bền vững.
Thách thức triển khai
Xây dựng và triển khai các hệ thống AI trong môi trường thực tế sẽ phát sinh thêm những phức tạp:
- Tổng quát hóa mô hình: Các mô hình được đào tạo trên các tập dữ liệu cụ thể có thể không tổng quát hóa được sang dữ liệu mới.
- Tích hợp: Các hệ thống AI cần hoạt động liền mạch trong cơ sở hạ tầng và quy trình làm việc hiện có. Nhiều lúc, khi triển khai mô hình AI lên trên các nền tảng hoặc cơ sở hạ tầng, sẽ có sự chênh lệch giữa chỉ số chính xác accuracy của mô hình, và người lập trình viên phải tìm cách giảm thiểu chênh lệch này
- Bảo trì: Các mô hình cần được giám sát liên tục, đào tạo lại và cập nhật để duy trì hiệu quả.
Quá đơn giản trong lý thuyết
Các mô hình lý thuyết thường đưa ra các giả định đơn giản hóa để tập trung vào các khía cạnh cụ thể của một vấn đề. Các giả định này có thể bao gồm:
- Tính đồng nhất của dữ liệu: Giả sử dữ liệu được phân phối đồng đều và được thể hiện tốt.
- Tính ổn định: Giả sử các thuộc tính thống kê của dữ liệu không thay đổi theo thời gian.
- Định nghĩa mục tiêu: Xác định trước các số liệu và mục tiêu rõ ràng, thường mơ hồ trong các vấn đề thực tế.
Ví dụ, một giả định phổ biến trong các mô hình xử lý ngôn ngữ tự nhiên (NLP) là dữ liệu đào tạo và dữ liệu thử nghiệm có cùng một phân phối. Tuy nhiên, trên thực tế, một mô hình NLP được đào tạo trên văn bản chính thức, chẳng hạn như các bài báo học thuật, có thể hoạt động kém trên dữ liệu không chính thức, chẳng hạn như các bài đăng trên mạng xã hội, do sự khác biệt về cách sử dụng ngôn ngữ, tiếng lóng và từ viết tắt. Một ví dụ khác là trong bảo trì dự đoán, trong đó các mô hình ML có thể cho rằng tỷ lệ hỏng hóc của máy vẫn không đổi theo thời gian, bỏ qua các yếu tố như hao mòn hoặc biến động theo mùa, có thể ảnh hưởng đáng kể đến dự đoán.
Tương tự như vậy, trong thị giác máy tính, nhiều mô hình cho rằng điều kiện ánh sáng và camera lý tưởng, giống như trường hợp của các tập dữ liệu chuẩn như ImageNet. Trong các ứng dụng thực tế như giám sát hoặc lái xe tự động, các điều kiện có thể thay đổi đáng kể, với các vấn đề như ánh sáng kém, che khuất hoặc thời tiết xấu ảnh hưởng đến hiệu suất. Trong một trường hợp khác, các mô hình được đào tạo trên các tập dữ liệu được quản lý để phát hiện gian lận có thể không thành công khi áp dụng cho các luồng dữ liệu thực tế, trong đó hành vi gian lận phát triển nhanh chóng và tập dữ liệu chứa phân phối lớp mất cân bằng.
Trên thực tế, những giả định này hiếm khi đúng, đòi hỏi phải điều chỉnh và thỏa hiệp đáng kể.
Thiếu kiến thức chuyên môn về lĩnh vực
Các khuôn khổ lý thuyết thường xử lý các vấn đề một cách riêng biệt, tách biệt khỏi các sắc thái cụ thể của lĩnh vực. Trong thực tế, chuyên môn về lĩnh vực rất quan trọng.
Ví dụ, trong lĩnh vực chăm sóc sức khỏe, các mô hình AI được thiết kế cho mục đích chẩn đoán có thể không tính đến các quy trình làm việc lâm sàng phức tạp hoặc sự thay đổi trong cách các bệnh biểu hiện trên các đặc điểm nhân khẩu học của bệnh nhân. Một mô hình dự đoán nguy cơ ung thư chỉ dựa trên dữ liệu hình ảnh có thể bỏ qua các yếu tố quan trọng như khuynh hướng di truyền, lối sống hoặc phơi nhiễm môi trường, vốn rất quen thuộc với các chuyên gia y tế. Nếu không có kiến thức chuyên môn, một mô hình như vậy có nguy cơ đưa ra các dự đoán không chính xác hoặc gây hiểu lầm, có khả năng gây hại.
Một ví dụ khác là trong ngành nông nghiệp, nơi các công cụ hỗ trợ AI để dự đoán năng suất cây trồng dựa vào dữ liệu như mô hình thời tiết, chất lượng đất và tình trạng sâu bệnh. Tuy nhiên, nông dân thường đưa ra quyết định dựa trên nhiều năm kinh nghiệm, chẳng hạn như cách các loại cây trồng cụ thể phản ứng với các vi khí hậu độc đáo hoặc các bất thường theo mùa. Việc bỏ qua những chi tiết tinh tế này có thể dẫn đến các mô hình hoạt động kém hiệu quả hoặc không được áp dụng.
Cách đánh giá mô hình
Trong khi nghiên cứu lý thuyết, các mô hình thường được đánh giá bằng cách sử dụng các tập dữ liệu chuẩn như CIFAR-10 hoặc COCO, phụ thuộc nhiều vào số liệu chuẩn hóa (ví dụ: accuracy, precision, recall), tuy nhiên, trong thực tế, thường liên quan đến các yếu tố không thể định lượng, chẳng hạn như sự hài lòng của người dùng, tác động kinh doanh hoặc tuân thủ quy định.
Một ví dụ như là trong xe tự hành. Các số liệu lý thuyết như độ chính xác trung bình (mAP) để phát hiện đối tượng là rất quan trọng trong quá trình đào tạo mô hình. Tuy nhiên, việc triển khai trong thế giới thực đòi hỏi phải xem xét các yếu tố như thời gian phản ứng, kết quả âm tính giả (ví dụ: không phát hiện được người đi bộ) và độ mạnh mẽ của hệ thống trong các điều kiện bất lợi như mưa hoặc sương mù. Các số liệu trong những trường hợp này phải mở rộng sang độ an toàn và độ tin cậy trong hoạt động.
Trong phát hiện gian lận, việc chỉ số Recall cao có thể chỉ ra rằng hệ thống xác định được hầu hết các giao dịch gian lận, nhưng nếu độ chính xác accuracy thấp, nó có thể dẫn đến tỷ lệ dương tính giả cao, khiến khách hàng xa lánh khi bị gắn cờ không chính xác. Do đó, việc cân bằng các số liệu này dựa trên các ưu tiên kinh doanh là điều cần thiết.
Kết luận
Như vậy, có thể thấy, trong khi những tiến bộ về mặt lý thuyết tạo nền tảng cho sự đổi mới, việc triển khai thực tế đòi hỏi phải điều hướng các ràng buộc phức tạp, thực tế hơn. Việc tìm hiểu cũng như thích ứng với khoảng cách này đem lại nhiều thách thức cũng như cơ hội cho lập trình viên phát triển.