AI là gì? Khác gì với phần mềm thông thường?
Khi nghe nói đến AI, nhiều người nghĩ ngay đến robot, chatbot thông minh hoặc các công cụ tạo ảnh, viết bài, làm video. Nhưng để học AI một cách vững chắc, ta nên bắt đầu từ câu hỏi đơn giản hơn: AI thật ra là gì, và vì sao nó khác với phần mềm thông thường?
AI là viết tắt của Artificial Intelligence, tiếng Việt thường gọi là trí tuệ nhân tạo. Nói dễ hiểu, AI là nhóm kỹ thuật giúp máy tính thực hiện những việc trước đây thường cần khả năng của con người, như nhận diện hình ảnh, hiểu câu hỏi, gợi ý nội dung, phân loại dữ liệu, dự đoán kết quả hoặc trò chuyện bằng ngôn ngữ tự nhiên.
Mục tiêu bài học
Sau bài này, bạn cần nắm được 4 ý: AI là gì, phần mềm thường hoạt động ra sao, AI học từ dữ liệu như thế nào, và LLM nằm ở đâu trong bức tranh AI. Đây là nền tảng để các bài sau đi sâu vào machine learning, token, prompt, RAG và agent.
Phần mềm thông thường hoạt động như thế nào?
Phần mềm thông thường thường hoạt động bằng các quy tắc do con người viết trước. Ví dụ, nếu bạn nhập đúng mật khẩu thì hệ thống cho đăng nhập; nếu nhập sai thì báo lỗi. Nếu điểm từ 8 trở lên thì xếp loại giỏi; nếu điểm dưới 5 thì chưa đạt. Những luật này rõ ràng, dễ kiểm tra và thường cho kết quả giống nhau khi đầu vào giống nhau.
Cách làm này rất mạnh với các việc có quy tắc cố định: tính tiền, lưu dữ liệu, gửi email, lọc danh sách, xử lý đơn hàng. Nhưng nó gặp khó khi nhiệm vụ quá mềm, quá nhiều biến thể hoặc khó viết luật đầy đủ. Ví dụ: làm sao viết hết mọi quy tắc để nhận ra một bức ảnh có con mèo? Làm sao liệt kê hết mọi cách học sinh có thể hỏi cùng một câu bằng nhiều kiểu diễn đạt khác nhau?
AI khác ở điểm nào?
AI hiện đại không yêu cầu lập trình viên viết tay từng quy tắc nhỏ. Thay vào đó, ta đưa cho máy rất nhiều ví dụ, rồi để mô hình học ra mẫu chung. Nếu muốn AI nhận diện mèo, ta cho nó xem rất nhiều ảnh mèo và ảnh không phải mèo. Nếu muốn AI hiểu văn bản, ta cho nó học từ rất nhiều câu, đoạn văn, tài liệu và cách các từ thường đi cùng nhau.
Điểm quan trọng là AI không “hiểu” giống con người ngay từ đầu. Nó học các mẫu thống kê trong dữ liệu. Khi gặp dữ liệu mới, nó dự đoán kết quả có khả năng đúng nhất dựa trên những mẫu đã học. Vì vậy AI có thể linh hoạt hơn phần mềm thường, nhưng cũng có thể sai theo cách khó đoán hơn.
Ví dụ dễ hiểu: phân loại thư rác
Hãy tưởng tượng bạn muốn tạo hệ thống nhận biết email rác. Cách phần mềm thường là viết luật: nếu email có chữ “trúng thưởng”, “bấm ngay”, “nhận tiền” thì đánh dấu là spam. Cách này đơn giản nhưng dễ bị vượt qua, vì người gửi spam có thể đổi cách viết.
Cách AI là cho mô hình xem rất nhiều email đã được gắn nhãn: email bình thường và email rác. Mô hình học những dấu hiệu thường xuất hiện trong spam: kiểu từ ngữ, tần suất link, cấu trúc câu, tên miền, cách kêu gọi hành động. Khi gặp email mới, nó không chỉ kiểm tra một từ khóa, mà kết hợp nhiều dấu hiệu để dự đoán email đó có phải spam không.
LLM nằm ở đâu trong AI?
LLM là viết tắt của Large Language Model, nghĩa là mô hình ngôn ngữ lớn. Đây là một loại AI được huấn luyện trên lượng văn bản rất lớn để xử lý ngôn ngữ. LLM có thể trả lời câu hỏi, tóm tắt bài viết, viết dàn ý, giải thích khái niệm, chuyển giọng văn, dịch ngôn ngữ, tạo ví dụ và hỗ trợ lập trình.
Cách nói ngắn gọn: AI là chiếc ô lớn, còn LLM là một nhóm mô hình AI chuyên về ngôn ngữ. Không phải AI nào cũng là LLM. Một hệ thống nhận diện khuôn mặt, dự báo thời tiết, phát hiện gian lận giao dịch hoặc điều khiển robot có thể là AI nhưng không nhất thiết là LLM.
Vì sao LLM có thể trò chuyện?
LLM học từ rất nhiều văn bản nên nó nắm được các mẫu trong ngôn ngữ: từ nào thường đi sau từ nào, câu hỏi thường cần dạng câu trả lời nào, một đoạn giải thích nên có cấu trúc ra sao. Khi bạn nhập một prompt, mô hình biến câu chữ thành các đơn vị nhỏ gọi là token, xử lý chúng trong ngữ cảnh, rồi dự đoán token tiếp theo nhiều lần để tạo thành câu trả lời.
Điều này khiến LLM trông giống như đang suy nghĩ. Tuy nhiên, cần nhớ rằng LLM không tự động đúng. Nó có thể trả lời rất mạch lạc nhưng vẫn sai nếu thiếu dữ liệu, hiểu sai câu hỏi, hoặc gặp chủ đề cần thông tin mới mà nó chưa kiểm chứng. Vì vậy khi dùng LLM để học tập hoặc làm việc, ta cần biết cách đặt câu hỏi, kiểm tra nguồn và dùng công cụ phù hợp.
Hiểu nhầm thường gặp
Hiểu nhầm 1: AI biết mọi thứ. Thực tế, AI chỉ tạo câu trả lời dựa trên dữ liệu đã học, ngữ cảnh hiện có và công cụ được cấp. Nó không mặc định biết dữ liệu riêng của bạn nếu bạn chưa cung cấp.
Hiểu nhầm 2: AI luôn khách quan. AI học từ dữ liệu do con người tạo ra, nên có thể mang theo thiên lệch trong dữ liệu. Một hệ thống AI tốt cần được kiểm tra, đánh giá và giới hạn rủi ro.
Hiểu nhầm 3: AI sẽ thay thế toàn bộ phần mềm thường. Thực tế, sản phẩm tốt thường kết hợp cả hai: phần mềm thường xử lý phần chắc chắn như tài khoản, dữ liệu, quyền truy cập; AI xử lý phần linh hoạt như hiểu câu hỏi, gợi ý, phân loại, tóm tắt.
Bài tập nhanh
Hãy nhìn 5 ứng dụng quanh bạn và thử phân loại: việc nào nên dùng luật cố định, việc nào có thể dùng AI?
- Đăng nhập bằng mật khẩu: phần mềm thường là đủ.
- Gợi ý bài học phù hợp với học sinh: có thể dùng AI hoặc machine learning.
- Tính tổng tiền đơn hàng: phần mềm thường là đủ.
- Tóm tắt một bài đọc dài: LLM rất phù hợp.
- Phát hiện bình luận độc hại: AI có thể hỗ trợ, nhưng cần kiểm duyệt và tiêu chí rõ ràng.
Ghi nhớ
AI là cách để máy tính xử lý những nhiệm vụ cần nhận biết mẫu, dự đoán hoặc tạo nội dung. Phần mềm thường làm theo luật rõ ràng do con người viết; AI học mẫu từ dữ liệu. LLM là một loại AI chuyên xử lý ngôn ngữ, có thể trò chuyện và tạo văn bản, nhưng vẫn cần kiểm chứng.
Ở bài tiếp theo, ta sẽ học kỹ hơn về machine learning: máy “học” là học cái gì, dữ liệu huấn luyện có vai trò ra sao, và vì sao dữ liệu tốt quyết định chất lượng của AI.






