AI sinh test xong rồi — làm sao biết nó SAI? Sổ tay kiểm chứng output AI cho QA
Đặt vấn đề
Năm 2026, AI làm gần như mọi việc bàn giấy của QA: sinh test case, viết script, bóc tách requirement, dựng dữ liệu. Vấn đề mới không còn là "làm sao tạo ra", mà là "làm sao biết cái nó tạo ra có đúng không". Kiểm chứng output AI không phải là chống AI hay làm lại từ đầu — mà là soi kết quả một cách có hệ thống trước khi dùng: dữ kiện lấy từ đâu, chỗ nào AI tự suy diễn, assertion có thật sự kiểm đúng thứ cần kiểm. Đây là phần khó thay thế nhất của nghề tester thời AI — biết output sai ở đâu và quyết định giữ/sửa/bỏ đòi hỏi kinh nghiệm mà AI không tự trao cho bạn.
🚀 Thiết lập trong 6 bước
Mất khoảng 10-15 phút lần đầu, sau đó chỉ việc dùng.
- 1Kiểu 1 — Bịa dữ kiện (số, ID, nguồn không có trong đầu vào)AI hay 'điền vào chỗ trống' bằng dữ kiện nghe hợp lý nhưng không có trong đầu vào: một con số ngưỡng, một mã lỗi, một trích dẫn tài liệu. Cách bắt: truy nguồn từng dữ kiện — mỗi số / ID / quy tắc trong output phải chỉ ra được nó lấy từ dòng nào của đầu vào. Không truy được = nghi bịa, đánh dấu 'cần xác nhận' rồi hỏi lại BA/dev.
- 2Kiểu 2 — Kết quả mong đợi mơ hồ hoặc saiNhững câu kiểu 'hệ thống hoạt động đúng', 'hiển thị phù hợp' nghe xuôi tai nhưng không kiểm được. Cách bắt: với mỗi case, hỏi 'làm sao biết nó đúng?'. Nếu không trả lời được bằng một điều quan sát được (thấy chữ X, chuyển sang trang Y, trả về mã Z) thì kết quả mong đợi đó vô dụng. Luôn đối chiếu lại requirement gốc.Xem cách viết kết quả mong đợi rõ ràng
- 3Kiểu 3 — Sót tổ hợp, giá trị biên, nhánh âm tínhAI liệt kê happy path rất tốt, nhưng hay sót: tổ hợp nhiều điều kiện cùng lúc, giá trị biên (ngay trên/dưới ngưỡng), trường hợp âm tính hiếm. Cách bắt: soi lại bằng checklist kỹ thuật thiết kế test (phân vùng tương đương, giá trị biên, bảng quyết định) và hỏi thẳng 'còn thiếu dạng nào'. Đừng coi danh sách AI đưa ra là đã đủ.Checklist 7 nhóm soát không lọt case
- 4Kiểu 4 — Test "xanh" giả (assertion yếu, luôn pass)Nguy hiểm nhất với automation: test chạy qua hết nhưng assertion quá lỏng (chỉ kiểm 'có phần tử nào đó', không kiểm đúng nội dung) nên không bao giờ đỏ — vô dụng mà tưởng an toàn. Cách bắt: cố tình làm sai rồi xem test có đỏ không — đổi một chữ trong app, bỏ một bước, cho dữ liệu sai. Test không đỏ khi đáng lẽ phải đỏ = test rởm, phải siết assertion.
- 5Kiểu 5 — Gộp nguồn cũ/mới thành câu trả lời mượt nhưng saiKhi đọc nhiều trang tài liệu hoặc nhiều file code, AI hay trộn thông tin từ phiên bản cũ và mới thành một câu trả lời trôi chảy nhưng lệch thực tế. Cách bắt: với mỗi kết luận quan trọng, hỏi 'lấy từ trang/file nào' rồi mở đúng nguồn đó đối chiếu. Ưu tiên nguồn có ghi ngày tháng / phiên bản.Xem cách bắt mâu thuẫn giữa các trang tài liệu
- 6Kiểu 6 — Tự tin sai ở vùng code phức tạpVới code bất đồng bộ, hàng đợi, race condition, múi giờ, AI hay trace sai nhưng vẫn trình bày chắc nịch. Cách bắt: ở những vùng rủi ro cao (thanh toán, xác thực, đồng bộ dữ liệu), không dùng output AI làm kết luận — coi nó là giả thuyết, tự đọc code và hỏi dev để xác nhận trước khi đưa vào test plan.Xem cách trace luồng nghiệp vụ qua code
🔍 2 prompt — kèm chỗ AI hay sai cần bắt
AI sinh kết quả chỉ trong vài giây — việc của bạn là kiểm lại. Mỗi prompt kèm ví dụ kết quả và 🔍 Góc soi lỗi của Tester (chỗ AI hay sai, nên xem trước khi dùng). Bấm Copy → dán vào Claude Code / ChatGPT.
Nhờ AI tự soi lại output của nó: dữ kiện nào lấy từ đầu vào, cái nào nó tự suy diễn — để bạn biết chỗ nào cần xác minh.
Dưới đây là đầu vào và một output bạn vừa tạo. Hãy rà lại chính output đó và lập bảng: Dữ kiện | Lấy từ đâu trong đầu vào (trích dòng) | Hay do bạn tự suy diễn/giả định. Đánh dấu rõ những dữ kiện KHÔNG có trong đầu vào để tôi xác minh. Không bào chữa, không thêm dữ kiện mới. [DÁN ĐẦU VÀO + OUTPUT CẦN SOI VÀO ĐÂY]
Cách nhanh để lộ chỗ AI 'điền vào chỗ trống'. Nhưng AI tự soi cũng có thể bỏ sót hoặc bào chữa cho lỗi của chính nó — vẫn nên tự đối chiếu lại đầu vào, đừng phó thác hoàn toàn việc kiểm cho đúng cái cần kiểm.
Nhờ AI tự chỉ những chỗ trong output dễ sai/rủi ro nhất + vì sao, để bạn dồn sức kiểm đúng chỗ thay vì rà đều.
Dưới đây là một output bạn vừa tạo. Giả sử bạn là một QA khó tính review lại nó: chỉ ra 3-5 chỗ dễ sai hoặc rủi ro nhất, mỗi chỗ nói rõ vì sao đáng nghi và tôi nên kiểm gì để xác nhận. Xếp theo mức rủi ro giảm dần. [DÁN OUTPUT CẦN SOI VÀO ĐÂY]
Prompt này giúp khoanh vùng nhưng không thay việc kiểm — AI chỉ đoán chỗ rủi ro dựa trên văn bản, không chạy thật. Dùng nó để biết nên kiểm ĐÂU trước, rồi tự kiểm / chạy thật để biết ĐÚNG hay SAI.
📌 Tóm lại
Thời AI làm được hết, người tester giỏi không phải người biết nhiều prompt — mà là người biết khi nào output sai và đủ bản lĩnh không tin theo. AI tạo ra trong vài giây; còn 'có dùng được không' vẫn là chữ ký của bạn. Đó là phần việc không bàn giao cho máy được.