Từ luận văn tốt nghiệp của sinh viên Trường ĐH Bách khoa (ĐH Quốc gia TP.HCM), một nghiên cứu về kỹ thuật mới giúp AI trả lời câu hỏi trắc nghiệm ổn định hơn được đăng trên tạp chí quốc tế Q1.
Khởi nguồn từ một luận văn tốt nghiệp đại học, công trình nghiên cứu của thầy trò khoa khoa học và kỹ thuật máy tính của trường này đã được công bố trên tạp chí quốc tế hàng đầu về trí tuệ nhân tạo (AI) trong giáo dục sau khi trải qua nhiều vòng phản biện.
Bài báo Enhancing Large Language Model Performance for Automatic Zero-Shot Multiple-Choice Question Answering via Single-Token Logit Prompting của nhóm tác giả từ Việt Nam đã được công bố trên tạp chí Computers and Education: Artificial Intelligence.
Đây là tạp chí mở thuộc Nhà xuất bản Elsevier, hiện xếp hạng Q1, đứng đầu lĩnh vực giáo dục (Education), hạng 4 trong lĩnh vực khoa học máy tính ứng dụng (Computer Science Applications) và hạng 5 lĩnh vực trí tuệ nhân tạo (AI- Artificial Intelligence), theo SCImago.
Nhóm tác giả gồm Đặng Phú Quốc – cựu sinh viên Trường ĐH Bách khoa (đồng tác giả chính), Trần Trương Tuấn Phát – giảng viên Trường ĐH Bách khoa (đồng tác giả chính), TS Vũ Đức Lý (giảng viên Trường ĐH Quốc tế Miền Đông), Nguyễn Song Thiên Long và Võ Thị Như Quỳnh cùng là sinh viên năm thứ ba Trường ĐH Bách khoa, được PGS.TS Quản Thành Thơ – Trưởng khoa khoa học và kỹ thuật máy tính Trường ĐH Bách khoa (ĐH Quốc gia TP.HCM) hướng dẫn.
Công trình tập trung vào đề xuất kỹ thuật viết lời nhắc (prompting) mới mang tên Single-Token Logit (STL) nhằm nâng cao độ chính xác và tính ổn định của các mô hình ngôn ngữ lớn (LLM) khi tự động trả lời câu hỏi trắc nghiệm (MCQ). Tác giả Đặng Phú Quốc cho biết nghiên cứu xuất phát từ luận văn tốt nghiệp đại học của anh.
“Ban đầu mình chỉ đặt mục tiêu giải quyết tốt một bài toán chuyên môn về mô hình ngôn ngữ lớn, chứ không kỳ vọng sẽ được công bố trên tạp chí thứ hạng cao. Sau khoảng 28 tháng kể từ khi bắt tay nghiên cứu, đến tháng 3-2026 công trình đã được đăng trên tạp chí Computers and Education: Artificial Intelligence”, anh Quốc chia sẻ.
Thông tin thêm, anh Trần Trương Tuấn Phát cho hay nhóm đã trải qua nhiều vòng phản biện kín hai chiều. Mỗi vòng đều yêu cầu những cải tiến đáng kể như bổ sung thí nghiệm, làm rõ cách diễn giải, củng cố định hướng nghiên cứu và tái cấu trúc bản thảo.
Việc lựa chọn nơi nộp bài được nhóm thực hiện theo gợi ý của Nhà xuất bản Elsevier. Chỉ sau khi được chấp nhận, nhóm mới có thông tin đây là tạp chí đứng đầu thế giới trong lĩnh vực giáo dục (Education). “Đó là kết quả đặc biệt mà chính nhóm tác giả cũng không ngờ tới”, PGS.TS Quản Thành Thơ nói thêm.
Từ thực tế nghiên cứu, nhóm nhận thấy hiện tượng gọi là giới hạn Multiple-Choice Symbol Binding (MCSB) làm giảm đáng kể độ tin cậy của LLM, nhất là khi ứng dụng vào chấm bài hay xây dựng ngân hàng câu hỏi của lĩnh vực giáo dục. Vì thế, nhóm đề xuất kỹ thuật Single-Token Logit (STL).
Thay vì đưa toàn bộ đáp án và yêu cầu mô hình chọn A – B – C – D như thông thường, STL tách từng đáp án riêng biệt và yêu cầu mô hình đánh giá theo dạng đúng – sai cho từng lựa chọn.
Hệ thống lần lượt hỏi “Đáp án này có đúng không?” và sử dụng xác suất của token “yes” để đánh giá mức độ phù hợp. “Cơ chế này giúp mô hình xác minh từng lựa chọn một cách độc lập, không bị chi phối bởi vị trí hay nhãn đáp án, khắc phục trực tiếp hạn chế của giới hạn MCSB”, anh Phát nói về ưu điểm của nghiên cứu.
Nghiên cứu còn tích hợp kỹ thuật Retrieval-Augmented Generation (RAG) cho phép mô hình truy xuất kiến thức bên ngoài khi cần, giúp tăng độ chính xác theo ngữ cảnh cũng như kiểm tra độ ổn định của giải pháp trong các điều kiện khác nhau.
Khi thử nghiệm trên ba bộ dữ liệu khoa học chuẩn gồm ARC, OpenBookQA và SciQ, STL cho kết quả ngang bằng hoặc vượt trội so với nhiều phương pháp phổ biến với mức cải thiện lên tới 11 điểm phần trăm trong một số cấu hình, đồng thời giảm đáng kể chi phí tính toán.
Về tiềm năng ứng dụng, kỹ thuật STL có thể hỗ trợ giáo viên rà soát đề thi, tự động gợi ý đáp án cho câu hỏi chưa có lời giải, hỗ trợ chấm bài và phát triển các hệ thống học tập thông minh có khả năng giải thích kết quả đánh giá.
Theo PGS.TS Quản Thành Thơ, công bố không chỉ đóng góp xuất sắc về mặt giá trị học thuật đối với các nghiên cứu trong lĩnh vực LLM mà còn cho thấy việc nâng cao độ tin cậy của AI không nhất thiết phải đến từ mô hình lớn hơn hay kiến trúc phức tạp. “Đôi khi chỉ một thay đổi nhỏ trong cách thiết kế lời nhắc (prompt) cũng có thể tạo ra khác biệt lớn trong ứng dụng thực tế”, ông Thơ nhận định.
Rời phòng thi ở trường Đại học Công nghệ Kỹ thuật TP HCM lúc hơn 11h, Thành Công, học sinh trường THPT Bình Chiểu, lập tức tìm nhóm bạn bàn về câu hỏi niêm luật (quy tắc về thanh điệu, gieo vần) trong khổ thơ Đường.
"Em chưa từng gặp câu hỏi này nên khoanh may rủi, xác định mất điểm", Thành Công nói.
Nam sinh nói đề dài 16 trang, cấu trúc tương tự đề minh họa. 30 câu hỏi Tiếng Việt trong phần Sử dụng ngôn ngữ khiến em bất ngờ vì độ khó cao hơn nhiều so các đề từng luyện. Câu hỏi dài với ngữ liệu chủ yếu là thơ văn trung đại khiến nam sinh mất thời gian đọc.
Ngoài ra, phần Toán học thách thức vì một số câu cho nhiều ẩn để "chống" bấm máy tính. Tổng quan, em đánh giá đề thi đánh giá năng lực khó gấp rưỡi so với đề minh họa của Đại học Quốc gia TP HCM. Nam sinh ước chừng đạt hơn 700/1200 điểm, chưa an toàn nên sẽ tiếp tục thi lần hai vào cuối tháng 5.
Đồng tình, Thùy Dương, THPT Nguyễn Hữu Huân, nói câu hỏi Tiếng Việt dài và đáp án gây nhiễu, "na ná nhau". Bù lại, Dương giải quyết tốt phần Tiếng Anh và Tư duy khoa học. Nữ sinh kỳ vọng đạt 900 điểm trở lên để đăng ký xét vào Đại học Kinh tế TP HCM và trường Đại học Khoa học Xã hội và Nhân văn.
"Đề khó gấp rưỡi, đặc biệt phần Tiếng Việt, nhiều câu em không hiểu đề", Dương nói.
Anh Thư, THPT Thủ Đức, rầu rĩ vì mất nhiều thời gian cho các câu hỏi Tiếng Việt. Nữ sinh dự định dành 30 phút nhưng cuối cùng mất 45 phút vẫn không chắc chắn toàn bộ đáp án cho phần này. Điều này cũng khiến em không kịp đọc kỹ những câu cuối, ước chừng 30 câu phải khoanh đáp án một cách may rủi.
"Lẽ ra em nên phân phối thời gian hợp lý hơn", Thư tiếc nuối và cho biết sẽ dự thi đợt sau để cải thiện kết quả.
Khảo sát 10 thí sinh tại điểm trường Đại học Công nghệ Kỹ thuật TP HCM, có 8 em nhận định phần Tiếng Việt dài và khó. Đặc biệt, câu hỏi niêm luật khiến nhiều em nhăn mặt vì ít phổ biến nên không để ý trong quá trình học.
Đề thi đánh giá năng lực của Đại học Quốc gia TP HCM gồm 120 câu, thời gian làm bài 150 phút. Phần Tư duy khoa học có 30 câu gồm Logic - Phân tích số liệu và Suy luận khoa học. Phần Sử dụng ngôn ngữ gồm Tiếng Việt và Tiếng Anh với 60 câu. Cuối cùng là Toán học với 30 câu.
Câu hỏi được xây dựng theo hướng cung cấp thông tin, số liệu, dữ kiện, từ đó yêu cầu thí sinh vận dụng, xác định kết quả thực nghiệm, dự đoán quy luật...
Theo thống kê của Đại học Quốc gia TP HCM, gần 133.500 thí sinh tham gia thi đánh giá năng lực sáng 5/4, tỷ lệ 98%. Công tác coi thi đúng quy chế, chưa ghi nhận trường hợp sai sót, sự cố. Kết quả sẽ được công bố vào ngày 17/4.
Đợt hai của kỳ thi sẽ diễn ra ngày 24/5. Kết quả kỳ thi được 118 trường đại học, cao đẳng dùng để xét đầu vào. Năm ngoái, em Mai Quang Minh Trí vượt qua 152.000 thí sinh giành vị trí thủ khoa với 1.122/1200 điểm.
Tinh thần đổi mới ấy đã được thể hiện rõ nét tại Hội nghị Toàn quốc Khoa học Xã hội và Ngôn ngữ 2026, do Trường Đại học Công nghệ TP.HCM (HUTECH) phối hợp cùng Trường Đại học Kinh tế - Tài chính TP.HCM (UEF) tổ chức.
Ghi nhận 145 bài báo toàn văn đến từ 35 cơ sở đào tạo và nghiên cứu trong nước cùng nhiều trường đại học quốc tế như Đại học Quốc lập Thanh Hoa, Đại học Ngôn ngữ Bắc Kinh và Học viện Công nghệ Bắc Kinh (Trung Quốc), sự kiện trở thành ‘điểm hẹn’ nghiên cứu, thu hút đông đảo nhà khoa học, học giả tham gia.
GS.TS. Lê Văn Cảnh - Phó hiệu trưởng HUTECH - cho rằng: "Các nhà nghiên cứu cần chủ động thích ứng, khai thác hiệu quả công nghệ mới, đồng thời bảo tồn các giá trị nhân văn và cảm xúc con người.
Đây không chỉ là thách thức mà còn là cơ hội để khoa học xã hội khẳng định vị thế trong hệ sinh thái tri thức hiện đại".
GS.TS. Lê Văn Cảnh phát biểu khai mạc chương trình - Ảnh: NTCC
Mở đầu phiên toàn thể, 4 tham luận tiêu biểu đến từ các báo cáo viên thuộc nhiều trường đại học uy tín đã tập trung vào các vấn đề trọng tâm của khoa học xã hội và ngôn ngữ trong bối cảnh chuyển đổi số.
Nội dung các báo cáo bao quát nhiều hướng tiếp cận như hệ giá trị văn hóa, giáo dục ngôn ngữ, nghiên cứu liên ngành và các xu hướng quản lý trong lĩnh vực mới, thể hiện bức tranh đa chiều của hoạt động nghiên cứu hiện nay.
Các tham luận gắn với thực tiễn, thu hút nhiều ý kiến trao đổi đa chiều - Ảnh: NTCC
Bên cạnh phiên toàn thể, hội nghị tổ chức 06 tiểu ban chuyên môn gồm: Khoa học xã hội; Khoa học giáo dục; Luật học và Quan hệ quốc tế; Du lịch bền vững; Khoa học chính trị và các ngành ngôn ngữ (Trung Quốc học, Hàn Quốc học, Nhật Bản học, Ngôn ngữ Anh).
Tại đây, hơn 40 báo cáo viên đã trình bày, trao đổi và phản biện các kết quả nghiên cứu trong môi trường học thuật, tăng cường kết nối chuyên môn và thúc đẩy hợp tác liên ngành.
Hơn 40 báo cáo viên trình bày tại các phiên tiểu ban - Ảnh: NTCC
Góp phần khuyến khích các hình thức truyền đạt và tiếp cận tri thức sáng tạo, hội nghị đã trưng bày hơn 20 poster nghiên cứu về đa dạng các vấn đề khoa học xã hội và ngôn ngữ.
Hoạt động không chỉ ghi nhận nỗ lực của các tác giả mà còn tạo nên không gian học thuật năng động, thúc đẩy các ý tưởng mới đến cộng đồng nghiên cứu trẻ.
Chia sẻ về điểm đặc biệt của hội nghị năm nay, PGS.TS. Phạm Văn Việt - Trưởng phòng Khoa học Công nghệ HUTECH cho biết, lần đầu tiên hội nghị áp dụng hệ thống quản lý bài nộp trực tuyến thực hiện hoàn toàn trên nền tảng số.
Các bản thảo đều được kiểm tra trùng lặp, phân công biên tập viên chuyên môn phụ trách và đánh giá bởi hai phản biện độc lập theo mô hình ‘mù đôi’. Qua đó nâng cao chất lượng học thuật và tiệm cận các chuẩn mực quốc tế trong xuất bản khoa học.
Hôm nay (6.4), ĐH Quốc gia TP.HCM đã triển khai các phương án chấm thi đánh giá năng lực đợt 1. Hoạt động chấm thi kéo dài trong khoảng 10 ngày và dự kiến công bố điểm thi trong ngày 17.4.
Theo quy định của Hội đồng thi đánh giá năng lực ĐH Quốc gia TP.HCM, bài thi của thí sinh tại các điểm thi được vận chuyển về phòng chấm thi ngay sau buổi thi. Để đảm bảo an toàn và đúng quy định cho công tác chấm thi, địa điểm chấm thi (phòng chấm thi) được bố trí ở khu vực được bảo vệ 24/24 giờ và có camera giám sát 24/24 giờ cả bên trong và bên ngoài phòng chấm.
Quy trình chấm thi tuân thủ nghiêm các quy định của ĐH Quốc gia TP.HCM. Trước đó, ĐH này đã thành lập Tổ giám sát trong đó có cán bộ An ninh (PA03) và cán bộ đoàn kiểm tra của ĐH Quốc gia TP.HCM để giám sát tất cả các hoạt động trong thời gian chấm thi.
Các hoạt động chấm thi gồm: giao nhận và phân lô bài thi trắc nghiệm; kiểm tra số lượng phiếu trả lời trắc nghiệm và quét bài thi trắc nghiệm; đánh số phách bài thi theo từng lô; nhận dạng và xử lý dữ liệu bài thi trắc nghiệm; kiểm dò bài thi ngẫu nhiên; niêm phong bài thi và đĩa chứa dữ liệu; thực hiện chấm điểm (chấm điểm thô và quy đổi điểm); ráp phách điểm bài thi thí sinh; xuất danh sách điểm thi của thí sinh.
Mỗi bước trong công tác chấm thi được phân công cho một tổ/nhóm nghiệp vụ thuộc ban chấm thi phụ trách. Tất cả các dữ liệu liên quan đến công tác chấm thi phải được lưu dưới dạng USB hoặc đĩa CD và gửi đến chủ tịch hội đồng thi, ban chấm thi, khi đó ban chấm thi mới được mở niêm phong đĩa CD chứa đáp án để tiến hành chấm điểm. Sau khi chủ tịch hội đồng thi duyệt kết quả, điểm thi sẽ được công bố trên cổng thông tin của kỳ thi.
Bài thi đánh giá năng lực của ĐH Quốc gia TP.HCM có 120 câu hỏi, với tổng điểm tối đa toàn bài là 1.200. Trong đó, điểm tối đa từng thành phần của bài thi được thể hiện trên phiếu điểm gồm: tiếng Việt 300 điểm, tiếng Anh 300 điểm; toán học 300 điểm và tư duy khoa học 300 điểm.
Tuy nhiên, kết quả thi đánh giá năng lực được xác định bằng phương pháp trắc nghiệm hiện đại theo lý thuyết ứng đáp câu hỏi (Item Response Theory - IRT). Điểm của từng câu hỏi có trọng số khác nhau tùy thuộc vào độ khó của câu hỏi.
Theo quy định, độ khó của các câu hỏi trong đề thi được phân thành 3 mức độ và được phân bố theo tỷ lệ: mức độ 1 chiếm 30%, mức độ 2 chiếm 40%, mức độ 3 chiếm 30%.
Hôm qua (5.4), 133.489 thí sinh đã tham dự đợt 1 kỳ thi đánh giá năng lực do ĐH Quốc gia TP.HCM tổ chức (đạt tỷ lệ 98,33% so với số thí sinh đăng ký dự thi). Kỳ thi đồng thời diễn ra tại 15 tỉnh, thành phố tính theo đơn vị hành chính sau sáp nhập, gồm: Huế, Đà Nẵng, Quảng Ngãi, Gia Lai, Đắk Lắk, Khánh Hòa, Lâm Đồng, TP.HCM, Đồng Nai, Tây Ninh, Đồng Tháp, Vĩnh Long, An Giang, Cần Thơ và Cà Mau.
Năm 2025, kỳ thi đánh giá năng lực ĐH Quốc gia TP.HCM thu hút khoảng 152.000 thí sinh với hơn 223.000 lượt đăng ký dự thi tại 55 điểm thi thuộc 25 tỉnh, thành phố. 111 cơ sở giáo dục ĐH-CĐ sử dụng kết quả kỳ thi để xét tuyển. Riêng trong hệ thống ĐH Quốc gia TP.HCM, phương thức này chiếm hơn 56% tổng chỉ tiêu tuyển sinh.