1. Giới thiệu về bài kiểm tra AI “hóc búa” nhất

Trong thời đại trí tuệ nhân tạo (AI) phát triển nhanh chóng, việc đánh giá khả năng thực sự của AI trở thành một thách thức lớn. Humanity’s Last Exam (HLE) – bài kiểm tra AI khó nhất thế giới, ra đời nhằm mục đích này. Đứng sau dự án đầy tham vọng này là Phan Nguyễn Hoàng Long, một kỹ sư trẻ người Việt hiện đang làm việc tại Center for AI Safety (CAIS), Mỹ.

2. Hành trình chinh phục AI của Hoàng Long

Hoàng Long bắt đầu hành trình của mình tại Mỹ từ năm 2015. Ban đầu theo học ngành Kỹ sư Điện tại Đại học Case Western Reserve, nhưng niềm đam mê công nghệ thông tin đã khiến anh chuyển hướng sang Khoa học Máy tính.

Những kỳ thực tập tại các tập đoàn lớn như Zalo, Samsung, Twitter giúp Long tích lũy kinh nghiệm thực tiễn quý giá. Không chỉ dừng lại ở việc học tập, anh liên tục nghiên cứu, thử nghiệm và phát triển các dự án về AI. Chính điều này giúp anh có cơ hội gia nhập CAIS, nơi tập trung các chuyên gia hàng đầu trong lĩnh vực an toàn AI.

3. Humanity’s Last Exam – Bài kiểm tra mang tính bước ngoặt

Humanity’s Last Exam là một bài kiểm tra bao gồm 3.000 câu hỏi thuộc hơn 100 lĩnh vực khác nhau như Toán học, Vật lý, Sinh học, Cổ điển học… Mục tiêu của bài kiểm tra không chỉ đánh giá kiến thức mà còn thử thách khả năng suy luận, phản biện của AI.

Dự án này là kết quả hợp tác giữa CAIS và Scale AI, với sự tham gia của hơn 1.000 giáo sư, chuyên gia đến từ những trường đại học hàng đầu thế giới như Harvard, Stanford, MIT, Oxford… The New York Times đánh giá HLE là “bài kiểm tra mà khi AI vượt qua, chúng ta phải coi chừng”.

4. Vai trò của Hoàng Long trong dự án

Là người đứng đầu dự án, Hoàng Long chịu trách nhiệm thiết kế hệ thống, xây dựng nền tảng đánh giá AI, phát triển giao diện thân thiện cho các chuyên gia. Anh cũng phải nghiên cứu sâu rộng về nhiều lĩnh vực để đảm bảo tính chính xác và khách quan của bài kiểm tra.

Một trong những thách thức lớn nhất với Long là làm việc với những chuyên gia hàng đầu, bao gồm Dan Hendrycks – cố vấn tại xAI của Elon Musk. Điều này đòi hỏi anh phải liên tục cập nhật kiến thức, đồng thời đảm bảo mọi chi tiết trong dự án đều đạt chất lượng cao nhất.

5. Tương lai của AI và lời khuyên cho thế hệ trẻ

Với tốc độ phát triển chóng mặt của AI, Long và các cộng sự dự đoán rằng trong tương lai gần, AI có thể đạt trên 50% điểm số của HLE – một cột mốc đáng lo ngại.

Chia sẻ về con đường theo đuổi AI, Long nhấn mạnh rằng đây là một lĩnh vực đầy cơ hội nhưng cũng không kém phần cạnh tranh. Anh khuyên các bạn trẻ nếu có đam mê thì hãy chủ động học hỏi, nghiên cứu và không ngại thử thách.

“Tôi từng gặp thất bại, từng bị từ chối ở nhiều vòng phỏng vấn, nhưng tôi chưa bao giờ từ bỏ. Điều quan trọng nhất là sự kiên trì và niềm tin vào con đường mình đã chọn”, Long chia sẻ.

6. Kết luận

Phan Nguyễn Hoàng Long không chỉ là một kỹ sư AI xuất sắc mà còn là hình mẫu của sự kiên trì và bứt phá. Humanity’s Last Exam không chỉ là một bài kiểm tra mà còn là một dấu mốc quan trọng trong hành trình phát triển của AI, nơi mà con người và trí tuệ nhân tạo cùng bước vào một cuộc đua đầy thách thức.