Giám sát "chuỗi tư duy" của trí tuệ nhân tạo

Đây được coi là một cơ hội mong manh nhưng quan trọng để đảm bảo an toàn trong việc ứng dụng AI trong tương lai. Đặc biệt, nó có ý nghĩa khi Việt Nam vừa thông qua Luật Công nghiệp Công nghệ Số với những quy định chi tiết về quản lý trí tuệ nhân tạo (AI).

"Cửa sổ cơ hội" đang thu hẹp

Ông Bowen Baker, chuyên gia nghiên cứu về OpenAI chia sẻ rằng trong một bài báo chung gần đây, các nhà nghiên cứu về cảnh báo rằng khả năng giám sát “tư duy” của AI có thể sẽ biến mất nếu không có những nỗ lực tập trung nghiên cứu.

Điều này đặc biệt quan trọng khi các mô hình AI ngày càng mạnh mẽ và có khả năng gây ra những tác động nghiêm trọng đến xã hội.

Một đặc điểm chính của các mô hình AI lý luận như o-3 của OpenAI và R1 của DeepSeek là “chuỗi tư duy” (chain of thought - CoT) - quá trình AI thể hiện các bước suy luận của mình bằng ngôn ngữ tự nhiên, tương tự như cách con người viết ra từng bước giải toán trên giấy nháp.

Khả năng này cho phép chúng ta có cái nhìn hiếm hoi về cách AI đưa ra quyết định.

Điều này đánh dấu một khoảnh khắc đoàn kết hiếm hoi giữa nhiều nhà lãnh đạo trong ngành AI nhằm thúc đẩy nghiên cứu về an toàn AI.

Đặc biệt, nó có ý nghĩa trong bối cảnh các công ty công nghệ đang cạnh tranh gay gắt trong việc phát triển AI. Những người ký tên trong bài báo đáng chú ý trên bao gồm Mark Chen - Giám đốc nghiên cứu OpenAI, Ilya Sutskever - CEO Safe Superintelligence, Geoffrey Hinton - người đã từng đoạt Giải Nobel, Shane Legg - đồng Sáng lập Google DeepMind và Dan Hendrycks - Cố vấn an toàn xAI.

Sự tham gia của các tên tuổi hàng đầu này cho thấy tầm quan trọng của vấn đề.

Cũng theo đánh giá của ông Bowen Baker, “Chúng ta đang ở thời điểm quan trọng khi có cái gọi là “chuỗi tư duy” mới này có thể sẽ biến mất trong vài năm tới nếu mọi người không thực sự tập trung vào nó”.

Giám sát chuỗi tư duy của trí tuệ nhân tạo - 1

Tại sao giám sát “tư duy AI” lại quan trọng?

Các hệ thống AI hiện tại thường được coi như những “hộp đen” - chúng ta biết đầu vào và đầu ra nhưng không hiểu được quy trình ra quyết định bên trong.

Điều này sẽ trở nên nguy hiểm khi AI được ứng dụng trong các lĩnh vực quan trọng như Y tế, Tài chính và An ninh quốc gia.

Giám sát CoT là một hệ thống tự động đọc chuỗi tư duy của mô hình lý luận và các thông tin liên quan khác để đánh dấu những tương tác đáng nghi ngờ hoặc có thể có hại. Đây không phải là giải pháp toàn diện, nhưng có thể trở thành một lớp bảo vệ an toàn quý giá.

Nghiên cứu từ OpenAI cho thấy các mô hình AI có xu hướng thể hiện rất rõ ràng ý định của chúng trong chuỗi tư duy.

Ví dụ, chúng thường rất thẳng thắn về kế hoạch phá hoại một nhiệm vụ khi chúng nghĩ “Let’s hack” (“hãy gian lận”). Điều này cho thấy khả năng giám sát và phát hiện hành vi sai trái của AI.

“Let’s hack” là cụm từ mà các mô hình AI thường “nghĩ” khi “chúng” định phá hoại hoặc lách luật trong quá trình thực hiện nhiệm vụ.

Việc AI thể hiện ý định “hack” trong chuỗi tư duy cho thấy chúng ta có thể phát hiện ra được hành vi xấu của AI trước khi nó thực hiện. Đây chính là lý do tại sao việc giám sát chuỗi tư duy lại quan trọng.

Nói cách khác “let’s hack” như một “tín hiệu cảnh báo” cho con người biết AI sắp làm điều gì đó sai trái.

Việt Nam với quy định pháp lý về AI

Thực tế là Việt Nam đã có những bước tiến quan trọng trong việc xây dựng khung pháp lý cho AI.

Ngày 14/6, Quốc hội Việt Nam đã thông qua Luật Công nghiệp Công nghệ Số, trong đó tại Chương IV có quy định chi tiết về trí tuệ nhân tạo - một trong những khung pháp lý được coi là toàn diện nhất về AI tại khu vực Đông Nam Á hiện nay.

Điều 41 của Luật đã đặt ra những nguyên tắc cơ bản cho việc phát triển, cung cấp và triển khai sử dụng AI tại Việt Nam.

Đặc biệt, điểm b khoản 1 quy định: “Bảo đảm minh bạch, trách nhiệm giải trình, khả năng giải thích được; bảo đảm không vượt qua tầm kiểm soát của con người”.

Giám sát chuỗi tư duy của trí tuệ nhân tạo - 2 — Quốc hội thông qua Luật Công nghiệp Công nghệ Số (Ảnh: Nhật Bắc).

Đây chính là những nguyên tắc mà các nhà khoa học quốc tế đang kêu gọi thông qua khi bàn về việc giám sát chuỗi tư duy AI.

Ngoài ra, điểm đ khoản 1 Điều 41 quy định: “Bảo đảm khả năng kiểm soát thuật toán, mô hình trí tuệ nhân tạo”. Điều này hoàn toàn phù hợp với tinh thần giám sát CoT mà các chuyên gia quốc tế đang đề xuất.

Quan trọng hơn nữa, điểm a khoản 1 Điều 41 còn đặt ra một tiêu chuẩn đạo đức cao khi quy định AI phải “phục vụ sự thịnh vượng và hạnh phúc của con người, lấy con người làm trung tâm”.

Điều này có nghĩa rằng việc giám sát chuỗi tư duy AI không chỉ là yêu cầu kỹ thuật mà còn là nghĩa vụ đạo đức - đảm bảo AI luôn hướng tới lợi ích con người chứ không phải mục tiêu riêng của máy móc.

Phân loại và quản lý AI theo mức độ rủi ro

Luật Công nghiệp Công nghệ Số của Việt Nam đã đi một bước xa hơn khi phân loại AI thành các nhóm rủi ro khác nhau với định nghĩa rõ ràng và khoa học.

Điều 43 đưa ra khái niệm “Hệ thống trí tuệ nhân tạo rủi ro cao” là những hệ thống có khả năng gây ra rủi ro, tổn hại nghiêm trọng tới sức khỏe con người, quyền con người và trật tự xã hội.

Điều thú vị là Luật đã đưa ra các ngoại lệ cụ thể cho AI rủi ro cao, bao gồm những hệ thống “nhằm hỗ trợ con người trong việc tối ưu hóa kết quả công việc” và “không nhằm mục đích thay thế quyết định của con người”.

Điều này cho thấy tư duy cân bằng giữa việc khuyến khích đổi mới và đảm bảo an toàn.

Giám sát chuỗi tư duy của trí tuệ nhân tạo - 3 — Việc phân loại AI theo mức độ rủi ro sẽ giúp tạo ra một hệ thống giám sát đa tầng (Ảnh minh hoạ: Linkedln).

Đặc biệt, việc phân biệt giữa “AI rủi ro cao” và “AI tác động lớn” (hệ thống được sử dụng đa mục đích, có số lượng người dùng lớn) thể hiện sự tinh tế trong cách tiếp cận.

Đây là một cách phân loại tiến bộ hơn cả Luật về Trí tuệ nhân tạo (AI Act) của Liên minh châu Âu (EU), khi không chỉ xem xét mức độ rủi ro mà còn xét đến quy mô và phạm vi tác động.

Việc phân loại này sẽ giúp tạo ra một hệ thống giám sát đa tầng, trong đó giám sát chuỗi tư duy sẽ đặc biệt quan trọng đối với những hệ thống AI rủi ro cao và tác động lớn.

Nền tảng cho giám sát AI

Một trong những điểm nổi bật và tiên phong của Luật Công nghiệp và Công nghệ Số của Việt Nam là yêu cầu về minh bạch và dấu hiệu nhận dạng.

Điều 44 quy định rằng hệ thống AI tương tác trực tiếp với con người phải thông báo cho người sử dụng biết việc đang tương tác với hệ thống AI. Đồng thời, sản phẩm được tạo ra bởi AI phải có dấu hiệu nhận dạng.

Điều này có ý nghĩa quan trọng đối với việc triển khai giám sát CoT. Khi người dùng biết mình đang tương tác với AI, họ sẽ có quyền yêu cầu giải thích về quy trình ra quyết định, tạo áp lực tích cực để các nhà phát triển AI duy trì khả năng giám sát chuỗi tư duy của AI.

Đặc biệt, việc Bộ Khoa học và Công nghệ được giao trách nhiệm “ban hành Danh mục sản phẩm công nghệ số tạo ra bởi trí tuệ nhân tạo” cho thấy sự chủ động trong việc quản lý.

Đây là một khác biệt quan trọng so với nhiều quốc gia khác, nơi các quy định về AI thường mang tính chung chung hơn.

Hơn nữa, việc yêu cầu dấu hiệu nhận dạng “để người sử dụng hoặc máy nhận biết” thể hiện tầm nhìn xa về một hệ sinh thái AI có thể tự giám sát lẫn nhau - điều này hoàn toàn phù hợp với ý tưởng về giám sát chuỗi tư duy tự động.

Mô hình quản lý toàn diện

Điều 45 của Luật nói trên thể hiện một triết lý quản lý tiến bộ khi phân định rõ ràng trách nhiệm của 3 nhóm chủ thể theo vòng đời sản phẩm AI: Chủ thể phát triển, chủ thể cung cấp và chủ thể triển khai sử dụng hệ thống AI.

Điều này tạo ra một hệ thống trách nhiệm liền mạch từ đầu đến cuối, đảm bảo rằng việc giám sát AI không chỉ là trách nhiệm của một bên.

Đáng chú ý, sự phân biệt tinh tế giữa “phát triển” và “cung cấp” AI; chủ thể phát triển là những người “nghiên cứu và phát triển”, trong khi chủ thể cung cấp là những người đưa ra thị trường dưới tên nhãn hiệu.

Điều này có nghĩa rằng ngay cả khi một công ty chỉ tái thương hiệu hóa một mô hình AI có sẵn, họ vẫn phải chịu trách nhiệm về tính minh bạch và khả năng giải thích.

Giám sát chuỗi tư duy của trí tuệ nhân tạo - 4

Điều đặc biệt thú vị ở đây còn là cách luật phân bổ trách nhiệm khác nhau cho từng chủ thể.

Chủ thể phát triển phải tuân thủ tất cả nguyên tắc, chủ thể cung cấp phải thêm trách nhiệm về dấu hiệu nhận dạng và quản lý rủi ro cao, còn chủ thể sử dụng được “miễn trừ” một phần trách nhiệm nhưng vẫn phải đảm bảo minh bạch và kiểm soát rủi ro.

Mô hình này tạo ra một “chuỗi trách nhiệm” trong đó mỗi khâu đều có động lực duy trì khả năng giám sát chuỗi tư duy AI, vì tất cả đều phải chịu trách nhiệm trước người dùng cuối.

Thách thức trong việc duy trì khả năng giám sát

Tuy nhiên, khả năng giám sát chuỗi tư duy AI có thể vẫn còn là mong manh và dễ bị tan biến. Các kiến trúc AI mới còn có thể đặt ra những mối đe dọa khác.

Nhiều nhà nghiên cứu đang phát triển các hệ thống lý luận trong không gian toán học liên tục, thay vì từ ngữ rời rạc, có thể loại bỏ hoàn toàn nhu cầu sử dụng ngôn ngữ trong tư duy.

Hơn nữa, AI có thể trở nên “lọc lõi” - là việc nó chỉ cho con người thấy những suy nghĩ tích cực để được đánh giá cao, trong khi lại cố tình giấu đi những ý định thực sự.

Nguy cơ ở đây là một khi AI nhận ra “mình” đang bị giám sát, nó có thể học cách che giấu chuỗi tư duy thật của nó.

Trong bối cảnh này, quy định về “kiểm soát rủi ro trong suốt vòng đời của hệ thống trí tuệ nhân tạo” tại điểm e khoản 1 Điều 41 của Luật Việt Nam trở nên đặc biệt quan trọng. Điều này đòi hỏi phải có cơ chế giám sát liên tục, không chỉ tại thời điểm triển khai.

Tác động đến tương lai phát triển AI

Việc giám sát chuỗi tư duy có thể trở thành công cụ quan trọng để đảm bảo AI hoạt động theo cách có lợi cho con người.

Nếu các mô hình tiếp tục lý luận bằng ngôn ngữ tự nhiên và nếu những hành vi gây ra rủi ro nghiêm trọng nhất đòi hỏi lý luận mở rộng, thực tế này có thể cho phép phát hiện đáng tin cậy hành vi sai trái nghiêm trọng.

Đối với Việt Nam, việc áp dụng kỹ thuật giám sát CoT sẽ giúp thực hiện hiệu quả các quy định của luật.

Ví dụ, yêu cầu về “khả năng giải thích được” tại Điều 41 sẽ dễ dàng hơn khi có thể truy cập vào chuỗi tư duy của AI. Tương tự, việc “kiểm soát thuật toán, mô hình trí tuệ nhân tạo” sẽ trở nên khả thi hơn.

Việc triển khai giám sát chuỗi tư duy AI tại Việt Nam sẽ đối mặt với một số thách thức. Trước hết là vấn đề nguồn nhân lực - thiếu hụt các chuyên gia AI có khả năng phát triển và vận hành hệ thống giám sát.

Điều này đòi hỏi đầu tư mạnh mẽ vào đào tạo và thu hút nhân tài.

Hướng đi cho tương lai

Các nhà nghiên cứu kêu gọi các hãng phát triển mô hình AI hàng đầu cần nghiên cứu những yếu tố làm cho CoT có thể “giám sát được” những yếu tố có thể tăng hoặc giảm tính minh bạch về cách các mô hình AI và sớm đưa ra câu trả lời.

Cơ hội để giám sát “tư duy” của AI có thể là cửa sổ cuối cùng để chúng ta duy trì khả năng kiểm soát các hệ thống trí tuệ nhân tạo ngày một mạnh mẽ hơn như hiện nay.

Giám sát chuỗi tư duy của trí tuệ nhân tạo - 5

Đối với Việt Nam, việc đã có khung pháp lý toàn diện về AI thông qua Luật Công nghiệp Công nghệ Số là một lợi thế lớn. Các quy định về minh bạch, khả năng kiểm soát thuật toán và phân loại rủi ro đã tạo ra nền tảng pháp lý vững chắc để áp dụng kỹ thuật giám sát chuỗi tư duy AI.

Việc kết hợp giữa nghiên cứu quốc tế tiên tiến và khung pháp lý tiến bộ trong nước sẽ giúp Việt Nam không chỉ phát triển AI một cách an toàn mà còn có thể trở thành một hình mẫu cho các quốc gia khác trong khu vực.

Điều này phù hợp với mục tiêu đưa Việt Nam trở thành “trung tâm công nghệ số khu vực và toàn cầu” như đã được đề ra trong các chiến lược phát triển quốc gia.

Với nền tảng pháp lý đã có, Việt Nam cần nhanh chóng triển khai các nghiên cứu và ứng dụng thực tiễn về giám sát chuỗi tư duy AI. Chỉ bằng cách đó, chúng ta mới có thể đảm bảo rằng AI sẽ phục vụ “sự thịnh vượng và hạnh phúc của con người” như tinh thần của Luật Công nghiệp Công nghệ Số đã định hướng.

Nguồn: https://dantri.com.vn/cong-nghe/giam-sat-chuoi-tu-duy-cua-tri-tue-nhan-tao-20250731151403739.htm