Tập đoàn công nghệ khổng lồ Trung Quốc, Tencent đã chính thức ra mắt phiên bản hoàn thiện của mô hình suy luận T1 vào tối qua (21/3), đánh dấu bước tiến mới trong cuộc cạnh tranh ngày càng khốc liệt ở lĩnh vực trí tuệ nhân tạo (AI).
Theo thông báo của Tencent trên tài khoản WeChat chính thức, mô hình T1 được nâng cấp mang đến tốc độ phản hồi nhanh hơn và khả năng xử lý các tài liệu văn bản dài vượt trội.
Tencent trình làng mô hình suy luận T1, vượt trội so với DeepSeek ở một số tiêu chuẩn về kiến thức và khả năng suy luận.
Bài đăng cho biết T1 có thể "giữ logic nội dung rõ ràng và văn bản gọn gàng, sạch sẽ", đồng thời tỷ lệ "ảo giác" (hallucination) - hiện tượng AI tạo ra thông tin không chính xác - là "cực kỳ thấp".
Sự kiện ra mắt diễn ra trong bối cảnh cạnh tranh gay gắt trên thị trường AI Trung Quốc, đặc biệt sau khi DeepSeek giới thiệu các mô hình có hiệu suất tương đương hoặc vượt trội so với các hệ thống phương Tây, với chi phí thấp hơn đáng kể.
Tencent trước đó đã phát hành phiên bản thử nghiệm của T1 thông qua các nền tảng, bao gồm ứng dụng trợ lý AI Yuanbao của hãng.
Phiên bản chính thức sẽ được cung cấp sức mạnh bởi mô hình ngôn ngữ nền tảng Turbo S của Tencent, được công bố vào cuối tháng trước. Công ty tuyên bố Turbo S xử lý các truy vấn nhanh hơn so với mô hình R1 của đối thủ DeepSeek.
Một biểu đồ được công bố trong bài đăng so sánh mô hình T1 với DeepSeek R1 cho thấy sản phẩm của Tencent vượt trội ở một số tiêu chuẩn về kiến thức và khả năng suy luận.
Tencent đã tăng cường đầu tư vào AI trong những tháng gần đây. Vào thứ năm, công ty thông báo kế hoạch tăng chi tiêu vốn vào năm 2025, sau khi đã chi mạnh tay cho AI suốt năm 2024.
T1 đã đạt thứ hạng cao trên một số chuẩn mực quan trọng về trí tuệ nhân tạo. Điều này đưa nó vào danh sách các mô hình hàng đầu trên toàn thế giới.
Các đánh giá gần đây chỉ ra rằng T1 đạt 87,2 điểm trên MMLU-Pro, một tập dữ liệu đánh giá khả năng lý luận cơ bản trong các mô hình ngôn ngữ lớn. Điểm số này chỉ đứng sau OpenAI o1.
Hơn nữa, T1 đã hoạt động tốt trên các chuẩn mực công khai như CEval, AIME và Zebra Logic. Các chuẩn mực này đo lường kiến thức chung và lý luận bằng cả tiếng Trung và tiếng Anh.
Nguồn: https://www.baogiaothong.vn/tencent-trinh-lang-mo-hinh-suy-luan-t1-vuot-troi-so-voi-deepseek-192250322131611869.htm
Bình luận (0)