Mô hình AI Claude 3.5 Sonnet nâng cấp của Anthropic (Nguồn ảnh: Anthropic)
Những điều bạn cần biết
- Anthropic gần đây đã phát hành phiên bản nâng cấp của Claude 3.5 Sonnet cùng với một mô hình mới có tên là Claude 3.5 Haiku, với khả năng lập trình được cải tiến và nhiều hơn nữa.
- Công ty AI này cũng tiết lộ tính năng “Sử dụng máy tính”, một khả năng mới cho phép người dùng yêu cầu Claude sử dụng máy tính như con người.
- Công ty thừa nhận việc phát hành khả năng này cho công chúng tiềm ẩn nhiều rủi ro, nhưng họ có kế hoạch sử dụng phương pháp này để quan sát cách mọi người tận dụng công cụ. Họ đã áp dụng các biện pháp phức tạp để ngăn chặn việc sử dụng sai mục đích, chẳng hạn như hạn chế quyền truy cập web trong quá trình đào tạo.
Có vẻ như bối cảnh đang chuyển sang giai đoạn tiếp theo, vượt ra ngoài hình ảnh và văn bản do AI tạo ra. Anthropic gần đây đã tiết lộ phiên bản nâng cấp của Claude 3.5 Sonnet và một mô hình mới có tên là Claude 3.5 Haiku. Theo công ty, phiên bản nâng cấp này được trang bị khả năng lập trình được cải tiến và có cùng thông số kỹ thuật hiệu suất như Claude 3 Opus LLM của Anthropic.
Điều thú vị hơn là khả năng mới được gọi là “Sử dụng máy tính”, hiện đang có sẵn trong bản beta mở. Thông qua API, các nhà phát triển có thể “hướng dẫn Claude sử dụng máy tính giống như cách con người làm – bằng cách nhìn vào màn hình, di chuyển con trỏ, nhấp vào các nút và nhập văn bản.” Điều này khiến Claude 3.5 Sonnet trở thành mô hình AI đầu tiên cung cấp tính năng sử dụng máy tính trong bản beta mở.
Anthropic thừa nhận rằng người dùng có thể gặp phải một số trở ngại khi tương tác với mô hình, bao gồm lỗi và trải nghiệm người dùng không liền mạch. Công ty hy vọng sẽ sử dụng phản hồi để nâng cao và cải thiện hiệu suất và hiệu quả của mô hình.
Các công ty như Asana, Canva, Cognition, DoorDash, Replit và The Browser Company đã tham gia để đơn giản hóa các quy trình thường yêu cầu hàng tá bước. Ví dụ: “Replit đang sử dụng khả năng của Claude 3.5 Sonnet với tính năng sử dụng máy tính và điều hướng giao diện người dùng để phát triển một tính năng chính đánh giá các ứng dụng khi chúng được xây dựng cho sản phẩm Replit Agent của họ.”
Phiên bản nâng cấp của Claude 3.5 Sonnet có sẵn trên Anthropic API, Amazon Bedrock và Vertex AI của Google Cloud. Anthropic dự kiến sẽ phát hành Claude 3.5 Haiku vào cuối tháng này.
Theo các điểm chuẩn được chia sẻ, Claude 3.5 Sonnet cập nhật của Anthropic cho thấy hiệu suất được cải thiện đáng kể, đặc biệt là trong lập trình. Ví dụ: hiệu suất của công cụ trên SWE-bench Verified đã được cải thiện từ 33,4% lên 49,0%, điều này cho thấy nó hoạt động tốt hơn đáng kể so với các mô hình có sẵn công khai, bao gồm các mô hình AI lập luận Strawberry của OpenAI, đồng thời vẫn giữ nguyên mức giá và tốc độ như phiên bản tiền nhiệm.
Liên quan:Giám đốc điều hành NVIDIA tuyên bố lập trình có thể đã chết với sự phổ biến của AI
Mô hình tự sửa lỗi bằng cách thử lại một tác vụ khi nó “nhận ra” rằng nó đã gặp sự cố, khiến nó đi chệch hướng khỏi kết quả mong muốn. Như bạn có thể biết, OpenAI o1 và o1-mini cực kỳ giỏi lập trình và đã vượt qua bài phỏng vấn tuyển dụng kỹ sư nghiên cứu của OpenAI về lập trình với tỷ lệ 90-100%.
Các tác nhân AI đã xuất hiện nhưng hãy tiến hành thận trọng
Claude | Sử dụng máy tính để tự động hóa các hoạt động – YouTube
Mặc dù những cải tiến được nêu nổi bật rất ấn tượng, nhưng mô hình AI Claude 3.5 Sonnet cập nhật đã hoàn thành chưa đến một nửa số tác vụ được giao trong một bài đánh giá được thiết kế để thiết lập khả năng năng sửa đổi đặt chỗ chuyến bay. Mô hình đã thất bại khoảng một phần ba số lần khi cố gắng bắt đầu quay lại.
Đọc Thêm:Salesforce cho biết họ có thể đánh bại Microsoft trong lĩnh vực AI
Anthropic nhấn mạnh rằng mô hình gặp khó khăn với việc phóng to và cuộn, khiến việc bỏ lỡ các thông báo bật lên trở nên dễ dàng do cách nó xử lý ảnh chụp màn hình. “Tính năng Sử dụng máy tính của Claude vẫn còn chậm và thường xuyên xảy ra lỗi,” công ty cho biết thêm.
Công ty thừa nhận rằng việc phát hành mô hình cho công chúng tiềm ẩn những rủi ro đáng kể, nhưng cũng nêu rõ rằng lợi ích của việc quan sát cách mô hình được sử dụng vượt trội hơn so với những nguy hiểm.
Theo Anthropic:
“Chúng tôi nghĩ rằng tốt hơn nhiều là nên cấp quyền truy cập vào máy tính cho các mô hình hạn chế hơn, tương đối an toàn hơn hiện nay. Điều này có nghĩa là chúng tôi có thể bắt đầu quan sát và học hỏi từ bất kỳ vấn đề tiềm ẩn nào phát sinh ở cấp độ thấp hơn này, xây dựng dần dần tính năng sử dụng máy tính và các biện pháp giảm thiểu an toàn cùng một lúc.”
Trong nỗ lực ngăn chặn việc sử dụng sai mục đích và những kẻ xấu lợi dụng các khả năng tinh vi của công cụ để gây hại, Claude 3.5 Sonnet mới không được đào tạo trên ảnh chụp màn hình và lời nhắc của người dùng. Nó cũng bị hạn chế truy cập web trong quá trình đào tạo. Anthropic đã phát triển mô hình với các bộ phân loại, khiến nó tránh xa các hành động có rủi ro cao như tạo tài khoản và đăng bài trên mạng xã hội.
Ưu đãi Black Friday sớm tốt nhất
- Màn hình OLED cong LG (32 inch) | $839.99 tại Amazon (Tiết kiệm $660!)
- Gói Amazon Fire TV Xbox Game Pass | $74.99 tại Amazon (Tiết kiệm $62!)
- Alienware m16 R2 (RTX 4060) | $1,399.99 tại Dell (Tiết kiệm $300!)
- Loa Soundbar 2.1 kênh cho TV & Màn hình | $44.99 tại Walmart (Tiết kiệm $55!)
- HP OMEN Transcend 14 (RTX 4050) | $1,099.99 tại HP (Tiết kiệm $500!)
- Sennheiser Momentum 4 ANC | $274.95 tại Amazon (Tiết kiệm $125!)
- LG C4 OLED 4K TV (42 inch) | $999.99 tại Best Buy (Tiết kiệm $400!)