Anthropic chia sẻ bản demo vui nhộn về Claude AI bỏ qua lời nhắc mã hóa để xem những bức ảnh tuyệt đẹp về công viên quốc gia trên Google: “Claude bị ADHD, điều này rất dễ hiểu”

Anthropic Claude

Anthropic Claude (Nguồn ảnh: Anthropic)

Những điều bạn cần biết

  • Anthropic gần đây đã phát hành phiên bản nâng cấp Claude 3.5 Sonnet cùng với API Sử dụng Máy tính mới.
  • Công ty AI này đã ghi lại những tiến bộ của mô hình, bao gồm cả trường hợp nó tạm dừng việc lập trình để xem hình ảnh của Công viên Quốc gia Yellowstone.
  • Nhiều báo cáo cho rằng lập trình có thể sẽ là một nghề nghiệp không còn triển vọng cho thế hệ tiếp theo với sự phổ biến nhanh chóng của AI, nhưng tiết lộ này cho thấy điều ngược lại.

Với sự xuất hiện của , có rất nhiều suy đoán và dự đoán về việc tăng cường một số ngành nghề bằng cách sử dụng công nghệ này. Theo đó, ngành ngân hàng, công việc thiết kế và phát triển phần mềm dường như là những ngành nghề đầu tiên bị AI thay thế.

Giám đốc điều hành NVIDIA, Jensen Huang, đã chỉ ra rằng lập trình có thể sẽ không còn triển vọng với sự áp dụng nhanh chóng của AI trong các công ty phát triển phần mềm. Ông không khuyến khích thế hệ tiếp theo theo đuổi nghề phát triển phần mềm. Thay vào đó, ông khuyến nghị tìm kiếm các con đường sự nghiệp khác trong lĩnh vực sinh học, giáo dục, sản xuất hoặc nông nghiệp.

Giám đốc điều hành Amazon Web Services, Matt Garman, dường như cũng có cùng quan điểm, dự đoán một sự thay đổi mạnh mẽ trong lĩnh vực phát triển phần mềm. “Nếu bạn nhìn về phía trước 24 tháng tới, hoặc một khoảng thời gian nào đó – tôi không thể dự đoán chính xác – có thể hầu hết các nhà phát triển sẽ không còn lập trình”, Garman nói thêm.

Như bạn có thể đã biết, AI đã vượt xa giai đoạn tạo hình ảnh và văn bản và đang hướng tới các nhiệm vụ phức tạp và nâng cao như lập trình. Ví dụ, GPT-4omô hình OpenAI-o1 của OpenAI đã được ca ngợi vì khả năng nâng cao trong việc viết và phát hiện lỗi trong mã.

Tuy nhiên, các bản demo lập trình gần đây có mô hình AI Claude của Anthropic cho thấy rằng chúng ta có thể đã hơi vội vàng khi nói về việc AI sẽ thay thế con người trong ngành nghề này.

Chúng ta đã sẵn sàng cho một thế giới chủ yếu được điều hành bởi các tác nhân AI chưa? Vẫn còn quá sớm để nói

Anthropic Claude 3.5 Sonnet

Anthropic Claude 3.5 Sonnet (Nguồn ảnh: Anthropic)

Anthropic dường như đã ghi lại những tiến bộ của Claude 3.5 Sonnet nâng cấp khi nó tình cờ gặp một số khám phá thú vị.

Trong một trong những bản demo của công ty, AI Claude có thể được nhìn thấy đang viết mã, nhưng trong một trường hợp khác, nó dường như thay đổi dòng suy nghĩ và nhanh chóng chuyển sang Google và xem qua một thư viện hình ảnh của Công viên Quốc gia Yellowstone. Một người dùng đã nói đùa:

“Claude ngây thơ đang xem xét siêu núi lửa không hoạt động có thể đưa chúng ta trở lại Kỷ Băng hà.”

Xem thêm

Một sự cố nổi bật khác cho thấy AI Claude vô tình làm gián đoạn quá trình ghi màn hình của một đoạn clip dài. Trong quá trình này, đoạn phim đã ghi bị mất, buộc phải thực hiện lại nhiệm vụ khó khăn và tẻ nhạt từ đầu.

Xem thêm

Tin tức này xuất hiện vào thời điểm các tập đoàn công nghệ lớn trong lĩnh vực AI đang tập trung vào việc tự động hóa các nhiệm vụ bằng cách sử dụng các chiến dịch tác nhân AI. Gần đây, có thông báo rằng Copilot Studio sẽ sớm hỗ trợ việc tạo ra các tác nhân tự động. Giống như dịch vụ Agentforce của Salesforce, các tác nhân Copilot của Microsoft sẽ giúp tự động hóa các nhiệm vụ trong CNTT, tiếp thị, bán hàng, dịch vụ khách hàng và tài chính. Marc Benioff của Salesforce cho rằng việc ra mắt này là “chế độ hoảng loạn”.

Vị CEO đã nhân cơ hội này để chỉ trích Microsoft đồng thời quảng cáo Agentforce là giải pháp thay thế ưu việt và đáng tin cậy hơn:

“Copilot là một thất bại vì Microsoft thiếu dữ liệu, siêu dữ liệu và mô hình bảo mật doanh nghiệp để tạo ra trí tuệ doanh nghiệp thực sự. Đó là lý do tại sao Copilot không chính xác, làm lộ dữ liệu doanh nghiệp và buộc khách hàng phải tự xây dựng LLM của riêng họ. Ai muốn Clippy 2.0 nào? Trong khi đó, Agentforce đang chuyển đổi doanh nghiệp ngay bây giờ. Agentforce không chỉ xử lý các nhiệm vụ – nó tự động thúc đẩy doanh số, dịch vụ, tiếp thị, phân tích và thương mại. Với dữ liệu, LLM, quy trình làm việc và bảo mật được tích hợp vào một nền tảng Customer 360 duy nhất: Đây mới là mục đích của AI.”

Điều thú vị là Microsoft đã tiết lộ một điểm chuẩn mới có tên là Windows Agent Arena. Nó cung cấp một nền tảng để thử nghiệm các tác nhân AI trong môi trường hệ điều hành Windows thực tế. Nền tảng này là một cơ hội để nghiên cứu sâu, có thể cải thiện đáng kể sự phát triển của các tác nhân AI.

Các điểm chuẩn được chia sẻ cho thấy các tác nhân AI đa phương thức có tỷ lệ thành công hiệu suất trung bình là 19,5% so với mức hiệu suất trung bình đáng mơ ước của con người là 74,5%, làm dấy lên lo ngại về hiệu suất bên cạnh các vấn đề bảo mật hiện có.

Leave a Reply

Your email address will not be published. Required fields are marked *