Anthropic 最近推出了一項創新功能,稱為電腦使用,整合到其 Claude 3.5 Sonnet 模型中。這種功能允許人工智慧以類似於人類用戶的方式與電腦交互,使其能夠執行諸如行動遊標、打開瀏覽器和執行程式碼等任務。這一發展標誌著人工智慧功能的重大飛躍,特別是對於開發人員和程式設計師而言。

了解計算機的使用

它是如何運作的

電腦使用功能透過專用 API 運行,開發人員可以利用該 API 使 Claude 能夠在電腦上執行各種任務。以下是其運作方式的詳細說明:

  1. 使用者提示:開發人員透過提示為 Claude 提供特定任務,例如「將貓的圖片儲存到我的桌面」。
  2. 工具啟用:Claude 評估是否可以使用預先定義工具協助滿足請求。
  3. 執行:一旦辨識出必要的操作,Claude 就會建置一個在受控環境(如虛擬機器)中執行的工具使用請求。
  4. 任務完成狀況:Claude 繼續與電腦交互,直到任務完成,並將結果傳回給使用者。

主要特點

  • 協調支持:突出的功能之一是它能夠理解和操作螢幕座標。這使得克勞德能夠為遊標移動提供精確的指令,這以前是人工智慧模型的限制。
  • 一般電腦技能:與之前僅限於特定任務的型號不同,Claude 旨在處理廣泛的軟體應用程序,使其能夠滿足各種自動化需求。

應用和優點

開發人員自動化

此功能的主要受眾是開發人員,他們可以利用它來:

  • 自動化重複性任務:需要多個步驟的任務可以自動化,從而顯著減少時間和精力。
  • 建置和測試軟體:開發人員可以指示 Claude 瀏覽軟體介面、執行測試,甚至調試程式碼。
  • 進行研究:人工智慧可以透過瀏覽網頁並根據使用者資料填寫表格來協助收集資訊。

現實世界的用例

幾家公司已經在探索這種功能:

  • 雷普利特正在將 Claude 的電腦使用功能整合到其平台中,以增強應用程式評估流程。
  • Canva 和 DoorDash 等其他組織正在嘗試自動化涉及眾多步驟的複雜工作流程。

安全考慮

雖然這項技術潛力巨大,但 Anthropic 也承認相關風險。該公司強調針對潛在濫用的安全措施,例如惡意命令可能覆蓋用戶指令的即時注入攻擊。當技術成熟時,鼓勵開發人員從低風險任務開始。

Anthropic 的電腦使用功能代表了人工智慧功能的突破性進步,允許與電腦進行更像人類的互動。隨著這項技術的發展,它不僅有望提高開發人員的生產力,而且還將改變我們在各個行業中實現自動化的方式。根據早期採用者的持續回饋,我們可以期待其功能和安全措施的快速改進。