Hari ini, kami memperkenalkan model Claude generasi berikutnya: Claude Opus 4 dan Claude Sonnet 4 , yang menetapkan standar baru untuk pengkodean, penalaran tingkat lanjut, dan agen AI.
Claude Opus 4 adalah model pengodean terbaik di dunia, dengan kinerja berkelanjutan pada tugas-tugas yang kompleks dan berjalan lama serta alur kerja agen. Claude Sonnet 4 merupakan peningkatan signifikan terhadap Claude Sonnet 3.7, yang memberikan pengodean dan penalaran yang unggul sekaligus merespons instruksi Anda dengan lebih tepat.
Bersamaan dengan model-model tersebut, kami juga mengumumkan:
- Berpikir luas dengan penggunaan alat (beta) : Kedua model dapat menggunakan alat—seperti pencarian web —selama berpikir luas, yang memungkinkan Claude untuk bergantian antara penalaran dan penggunaan alat untuk meningkatkan respons.
- Kemampuan model baru : Kedua model dapat menggunakan alat secara paralel, mengikuti instruksi dengan lebih tepat, dan—ketika diberi akses ke file lokal oleh pengembang—menunjukkan kemampuan memori yang ditingkatkan secara signifikan, mengekstraksi dan menyimpan fakta-fakta penting untuk menjaga kesinambungan dan membangun pengetahuan diam-diam dari waktu ke waktu.
- Claude Code kini tersedia secara umum : Setelah menerima banyak umpan balik positif selama pratinjau penelitian kami, kami memperluas cara pengembang dapat berkolaborasi dengan Claude. Claude Code kini mendukung tugas latar belakang melalui GitHub Actions dan integrasi asli dengan VS Code dan JetBrains, menampilkan suntingan langsung di berkas Anda untuk pemrograman berpasangan yang lancar.
- Kemampuan API baru: Kami merilis empat kemampuan baru pada API Anthropic yang memungkinkan pengembang membangun agen AI yang lebih canggih: alat eksekusi kode, konektor MCP, API File, dan kemampuan untuk menyimpan cache prompt hingga satu jam.
Claude Opus 4 dan Sonnet 4 adalah model hibrida yang menawarkan dua mode: respons hampir instan dan pemikiran yang diperluas untuk penalaran yang lebih mendalam. Paket Claude Pro, Max, Team, dan Enterprise mencakup kedua model dan pemikiran yang diperluas, dengan Sonnet 4 juga tersedia untuk pengguna gratis. Kedua model tersedia di Anthropic API, Amazon Bedrock, dan Vertex AI milik Google Cloud. Harga tetap konsisten dengan model Opus dan Sonnet sebelumnya: Opus 4 seharga $15/$75 per juta token (input/output) dan Sonnet 4 seharga $3/$15.
Claude 4
Claude Opus 4 adalah model terkuat kami sejauh ini dan model pengodean terbaik di dunia, yang memimpin di SWE-bench (72,5%) dan Terminal-bench (43,2%). Model ini memberikan kinerja berkelanjutan pada tugas-tugas yang berjalan lama yang memerlukan upaya terfokus dan ribuan langkah, dengan kemampuan untuk bekerja terus-menerus selama beberapa jam—secara drastis mengungguli semua model Sonnet dan secara signifikan memperluas apa yang dapat dicapai agen AI.
Claude Opus 4 unggul dalam pengkodean dan pemecahan masalah yang rumit, yang memberdayakan produk agen yang terdepan. Cursor menyebutnya sebagai teknologi terkini untuk pengkodean dan lompatan maju dalam pemahaman basis kode yang rumit. Replit melaporkan peningkatan presisi dan kemajuan dramatis untuk perubahan rumit di beberapa berkas. Block menyebutnya sebagai model pertama yang meningkatkan kualitas kode selama pengeditan dan debugging di agennya, dengan nama kode goose , sambil mempertahankan kinerja dan keandalan penuh. Rakuten memvalidasi kemampuannya dengan refaktor sumber terbuka yang menuntut yang berjalan secara independen selama 7 jam dengan kinerja yang berkelanjutan. Cognition mencatat Opus 4 unggul dalam memecahkan tantangan rumit yang tidak dapat dilakukan model lain, dengan sukses menangani tindakan kritis yang terlewatkan oleh model sebelumnya.
Claude Sonnet 4 secara signifikan meningkatkan kemampuan Sonnet 3.7 yang terdepan di industri, unggul dalam pengkodean dengan tingkat keberhasilan 72,7% pada SWE-bench. Model ini menyeimbangkan kinerja dan efisiensi untuk kasus penggunaan internal dan eksternal, dengan kemampuan kendali yang ditingkatkan untuk kontrol yang lebih besar atas implementasi. Meskipun tidak menyamai Opus 4 di sebagian besar domain, model ini memberikan perpaduan optimal antara kemampuan dan kepraktisan.
GitHub mengatakan Claude Sonnet 4 melesat dalam skenario agen dan akan memperkenalkannya sebagai model yang mendukung agen pengodean baru di GitHub Copilot. Manus menyoroti peningkatannya dalam mengikuti instruksi yang rumit, penalaran yang jelas, dan keluaran yang estetis. iGent melaporkan Sonnet 4 unggul dalam pengembangan aplikasi multi-fitur yang otonom, serta pemecahan masalah dan navigasi basis kode yang jauh lebih baik—mengurangi kesalahan navigasi dari 20% menjadi hampir nol. Sourcegraph mengatakan model tersebut menunjukkan janji sebagai lompatan substansial dalam pengembangan perangkat lunak—tetap pada jalur yang lebih lama, memahami masalah lebih dalam, dan memberikan kualitas kode yang lebih elegan. Augment Code melaporkan tingkat keberhasilan yang lebih tinggi, lebih banyak suntingan kode bedah, dan pekerjaan yang lebih cermat melalui tugas-tugas yang rumit, menjadikannya pilihan utama untuk model utama mereka.
Model-model ini memajukan strategi AI pelanggan kami secara menyeluruh: Opus 4 mendorong batasan dalam pengkodean, penelitian, penulisan, dan penemuan ilmiah, sementara Sonnet 4 menghadirkan kinerja tingkat tinggi pada kasus penggunaan sehari-hari sebagai peningkatan instan dari Sonnet 3.7.