logo

FX.co ★ Apple Merilis LLM Sumber Terbuka Untuk Dijalankan di Perangkat

Apple Merilis LLM Sumber Terbuka Untuk Dijalankan di Perangkat

Apple telah memperkenalkan beberapa model bahasa besar open-source, bernama OpenELM atau Open-source Efficient Language Models, untuk mendorong dan meningkatkan komunitas penelitian terbuka dan berkontribusi pada upaya penelitian di masa depan.

Model-model OpenELM, yang diluncurkan pada platform komunitas berbagi kode AI, Hugging Face Hub, memiliki fitur unik untuk berjalan di perangkat dan bukan di server cloud. Menurut Bloomberg, Apple telah menargetkan sistem operasi yang sepenuhnya berjalan di perangkat, dengan teknologi model bahasa besar yang ditenagai oleh prosesor internal iPhone, bukan teknologi cloud.

Apple telah menyebutkan adanya empat model OpenELM yang berbeda - empat model yang sudah dilatih sebelumnya dan empat model yang disesuaikan dengan instruksi. Model-model tersebut memiliki ukuran yang berbeda-beda, dengan model terbesar berisi 3 miliar parameter dan model lainnya memiliki parameter mulai dari 270 juta hingga 1,1 miliar. Raksasa teknologi ini menyoroti bahwa semua model menggunakan strategi penskalaan berdasarkan lapisan untuk alokasi parameter yang efisien dalam setiap lapisan model transformator, yang mengarah pada peningkatan efisiensi dan akurasi.

Berbeda dengan praktik sebelumnya, rilis Apple tidak hanya menyertakan bobot model dan kode inferensi, tetapi juga menyediakan kerangka kerja lengkap untuk melatih dan mengevaluasi model bahasa pada set data yang tersedia untuk umum. Kerangka kerja ini juga terdiri dari log pelatihan, beberapa pos pemeriksaan, dan konfigurasi pra-pelatihan.

Selain itu, Apple dijadwalkan untuk meluncurkan iOS 18, yang dilengkapi dengan kemampuan AI, pada Konferensi Pengembang Seluruh Dunia yang sangat dinanti-nantikan.

*Analisis pasar yang diposting disini bertujuan untuk meningkatkan kesadaran anda, namun tidak untuk memberikan instruksi untuk melakukan trading
Buka daftar artikel Buka akun trading