logo

FX.co ★ Apple Mengeluarkan LLMs Sumber Terbuka Untuk Dijalankan Pada Peranti

Apple Mengeluarkan LLMs Sumber Terbuka Untuk Dijalankan Pada Peranti

Apple telah memperkenalkan beberapa model bahasa sumber terbuka berskala besar, dinamakan OpenELM atau Open-source Efficient Language Models, untuk memajukan dan meningkatkan komuniti penyelidikan terbuka serta menyumbang kepada usaha penyelidikan pada masa depan.

Model OpenELM, yang dilancarkan pada platform komuniti berkongsi kod AI, Hugging Face Hub, mempunyai ciri unik yang berjalan pada peranti berbanding pada pelayan awan. Mengikut laporan Bloomberg, Apple telah bertujuan untuk sistem operasi yang sepenuhnya berpaksi pada peranti, dengan teknologi model bahasa besar ditenagakan oleh pemproses dalaman iPhone daripada teknologi awan.

Apple telah menyebut tentang kehadiran empat model OpenELM yang berbeza - empat yang telah dilatih terlebih dahulu dan empat lagi yang disetemkan arahannya. Ini berbeza dalam saiz, dengan model terbesar mengandungi 3 bilion parameter dan yang lain memegang parameter di antara 270 juta hingga 1.1 bilion. Raksasa teknologi ini menekankan bahawa semua model menggunakan strategi penskalaan mengikut lapisan untuk pengagihan parameter yang cekap dalam setiap lapisan model transformer, membawa kepada peningkatan kecekapan dan kejituan.

Berbeza daripada amalan sebelum ini, bukan sahaja pelepasan Apple merangkumi berat model dan kod inferens, tetapi juga menyediakan rangka kerja lengkap untuk latihan dan penilaian model bahasa pada set data yang boleh didapati secara awam. Ini juga termasuk log latihan, banyak titik semak, dan konfigurasi pra-latihan.

Selain itu, Apple dijadualkan untuk mengumumkan iOS 18, dilengkapi dengan keupayaan AI, di Konferens Pemaju Seluruh Dunia yang dinantikan dengan penuh jayanya.

*Analisis pasaran yang dipaparkan di sini hanya bertujuan untuk meningkatkan kesedaran anda, tetapi bukan sebagai petunjuk untuk anda melakukan perdagangan
Pergi ke senarai artikel Buka akaun dagangan