Společnost Apple představila několik otevřených velkých jazykových modelů s názvem OpenELM neboli Open-source Efficient Language Models, které mají podpořit a posílit otevřenou výzkumnou komunitu a přispět k budoucím výzkumným snahám.
Modely OpenELM, spuštěné na komunitní platformě pro sdílení kódu umělé inteligence Hugging Face Hub, mají jedinečnou vlastnost, že běží v zařízení, nikoli na cloudových serverech. Podle agentury Bloomberg se společnost Apple zaměřila na systém provozu zcela v zařízení, přičemž technologie velkých jazykových modelů je poháněna interním procesorem iPhonu namísto cloudových technologií.
Společnost Apple se zmínila o přítomnosti čtyř různých modelů OpenELM - čtyř předtrénovaných a čtyř instrukčně vyladěných. Ty jsou různě velké, přičemž největší model obsahuje 3 miliardy parametrů a ostatní mají parametry v rozmezí od 270 milionů do 1,1 miliardy. Technologický gigant zdůrazňuje, že všechny modely využívají strategii škálování po vrstvách pro efektivní přidělování parametrů v rámci každé vrstvy modelu transformátoru, což vede ke zvýšení efektivity a přesnosti.
Odchylně od předchozích postupů obsahuje vydání společnosti Apple nejen váhy modelu a inferenční kód, ale také kompletní rámec pro trénování a vyhodnocování jazykového modelu na veřejně dostupných souborech dat. Ten zahrnuje také tréninkové protokoly, několik kontrolních bodů a předtréninkové konfigurace.
Kromě toho má společnost Apple na očekávané konferenci Worldwide Developers Conference představit systém iOS 18 vybavený funkcemi umělé inteligence.