Le nuove API di trascrizione di Apple superano Whisper nei test di velocità
Le nuove API di Apple per la trascrizione da voce a testo in iOS 26 e macOS Tahoe offrono velocità significativamente superiori rispetto agli strumenti concorrenti, incluso Whisper di OpenAI, secondo i test beta condotti da John Voorhees di MacStories.
Apple utilizza i propri framework nativi per la trascrizione in tempo reale in app come Note e Memo Vocali, oltre alla trascrizione delle chiamate telefoniche in iOS 18.1. Per migliorare l’efficienza in iOS 26 e macOS Tahoe, Apple ha introdotto una nuova classe SpeechAnalyzer e un modulo SpeechTranscriber per gestire richieste simili.
Secondo Voorhees, i nuovi modelli hanno elaborato un video di 34 minuti e 7 GB in soli 45 secondi usando un tool da riga di comando chiamato Yap (sviluppato dal figlio di Voorhees, Finn). Questo è il 55% più rapido rispetto al modello Large V3 Turbo di MacWhisper, che ha impiegato 1 minuto e 41 secondi per lo stesso file.
Altri strumenti basati su Whisper sono risultati ancora più lenti: VidCap ha impiegato 1 minuto e 55 secondi, mentre il modello Large V2 di MacWhisper ha richiesto 3 minuti e 55 secondi per completare la stessa trascrizione. Voorhees ha inoltre evidenziato che la qualità della trascrizione è risultata simile tra i diversi modelli.
Il vantaggio in termini di velocità deriva dall’approccio di Apple, che esegue l’elaborazione direttamente sul dispositivo, evitando i ritardi dovuti al trasferimento dati verso il cloud tipici dei servizi di trascrizione cloud-based.
Sebbene la differenza di tempo possa sembrare modesta per file singoli, Voorhees sottolinea che il miglioramento di prestazioni cresce in modo esponenziale quando si processano video multipli o contenuti più lunghi. Per chi genera regolarmente sottotitoli o trascrive lezioni, questo aumento di efficienza può tradursi in ore di risparmio.
I componenti del framework Speech sono disponibili su iPhone, iPad, Mac e Vision Pro nelle attuali versioni beta. Voorhees prevede che la tecnologia di trascrizione di Apple sostituirà in futuro Whisper come soluzione principale per le app di trascrizione su Mac.
