Speed of Sound è un progetto open souce che ci consente di portare la dettatura vocale su Linux in modo semplice e concreto, sfruttando un modello leggero di Whisper per trasformare la voce in testo direttamente sul sistema. L’idea è immediata: parlare invece di digitare, con un livello di precisione finalmente utilizzabile anche fuori da contesti sperimentali.

Negli ultimi anni il riconoscimento vocale ha fatto passi avanti enormi, ma su desktop Linux è sempre rimasto in secondo piano. Questa applicazione cambia approccio: non tenta di sostituire completamente la tastiera, ma offre uno strumento rapido per scrivere appunti, email o bozze senza interrompere il flusso di pensiero.
Come funziona la dettatura vocale su Linux
Una volta installato, Speed of Sound si integra con il sistema attraverso i portali desktop, consentendo di “scrivere” in qualsiasi campo di testo attivo. Basta premere un pulsante o usare una scorciatoia da tastiera (come Super + Z), iniziare a parlare e interrompere quando si è finito.
Il processo è semplice:
- attivazione della registrazione
- dettatura del testo
- conversione audio → testo
- inserimento automatico nel campo attivo
Uno degli aspetti più interessanti è l’elaborazione completamente locale. Questo significa che l’audio non viene inviato a server esterni, migliorando privacy e tempi di risposta. Inoltre, il supporto multilingua permette di configurare una lingua principale e una secondaria, utile per chi lavora in ambienti misti.
Non si tratta però di trascrizione in tempo reale continua: è necessario avviare e fermare manualmente ogni sessione di registrazione. Questo richiede un minimo di adattamento, soprattutto per chi è abituato a sistemi sempre in ascolto.
Personalizzazione, limiti e casi d’uso reali
Per ottenere risultati migliori, è possibile personalizzare il comportamento dell’app inserendo vocabolari specifici, acronimi o preferenze stilistiche. Questo aiuta il modello a riconoscere termini tecnici o nomi poco comuni, cosa particolarmente utile in ambito informatico.
L’accuratezza è buona, ma non perfetta. Errori di trascrizione possono capitare, soprattutto con frasi complesse o ambienti rumorosi. Per questo motivo resta fondamentale una revisione manuale, soprattutto per contenuti formali o pubblicazioni.
I casi d’uso più efficaci includono:
- presa di appunti veloce
- scrittura di bozze o idee
- dettatura di email informali
- supporto in situazioni hands-free
Meno adatto invece per editing preciso o navigazione del sistema, dove la tastiera resta insostituibile.

Speed of Sound dimostra che la dettatura vocale su Linux non è più una curiosità, ma uno strumento pratico. Non elimina la tastiera, ma la affianca in modo intelligente, soprattutto quando scrivere diventa un ostacolo più che un vantaggio.
Installare Speed of Sound
Speed of Sound è disponibile per qualsiasi distribuzione Linux (oltre alla compilazione tramite codice sorgente) attraverso Flatpak.
Abbiamo testato Speed of Sound su Arch Linux con ambiente desktop GNOME 50.1 (immagini articolo).
Fonte: OmgUbuntu