Whisper Memos
Whisper Memos

Ricordo ancora i tempi dell’università quando si lasciavano i registratori sul banco del professore per registrare le lezioni. Poi si tornava a casa e si trascrivevano i testi. I più intraprendenti li vendevano al centro fotocopie.

Il problema è che trascrivere tutto ciò che una persona dice richiede molto tempo ed è un lavoro noioso. Fortunatamente ci sono tecnologie di intelligenza artificiale che lo fanno per noi. Come trascrivere un testo vocale?

Esistono varie soluzioni. Ve ne dico un paio: una a pagamento ma più semplice, l’altra gratuita ma più complicata. Entrambe usano Whisper: la tecnologia di text-to-speech e speech-to-text di OpenAI. Tecnologie che a mio avviso funzionano meglio di Siri. Tanto per fare un esempio, la punteggiatura automatica in Whisper funziona anche in italiano. In Siri no.

Whisper Memos

L’app Whisper Memos prende proprio le API di OpenAI di Whisper per trasformare una registrazione vocale in testo. L’app consente di indicare la propria email. Dopodiché basta registrare un audio dettandolo a voce.

L’audio viene elaborato e dopo pochi secondi lo si riceve via email già trascritto. La qualità di Whisper è molto elevata. A differenza della dettatura di Siri, che trovo tutt’ora di basso livello nonostante i paventati miglioramenti di Apple, in Whisper la trascrizione è molto fedele al dettato.

L’app crea anche paragrafi automaticamente per aumentare la leggibilità del testo e presenta un widget per richiamarlo velocemente.

Le note sono registrate in locale ed elaborate direttamente da Whisper. Lo sviluppatore non ne ha accesso e non vanno su server privati.

L’app, che funziona anche su Apple Watch, pesa 14,5 MB. Le prime 10 elaborazioni sono gratis, poi bisognerà pagare un abbonamento di 5,99 € al mese o 36,99 € l’anno.

Lo shortcut Voxy Voice

Se Whisper Memos è un’app già configurata e pronta all’uso, Voxy Voice è uno shortcut che fa la stessa cosa ma va configurato. In pratica dovrete recuperare le API di Whisper su OpenAI.

Una volta procurate le API dovrete inserirle nel campo testo preposto in questo shortcut dell’app Comandi. Dopodiché, dopo averlo lanciato la prima volta e dati tutti i permessi richiesti, basta indicare una email in entrata e una in uscita.

Quella in uscita deve essere di iCloud, perché lo shortcut si appoggia a iCloud Drive del vostro account per elaborare la nota audio in locale. Una soluzione che preserva la vostra privacy.

Lanciando lo shortcut, da qualsiasi dispositivo supporti l’app Comandi (quindi Apple Watch, iPhone, iPad e Mac) basta dettare il testo. Terminato basta premere su stop.

L’audio viene mandato all’elaborazione. In base alla sua lunghezza passeranno da pochi secondi a qualche minuto. Si riceverà via email il testo dell’audio trascritto e anche il file audio registrato in allegato.

Basandosi sulla stessa tecnologia Whisper, anche in questo caso lo shortcut funziona molto bene, con tanto di punteggiatura automatica.

Scaricare lo shortcut qui: Voxy Voice.

Come ottenere le API di Whisper da OpenAI

Passo 1: Accedete al Pannello di Controllo OpenAI

Il primo passo è accedere al pannello di controllo di OpenAI. Assicuratevi di essere loggati nel vostro account. Se non ne avete uno, è il momento perfetto per crearlo.

Passo 2: Navigate verso Whisper

Una volta nel pannello di controllo, cercate l’opzione “Whisper” tra i prodotti OpenAI. Fate clic su di essa per iniziare il processo di richiesta di accesso.

Passo 3: Richiedete l’Accesso

Qui entra in gioco l’aspetto più interessante. Dovrete presentare la vostra richiesta per ottenere l’accesso a Whisper. Prendetevi un momento per spiegare il motivo per cui desiderate utilizzare questa potente tecnologia di generazione di testo. Che si tratti di creare contenuti per il vostro blog tech, migliorare il vostro sito web o sviluppare nuove applicazioni, condividete la vostra visione con passione.

Passo 4: Aspetta l’Approvazione

Dopo aver inviato la vostra richiesta, dovrete pazientare un po’. OpenAI valuta attentamente le richieste per garantire un utilizzo etico e responsabile della tecnologia. Mentre aspettate, potete riflettere su come Whisper potrebbe rivoluzionare il vostro lavoro.

Passo 5: Ottieni la Chiave API

Una volta approvati, riceverete la vostra chiave API. Questa chiave è il vostro passaporto per accedere a Whisper e iniziare a generare testi.

Passo 6: Iniziate a Creare con Whisper

Ora che avete la vostra chiave API, potete iniziare a sfruttare il potenziale creativo di Whisper. Integrate la chiave API nello shortcut.

In conclusione

  • Le tecnologie di intelligenza artificiale semplificano il lavoro di trascrizione dei testi.
  • Whisper Memos: app pronta all’uso, trascrizioni di alta qualità.
  • Voxy Voice: shortcut configurabile con Whisper API.
  • Protezione della privacy con iCloud Drive.
  • Come ottenere le API di Whisper da OpenAI.

Lascia un commento

Cosa ne pensi?