Nell’ultimo anno circa, Google ha presentato in anteprima una serie di funzionalità AI a marchio Gemini nelle sue app rivolte ai consumatori. Ecco tutto ciò che è stato annunciato e quando potrebbe essere disponibile.

pixel

Alla fine del 2023 è stato annunciato Zoom Enhance, che “riempie in modo intelligente gli spazi tra i pixel e prevede i dettagli più fini” per Pixel 8 Pro. Sfruttando un “modello di immagine AI generativo personalizzato” sul dispositivo, Google ha descritto la funzionalità come utile quando si dimentica di eseguire lo zoom.

È una straordinaria applicazione di intelligenza artificiale generativa, che apre una serie di possibilità per l’inquadratura e la modifica delle foto. Quindi il tipo di zoom che sei abituato a vedere nella fantascienza è proprio nel telefono che hai tra le mani.

Nel mese di ottobre, Google ha detto che questo sarebbe “arrivato più tardi”. Dopo tre cali di funzionalità Pixel, non sono ancora arrivati. Non è chiaro se il modello a cui fa riferimento Google sia il Gemini Nano con Multimodalità. A questo punto, potrebbe debuttare con Pixel 9 Pro come funzionalità fotografica principale del telefono.

Casa Google

Nell’app Google Home, l’intelligenza artificiale generativa verrà utilizzata per riassumere gli eventi in una “visione semplificata di ciò che è accaduto di recente”. Questo “riepilogo semplice e veloce” sfrutterà i punti elenco, mentre sarai anche in grado di “Chiedi informazioni sulla tua casa” in modo conversazionale per trovare clip di cronologia video e ottenere automazioni. Le “funzionalità beta” saranno disponibili per gli abbonati Nest Aware nel 2024.











Fitbit

Fitbit Labs consentirà agli utenti Fitbit Premium di testare e fornire feedback sulle funzionalità AI sperimentali.

Una di queste funzionalità è un chatbot che ti consente di porre domande sui tuoi dati Fitbit in modo naturale e conversazionale. Questo “coaching personalizzato” con in mente obiettivi di fitness mira a creare “messaggi e indicazioni fruibili”, con risposte che possono includere grafici personalizzati.

“Ad esempio, puoi approfondire il numero di minuti in zona attiva (AZM) che ottieni e come si collegano al modo in cui ti riprendi dal sonno.”

“…Questo modello potrebbe essere in grado di analizzare le differenze nei ritmi del sonno e nella qualità del sonno, e quindi suggerire consigli su come modificare l’intensità dell’esercizio in base a tali informazioni.”







Dietro le quinte, questo è supportato da un nuovo LLM in Personal Health di Fitbit e Google Research basato su Gemini. A partire da marzo, arriverà “entro la fine dell’anno” per “un numero limitato di utenti Android iscritti al programma Fitbit Labs nell’app mobile Fitbit”.











Google Immagini

La funzione Chiedi foto ti consente di porre domande su foto e video nella tua libreria. A differenza della ricerca di immagini, può estrarre informazioni e fornirti una risposta testuale. Le domande basate sui Gemelli includono “Mostrami la foto migliore di ogni parco nazionale in cui sei stato” e “Quali temi abbiamo trattato alle feste di compleanno di Lena?” Possono essere utilizzati per “suggerire le foto migliori” e creare didascalie per loro. Ask Photos è una “funzionalità beta” che verrà lanciata presto, con Google che già suggerisce ulteriori funzionalità in futuro.







Gmail + Google Workspace

In Gmail per Android e iOS troverai un pulsante Gemini nell’angolo in alto a destra che ti consente di visualizzare l’equivalente mobile del pannello laterale per inserire istruzioni complete. Gmail riceve anche risposte intelligenti contestuali che offrono suggerimenti più personalizzati, dettagliati e accurati. Verrà rilasciato in Workspace Labs a luglio.

Al Cloud Next 2024 di aprile, Google ha anche presentato in anteprima una funzionalità di comando vocale per aiutarmi a digitare in Gmail per dispositivi mobili. Nel frattempo, la funzione Instant Polish “trasforma appunti approssimativi in ​​un’e-mail completa con un clic”.

Sul Web desktop, il pannello laterale è disponibile in Gmail, Google Drive e Documenti/Fogli/Diapositive. I Gemelli verranno quindi su Google Chat per riassumere le conversazioni e rispondere alle domande.

Google Maps

Lo scorso febbraio, Google ha annunciato che le sue mappe avrebbero utilizzato LLM per alimentare il suo chatbot “Chiedi informazioni”. Puoi usarlo per trovare luoghi che corrispondono alla tua richiesta con domande di follow-up di supporto. È alimentato dai dettagli di circa 250 milioni di luoghi, foto, video e recensioni inviate dagli utenti.

Cromato

Gemini Nano verrà lanciato sul browser desktop Chrome per potenziare funzionalità del browser come Help Me Type. Dovrebbe essere disponibile sulla maggior parte dei laptop e desktop moderni.







ricerca Google

Insieme al lancio di AI Overviews, Google ha presentato in anteprima una serie di funzionalità imminenti in arrivo per la prima volta in Search Labs:

Potrai prendere la panoramica originale dell’IA e renderla “più semplice” (solo poche frasi) o “scomposizione” (risposta più lunga).

Le funzionalità di ragionamento in più passaggi ti consentiranno di porre una domanda complessa in un unico passaggio anziché suddividerla in più query.

Pianificazione pasti e viaggi

Pagina dei risultati di ricerca organizzata dall’intelligenza artificiale

Ricerche video: registra un video e fai una domanda al riguardo

Androide

L’app multimediale Gemini Nano verrà lanciata sul Pixel “entro la fine dell’anno” e alimenterà funzionalità come descrizioni TalkBack sul dispositivo/offline e avvisi di frode in tempo reale che ascoltano le chiamate per individuare schemi rivelatori. Google condividerà maggiori dettagli entro la fine dell’anno.











All’I/O 2024, Google ha anche mostrato un’anteprima di come Gemini su Android si trasformerà presto in un pannello in sovrapposizione invece di aprire un’interfaccia utente a schermo intero per visualizzare i risultati. Oltre a mantenere il contesto, ciò ti consentirà di trascinare e rilasciare un’immagine creata in una conversazione. Per gli abbonati Gemini Advanced, gli utenti potranno vedere video e brevi documenti in Gemini tramite i pulsanti “Chiedi questo video” e “Chiedi questo PDF”, rispettivamente. Questo sarà implementato “nei prossimi mesi”. Inoltre, utilizzerai Suggerimenti Dinamici Gemini Nano con Multimodalità per capire cosa viene mostrato sul tuo schermo:

Ad esempio, se attivi Gemelli in una conversazione sul baseball, i suggerimenti potrebbero includere “Cerca club di baseball vicino a me” e “Regole del baseball per principianti”.

Un’altra aggiunta che sarà particolarmente utile sui dispositivi mobili sono le estensioni Gemini per Google Calendar, Google Task e Keep. Questo componente aggiuntivo ti consentirà di scattare una foto di una pagina contenente più date imminenti e Gemini sarà in grado di trasformarle in eventi del calendario. Nei prossimi mesi, la funzione “Utilità” dell’app mobile Gemini consentirà l’accesso all’app Orologio su Android.

Stiamo anche aspettando che l’app mobile Gemini arrivi sul Pixel Tablet quest’estate.

gemello

Lo streaming live ti consentirà di avere una conversazione bidirezionale con un Gemelli. Per rendere l’esperienza più naturale, Gemelli ti restituirà brevi risposte che potrai interrompere per aggiungere nuove informazioni o chiedere chiarimenti. Puoi scegliere tra 10 voci diverse, e Google immagina che Gemini Live sia utile per la preparazione delle interviste o le prove del discorso. Sarà disponibile nei “prossimi mesi” per i membri Gemini Advanced.











Entro la fine dell’anno, l’app Gemini Live ti consentirà di attivare la modalità fotocamera live. Basta indicare qualcosa nel mondo reale e porre una domanda al riguardo. Questo viene fatto attraverso il Progetto Astra.







Le gemme sono versioni personalizzate di Gemini che ti consentono di avere un “compagno di palestra, sous chef, partner di programmazione o guida alla scrittura creativa”. I membri Gemini Advanced potranno creare membri personalizzati, mentre tutti gli utenti avranno accesso a gemme già pronte, come il Learning Coach.

Descrivi semplicemente cosa vuoi che faccia il tuo core e come vuoi che risponda, ad esempio “Sei il mio allenatore di corsa, dammi un programma di corsa quotidiano e sii positivo, ottimista e motivato”. Gemini prenderà queste istruzioni e, con un clic, le migliorerà per creare una gemma che soddisfi le tue esigenze specifiche.

Gli utenti Gemini Advanced riceveranno inoltre un “pianificatore completo” che va oltre il semplice suggerimento di attività, ma tiene conto dei tempi di viaggio e delle fermate, nonché degli interessi delle persone, per creare un itinerario dettagliato. Gemini utilizzerà i dettagli del tuo volo/viaggio su Gmail, i consigli di Google Maps per cibo e musei vicino al tuo hotel e cercherà altre attività.