Opera presenta un avance esperado por todos en Aria, vinculado a las imágenes y la capacidad de responder

La compañía noruega presentó Aria a finales del año pasado, cuando comentó que se había diseñado para “potenciar la creatividad y productividad de los usuarios junto con la tecnología GPT de OpenAI.

05 de junio 2024, 02:50hs

Opera presenta un avance esperado por todos en Aria, vinculado a las imágenes y la capacidad de responder

Opera anunció su navegador insignia, Opera One, de nuevas capacidades para su Inteligencia Artificial (IA) Aria, que ahora es capaz de generar imágenes y leer en voz alta respuestas de texto.

La compañía noruega presentó Aria a finales del año pasado, cuando comentó que se había diseñado para “potenciar la creatividad y productividad de los usuarios junto con la tecnología GPT de OpenAI.

Este servicio de IA generativa gratuito de Opera está basado en la infraestructura Composer de desarrollo propio.

Esta es capaz de buscar información, generar textos e incluso código y ofrecer resultados actualizados.

OPERA QUIERE SER EL NAVEGADOR INTELIGENTE DEL FUTURO

Opera comentó ahora que está dedicando “importantes esfuerzos al desarrollo de lo que aspira a ser el navegador inteligente del futuro”, según una nota de prensa.

En su comunicado adelantó que recientemente implementó los modelos de lenguaje grandes (LLM) en dispositivos locales pra desarrolladores.

Opera One ahora puede generar imágenes y leer en voz alta respuestas de texto.

Dicha implementación forma parte de su programa de actualización y prueba de funciones de IA.

DOS ACUTALIZACIONES DE FUNCIONES DE IA

Opera también anunció dos actualizaciones de funciones de IA dentro del desarrollo de su navegador Opera One, que integran nuevas capacidades.

Entre estas últimas, se incluye la generación de imágenes y la lectura en voz alta de respuestas de texto.

Con la primera de estas capacidades, Aria reconocerá automáticamente si el usuario desea crear una imagen basándose en las indicaciones de la conversación.

Esto permite “desde crear activos visuales para presentaciones hasta generar imágenes divertidas”.

EL MODELO IMAGEN2 DE GOOGLE

Todo ello, utilizando el modelo Imagen2 de Google. Para generar una imagen solo será necesario iniciar un chat con Aria.

A continuación, se debe indicar que se quiere generar una imagen y proporcionar una descripción detallada de las características deseadas.

En caso de que Aria ofrezca un resultado que no esté en línea con lo que busca el usuario, podrá crear una nueva con la opción ‘Regenerar’, situada en la esquina superior derecha.

GENERACIÓN DE IMÁGENES ANTIGUAS Y NUEVAS

Opera indicó que Aria almacena las solicitudes de generación de imágenes antiguas y las nuevas para crear el resultado más afín a las expectativas de los usuarios.

En esa línea, apuntó que dicha funcionalidad dispone de hasta 30 oportunidades diarias para convertir texto en imágenes.

Por otra parte, la compañía detalló que su solución impulsada por IA ahora integra la capacidad de leer respuestas de texto en voz alta similar a la humana.

Lo hace mediante la implementación del modelo Wavenet de Google.

Aria puede buscar información, generar textos y código, y ofrecer resultados actualizados.

LA FORMA EN QUE SE ACTIVAN LAS FUNCIONALIDADES

Opera ha comentado que esta funcionalidad se activa mediante los comandos ‘Ctrl+’ en Windows o ‘cmd+’ en Mac o desde la barra lateral de Opera One.

Esta utilidad, permite facilitar la accesibilidad de la herramienta, su uso multitarea y obtener información en un formato diferente.

SE PODRÁ DETENER EL DIÁLOGO

Una vez que la IA comience a hablar, se puede detener el diálogo presionando el botón de pausa, que reemplazará al icono del altavoz cuando se esté utilizando esta funcionalidad.

Si se hace clic sobre el icono del altavoz, el diálogo se reiniciará desde el principio.

La firma ha comentado finalmente que para probar estas funciones es necesario descargarse Opera Developer y unirse al programa de actualizaciones de funciones de IA.

Fuente: EP.