Etiqueta: Inteligencia Artificial

  • La Inteligencia Artificial es una burbuja que explotará de forma diferente a otras

    La Inteligencia Artificial es una burbuja que explotará de forma diferente a otras

    Desde que era pequeño, tuve conversaciones familiares sobre los avances «utópicos» de la sociedad… sobre qué nos deparará el futuro: ordenadores que cabían en la palma de las manos allá por 1986, robots que andaban con dos piernas y aguantaban el equilibrio en 1989, incluso la IA lleva avanzando paso a paso desde hace casi 40 años. La IA sólo tenía dos grandes problemas: el objetivo (herramientas muy básicas para obtener datos muy básicos) y el coste (demasiado alto para los resultados obtenidos), por lo que la IA ha estado presente siempre, pero relegada a un mero «avance utópico» que sólo podíamos vislumbrar en películas de ciencia ficción.

    Hoy día la IA ha dado un salto cuantitativo y cualitativo, permitiendo no sólo desarrollar herramientas complejas y conseguir resultados complejos como: resumir el libro entero de El Quijote para que lo entienda un niño de 12 años, si no que también se han democratizado su coste permitiendo que hardware con una potencia de cálculo similar al que se utilizan para jugar a juegos en 3D, pueda ofrecer soluciones muy interesantes sin tener que gastar cientos de millones de dólares en sistemas ultracomplejos de procesamiento.

    Actualmente sigo el día a día de la IA por diversos motivos, uno de ellos es porque me apasiona (lo cierto es que me apasiona cualquier tema que nos ayude a avanzar como sociedad y la IA es uno de estos temas), pero por otro lado es porque está claro que la IA es una tecnología que vendrá incorporada con cualquier nuevo sistema que tengamos, desde una lavadora, un frigorífico o un microondas, hasta la propia casa para poder hablar con ella y domotizarla como nunca nadie se hubiera imaginado.

    Hoy día no es difícil encontrar cientos de herramientas «gratuitas» o «semigratuitas» que ofrecen maravillosas ventajas basadas en inteligencia artificial y que nos permiten hacer vídeos, modificar fotografías, crear canciones, componer música, escribir textos, ayudarnos a resumir y a diseñar esquemas para aprender rápido y fácil cualquier tema que queramos.

    La IA tiene un coste

    No obstante, estas herramientas tienen un coste, un coste intrínseco en función de la necesidad de cómputo que le pedimos. Desde el momento en que le enviamos una grabación de audio y le pedimos que nos la transcriba a texto para poder «leer» qué se ha dicho en la conversación, nos damos cuenta que hay una tarjeta consumiendo casi 800W/h , generando 20ºC que hay que refrigerar para evitar que se queme además del coste de adquisición (de la tarjeta, el equipo, aire acondicionado, etc.) si eso lo multiplicamos por el número de peticiones simultaneas, el coste se dispara. Entonces ¿cómo empresas como OpenAI, Google o Amazon pueden ofrecerlo a un precio bastante asequible?

    De ahí la idea de que la IA es una burbuja en la que los costes se asumen porque interesa dar a conocer esta tecnología, hacer que la gente se acostumbre, que la gente la use, que vean lo «barato» que es con estas tarifas «baratas» pero que no cubren los costes. De ahí que OpenAI sea la empresa que ha dado a conocer la IA de forma pública y todo el mundo conoce ChatGPT y se pueden permitir pagar 20€/mes por un sistema barato que hace maravillas… pero pocos pagarían lo que realmente cuesta ese sistema y por eso OpenAI se debate entre la bancarrota o rehacer todo su sistema comercial para cubrir costes.

    Cobrar todo lo posible, pero con precios bajos…

    La forma de cobrar la IA no es nada sencilla, basta con ver la lista de precios y habla de un precio por «tokens» (la unidad más pequeña en la que se puede dividir una palabra o frase. Puede ser una palabra completa, un signo de puntuación, una subpalabra, como la mitad de una palabra compuesta o incluso un carácter especial), por minuto de audio a convertir. El precio de las imágenes también es bastante curioso porque depende del número de iteraciones, de la resolución, del tipo de generación, y un gran número de parámetros. Es prácticamente imposible hacer una previsión de costes ante una cantidad de interacciones.
    Si hago un sistema que transcriba y conteste llamadas utilizando inteligencia artificial ¿qué costes voy a tener? Todo dependerá de las palabras que tenga que transcribir, las que tenga que utilizar como entrada, las que tenga que utilizar para salida, las que tenga que volver a pasar a audio… todo depende de muchos factores. ¿y si alguien pide algo que dispara el número de palabras de respuesta? mal tema… prepara la cartera.

    Al final, estos precios son tan extraños para poder cobrar lo máximo (aparentando cobrar lo mínimo) y que permita cubrir costes, pero aún así, el coste es muy elevado y habrá un momento que las empresas que trabajan con IA necesiten verdaderamente cubrir todo el coste y empiecen a subir los precios de todo lo relacionado con GPT, generación de imágenes, etc. y entonces sí que veremos como algunas empresas que han crecido a raíz de los bajos costes de quien hacía sus cálculos a precios bajos, se quedarán sin usuarios porque nadie estará dispuesto a pagar lo que realmente cuesta la IA.

    ¿Cuándo ocurrirá la explosión de la burbuja?

    No creo que nadie lo sepa, básicamente cuando los fondos que prestaron el dinero para invertir en la infraestructura de IA empiecen a pedir retornos. Ahora mismo estamos en una etapa de lo que en el mundo de la tecnología de Silicon Valley llamamos: «generar la necesidad». Bien ¿quién considera que ChatGPT es una herramienta necesaria? ¿Quién no echaría de menos esa herramienta? ¿qué diseñador o fotógrafo no utiliza la IA de Adobe para mejorar o modificar sus fotografías? Hoy día creo que la etapa de «generar la necesidad» ya está culminada, así que supongo que la subida de costes será próximamente… en 2025 posiblemente.

    Lo que sí tengo claro es que Elon Musk acaba de crear un cluster de sistemas con más de 100.000 tarjetas NVIDIA H100 (cada tarjeta cuesta unos 30.000€) en menos de 120 días para crear su propia empresa de IA ahora pregunto: ¿Cuál es el tiempo de retorno de inversión que maneja esta empresa? ¿Quién crees que va a pagar este coste? y lo más importante ¿Cuánto beneficio nos traerá a los usuarios para poder pagar lo que necesitan que paguemos para cubrir sus costes y sacar el beneficio que esperan?

    Esto es por lo que creo que ahora mismo la IA es una burbuja y dentro de uno o dos años, veremos quién sigue vivo y a qué coste…

  • La revolución telefónica en los hoteles

    La revolución telefónica en los hoteles

    Ahora que se acerca el verano y empieza la época de un sector tan importante como el hotelero, vamos a analizar algunas mejoras que algunos hoteles están llevando a cabo para atraer más a sus huéspedes frente a otro sector que le hace la competencia como el de los pisos vacaciones.

    El sector hotelero es uno de los sectores donde más posibilidades tiene la tecnología, por desgracia, la alta competencia hace que muchos hoteles y cadenas hoteleras tiendan a equivocarse evitando un coste que considera innecesario, aunque éstos justamente es uno de sus mayores diferenciadores con el resto de competidores, y es entonces cuando la inversión tecnológica se basa en redes WiFi para los huéspedes y un servicio de televisión que incluya la mayor cantidad de canales disponibles. No obstante, otro de los dispositivos tecnológicos que ha quedado más abandonados por los hoteles es justamente uno de los que más potenciales tiene: el teléfono.

    Telefonía y Servicios de Red en un Hotel

    En la mayoría de los hoteles antiguos, los teléfonos son analógicos, con cableado de cobre que va a un cuartito con varios gateways (con suerte). En los hoteles más modernos, llevan cableado ethernet o bien una ONT de fibra en cada habitación y aprovechan esa conexión para el envío de datos de la televisión, internet y teléfono. Aún así, las ONT suelen llevar un conector analógico, por lo que el teléfono suele ser un dispositivo tonto que sólo sirve para hacer/recibir llamadas y poco más y es la televisión donde suelen invertir más de cara a dar un aspecto más tecnológico… al lado de un teléfono analógico.

    En cada habitación de un hotel, es obligatoria la existencia de un teléfono para ponerse en comunicación con recepción para cualquier motivo, entre ellos poder solicitar un servicio de habitaciones, una toalla extra, o cualquier otra cosa. Además, la posibilidad de hacer una llamada al exterior permite a los huéspedes poner en contacto con sus familiares y amigos. Sin embargo, el teléfono móvil del propio huésped ha hecho que el teléfono de las habitaciones haya quedado casi en desuso por lo que muchos de los hoteles mantienen teléfonos analógicos antiguos amarillentos por el paso de los años y dando la sensación de que la habitación del hotel tuvo años atrás tuvo una vida mejor.

    La telefonía en los hoteles ha evolucionado significativamente en los últimos años, aunque no siempre se le presta la atención que merece. A menudo, los hoteles invierten en tecnología visible como redes WiFi robustas y servicios de televisión de alta calidad, mientras que los teléfonos en las habitaciones quedan obsoletos y poco utilizados. Sin embargo, los teléfonos modernos para hoteles ofrecen numerosas ventajas tanto para la administración del hotel como para la comodidad de los huéspedes.

    Los teléfonos de Snom de la serie HD, son un ejemplo de dispositivos que combinan funcionalidad moderna con un diseño elegante. Los modelos HD100 y HD101, por ejemplo, están equipados con carcasas antibacterianas, indicadores LED grandes y la capacidad de etiquetado individualizado. Estos dispositivos no solo cumplen con las necesidades básicas de comunicación interna, como llamadas a la recepción y solicitudes de servicio de habitaciones, sino que también ofrecen características avanzadas como manos libres, silencio y espera. Además, algunos modelos, como el HD351W, permiten conexiones inalámbricas tanto por DECT como por WiFi, ofreciendo flexibilidad y movilidad dentro de la habitación​.

    Por otro lado, Grandstream también ofrece soluciones avanzadas de telefonía para hoteles. Sus teléfonos de la serie Grandstream GHP son especialmente diseñados para entornos hoteleros, combinando facilidad de uso con múltiples características útiles. Estos teléfonos permiten a los hoteles ofrecer un servicio de calidad con funciones como múltiples teclas programables, soporte PoE y opciones de personalización para adaptarse a la imagen de la marca del hotel. Los modelos de Grandstream como el GHP620W no solo mejoran la comunicación interna, sino que también proporcionan a los huéspedes una experiencia más cómoda y conectada durante su estancia​.

    Invertir en la modernización de la telefonía hotelera puede ser una estrategia inteligente para los hoteles que buscan diferenciarse en un mercado competitivo. Equipar las habitaciones con teléfonos de última generación como los de Snom y Grandstream no solo mejora la experiencia del huésped, sino que también optimiza las operaciones del hotel. Estos dispositivos avanzados pueden integrarse fácilmente con los sistemas de gestión existentes, facilitando la administración de las solicitudes de los huéspedes y mejorando la eficiencia operativa general.

    ChatBots e Inteligencia Artificial para ayudar a los huéspedes

    Los chatbots se han convertido en una herramienta esencial para la gestión de solicitudes y la mejora de la experiencia del cliente en el sector hotelero. Estos asistentes virtuales, impulsados por inteligencia artificial (IA), permiten a los huéspedes interactuar con el hotel de manera eficiente y conveniente, gestionando una variedad de peticiones dentro de ciertos límites predefinidos. Estos pueden manejar diversas solicitudes, desde reservas y consultas sobre disponibilidad de habitaciones hasta la solicitud de servicios de habitaciones, toallas adicionales o información sobre actividades locales. Estos asistentes están disponibles 24/7, lo que garantiza que los huéspedes puedan obtener respuestas rápidas a sus preguntas en cualquier momento del día o de la noche. Además, la capacidad de los chatbots para gestionar múltiples interacciones simultáneamente reduce la carga de trabajo del personal del hotel, permitiéndoles concentrarse en tareas más complejas que requieren atención humana​.

    La integración de chatbots con los sistemas de gestión del hotel (PMS) permite un flujo de información fluido y una actualización en tiempo real de las solicitudes de los huéspedes. Por ejemplo, si un huésped solicita una almohada adicional a través del chatbot, esta solicitud se registra automáticamente en el sistema del hotel y se envía una notificación al personal de limpieza, asegurando una respuesta rápida y eficiente​

    Servicio de ayuda e información turística

    Los servicios de ayuda e información turística en los hoteles suelen incluir mostradores de conserjería donde el personal capacitado puede ofrecer mapas, folletos y consejos sobre las mejores maneras de explorar la ciudad. Sin embargo, en la era digital, muchos hoteles están incorporando soluciones tecnológicas para complementar estos servicios tradicionales. Por ejemplo, algunos hoteles ofrecen aplicaciones móviles que incluyen guías turísticas interactivas, recomendaciones personalizadas basadas en las preferencias del usuario y la posibilidad de reservar entradas para eventos y atracciones directamente desde la aplicación.

    Además, los hoteles pueden utilizar quioscos digitales interactivos en el vestíbulo para proporcionar a los huéspedes acceso rápido a información turística. Estos quioscos pueden ofrecer detalles sobre lugares de interés cercanos, horarios de transporte público, opciones de restaurantes y eventos locales. Al integrar estos quioscos con el sistema de gestión del hotel, los huéspedes también pueden recibir recomendaciones basadas en sus preferencias y el historial de sus actividades durante su estancia​.

    Sistemas IOT en Hoteles

    La implementación de sistemas de sensores IoT (Internet de las Cosas) en hoteles está revolucionando la forma en que se gestionan y optimizan diversos aspectos operativos, mejorando tanto la eficiencia energética como la experiencia del huésped. Estos sistemas pueden controlar y monitorizar en tiempo real parámetros como la temperatura, la humedad, el consumo de energía y otros factores ambientales, proporcionando una serie de beneficios significativos.

    Los sensores IoT pueden instalarse en las habitaciones de los hoteles para monitorizar y ajustar automáticamente la temperatura y la humedad según las preferencias de los huéspedes y las condiciones ambientales. Esto no solo garantiza el máximo confort, sino que también optimiza el uso de los sistemas de calefacción, ventilación y aire acondicionado (HVAC). Al ajustar la temperatura y la humedad de manera inteligente, los hoteles pueden reducir significativamente sus costes energéticos y su huella de carbono.

    La energía es uno de los mayores gastos operativos para los hoteles. Los sensores IoT pueden monitorizar el uso de la electricidad y otros recursos en tiempo real, identificando áreas donde se puede reducir el consumo sin comprometer la comodidad del huésped. Por ejemplo, los sensores pueden apagar automáticamente las luces y ajustar la temperatura cuando una habitación está desocupada. Además, estos sistemas pueden proporcionar informes detallados sobre el consumo energético, permitiendo a los gerentes del hotel tomar decisiones informadas sobre cómo mejorar la eficiencia energética​.

    Los sensores IoT también pueden mejorar la seguridad y la sostenibilidad del hotel. Por ejemplo, los sensores de calidad del aire pueden detectar niveles peligrosos de monóxido de carbono o humo, alertando inmediatamente al personal del hotel y a los sistemas de emergencia. Asimismo, los sensores de agua pueden monitorizar el consumo y detectar fugas, ayudando a conservar este recurso vital y a evitar daños por agua​.

    ¿Cuándo veremos Hoteles con estas características?

    Pues lo cierto es que ya se ven. Son muchos los hoteles que han empezado a modernizar sus instalaciones de cara a esta nueva temporada, apostando por una imagen más nueva, fresca e inteligente a la vez que ofrecen algo que los huéspedes pueden valorar frente a otras ofertas.

    Si has visitado Disneyland Paris y te has podido alojar unos días en alguno de los hoteles del parque, sabrás a lo que me refiero. Cuidar los detalles tiene un precio que muchos huéspedes están dispuestos a pagar. Por supuesto, hay alternativas más baratas. Como siempre me han dicho: siempre hay alguien más barato. Pero los hoteles de Disneyland no se caracterizan por estar vacíos… la gente llena los hoteles porque quieren disfrutar de esos detalles pese a tener que pagar más por ello. Habrá quien prefiera alojarse en un Airbnb, pero si la experiencia merece la pena… 😉

    Si este verano viajas y te alojas en un hotel, fíjate en esos detalles… intenta averiguar el año de construcción del hotel y cuanto tiempo tiene el teléfono que hay en la mesita de noche y descubrirás si prestan atención a los detalles, o sólo al precio de la habitación.

  • La Inteligencia Artificial cambiará la forma en la que hacemos las cosas

    La Inteligencia Artificial cambiará la forma en la que hacemos las cosas

    Esta semana pasada tuvo lugar la ICT Solutions Day, un evento al que fui invitado para hablar sobre lo que conozco y me gusta: Las comunicaciones unificadas en la actualidad. Este tema da para una conversación larga como bien pude comprobar al finalizar la charla y es que no fueron pocos los que se pararon a conversar sobre este tema y algunos comentarios que hice sobre algo que considero que es el futuro de las comunicaciones y que nada tiene que ver con las comunicaciones tal y como las conocemos actualmente.

    Lo cierto es que me ha hecho mucha ilusión, ya que en 2018 fue la última vez que pude ir a un evento de estas características para hablar sobre VoIP e Inteligencia Artificial. En 2019 me fue imposible por la agenda y en 2020 ya comenzó el COVID y se fue todo a la porra. Por lo que volver a ir a un evento de estas características donde poder reencontrarme con amigos, colegas y conocidos, ha sido una experiencia increíble y que espero poder repetir en breve.

    Durante el VoIP2DAY 2018, ya hablé de las posibilidades que ofrecía la Inteligencia Artificial en el campo de la VoIP, lo cual daba para pensar en qué cambiaría nuestro día a día los cambios que estaban por venir.

    Desgraciadamente llegó el COVID, y eso paralizó todo avance, todo desarrollo para dar lugar a una explosión de oportunidades para ciertas «suites» que estaban despegando en esos instantes: Zoom, Teams, OneCloud, Jitsi, etc. Tras una serie de numerosas desdichas en estos anteriores años: 2020, 2021, 2022,… llegamos a un evento clave: la caída del precio de las criptomonedas momento en el cual, un componente hardware clave para la minería de criptomonedas, comenzó a mostrar existencias y bajadas de precios, lo cual dio lugar a GPUs muy potentes y disponibles para aquellos que quisieran aprovecharlas en otras actividades que no fuera la «minería de criptomonedas«, esto es: la industria de los videojuegos y más importante aún: La Inteligencia Artificial.

    La Inteligencia Artificial ha demostrado en apenas 10 meses que puede convertirse en una de las herramientas más importantes desde la invención de Internet, que provoca tanto ilusiones, esperanza y nuevas oportunidades, como rechazo, miedo y angustia por los trabajos que no van a cubrirse debido al avance sin límites de las nuevas aplicaciones como ChatGPT capaces de crear documentos, contratos, textos legales, trabajos escolares, cuentos y cálculos complejos, así como herramientas de creación visual como Midjourney, DALL·E 2, Stable Diffusion, etc.

    No llegamos a ser capaces de imaginar lo que puede depararnos el avance de la Inteligencia Artificial en el próximo año y medio… y, considerando que la Inteligencia Artificial tiene un aprendizaje exponencial, las posibilidades dentro de 4 o 5 años pueden llegar a ser realmente alucinantes.

    En el campo de las comunicaciones, la Inteligencia Artificial nos está abriendo un mundo sorprendente en todos los campos, desde la redacción de correos electrónicos, mensajería instantánea, presencia, como en generación, modificación y mejora de audio y vídeo en conferencias de cualquier tipo: llamadas, videollamadas, multivideollamadas, etc. permitiéndonos comprimir audio y vídeo hasta niveles jamás imaginados.

    Por último y tras las últimas noticias de Apple con su Vision Pro, unas gafas de realidad virtual orientadas a un despliegue diferente al que buscan empresas como Meta o Microsoft, puede que las gafas de Realidad Virtual de Apple sean el auténtico paso previo que hace falta para que empiecen a popularizarse y, quizá para dentro de 7 u 8 años (para 2030), podamos empezar a ver algo como lo del Metaverso que realmente llame la atención, tanto como para dar el salto, aunque hasta entonces, todavía quedará algunos años.

  • La Inteligencia Artificial de Meta crea algo que podría revolucionar la VoIP

    La Inteligencia Artificial de Meta crea algo que podría revolucionar la VoIP

    Después de muchos años, la Inteligencia Artificial por fin está revolucionando muchos campos de la informática, pero uno que podría afectar también (además de mejorar considerablemente el reconocimiento de voz y la conversión de texto a audio) es la posibilidad de encontrar mejoras en la compresión hasta llegar a niveles nunca visto ni imaginado.

    La empresa Meta tiene un departamento de Inteligencia Artificial que pone a trabajar su tecnología al máximo para generar patentes y nuevas oportunidades de negocio, y entre estas creaciones han inventado algo que podría revolucionar la forma de almacenar el audio tal y como lo conocemos: Encodec

    Encodec es un codec que promete una calidad de audio similar a la de un MP3, pero con una tasa de compresión 10 veces mejor y sin pérdida de calidad, lo que implica enviar audio estéreo y con calidad idéntica al de un archivo MP3 pero con una tasa de transferencia de 6kb/sec. (incluso menos que G729)

    Hay incluso algún ejemplo de audio con una tasa de transferencia de 3kb/sec y con una calidad realmente alucinante para esa tasa de transferencia como podéis escuchar en el ejemplo siguiente:

    El esquema de la compresión puede parecer un poco compleja y se podría pensar que un móvil o un teléfono IP estándar no sería lo suficientemente potente como para codificar el audio en tiempo real y no estaría del todo equivocado.

    Encodec podría utilizar los procesadores de Inteligencia Artificial del móvil

    ¿Por qué no se utiliza MP3 como códec en VoIP y sí se utilizan otros como Alaw o G729? Básicamente por el coste de recursos que supone comprimir y descomprimir audio. Hay que pensar que los dispositivos electrónicos suelen fabricarse intentando minimizar costes y añadir un procesador más potente o dedicado puede aumentar el coste. No obstante, los móviles de alta gama ya rondan los 1000€ por lo que incluir procesadores especiales para comprimir audio puede ser una realidad dentro de poco, lo que abriría las puertas a utilizar códecs especiales que mejorarían bastante la calidad de audio frente al típico A-Law o G.729. y ni que decir tiene que muchos teléfonos creados en los últimos años ya incluyen procesadores especiales para cálculo en tareas de Inteligencia Artificial, lo que implica que esos procesadores pueden ayudar bastante a utilizar algoritmos como Encodec que acaba de presentar Meta.

    Ejemplos de audio

    Los investigadores de Meta han creado una página donde se puede escuchar las típicas comparaciones de calidad de audio entre sonido RAW y sonido comprimido tanto con Lyra de Google como con Encodec de Meta. Los podéis encontrar aquí: https://ai.honu.io/papers/encodec/samples.html

    El código fuente de Encodec está publicado en Github en su página para descargarlo y probarlo:
    https://github.com/facebookresearch/encodec 

  • Por qué la voz humana ya no sirve para identificar a alguien

    Por qué la voz humana ya no sirve para identificar a alguien

    Hace unos años dí una conferencia en el VoIP2DAY sobre el uso de la Inteligencia Artificial en el campo de la VoIP en el que hablaba que existen bancos (HSBC por poner un ejemplo) que comprueba durante una llamada, si la persona con la que hablamos es realmente quien dice ser, aprovechando un análisis de la voz telefónica (Voice ID Fingerprinting).

    Esto hoy día ya no es una aplicación válida, ya que alguien le ha dado dos vueltas de tuerca a esto de la Inteligencia Artificial y ha conseguido que, aprovechando una conversación telefónica de 5 segundos, poder generar casi en tiempo real un modificador de audio para cambiar la voz de un TTS de forma que tenga exáctamente el mismo tono y el mismo timbre de voz que en la grabación de 5 segundos. Esto es, cualquiera con esa aplicación podría generar una conversación con nuestra voz y confundir y poder hacerse pasar por una persona.

    Hay soluciones comerciales que ya hacen esto y que nos permite generar locuciones con la voz que queramos (incluso con una propia) por lo que si necesitamos generar nuevas locuciones para nuestro sistema, aquí tendríamos todo lo necesario.

    No obstante, la aplicación «Real Time Voice Cloning» junto con toda la documentación de la tesis está disponible desde la página web del proyecto: https://github.com/CorentinJ/Real-Time-Voice-Cloning y un vídeo demostrativo de cómo funciona.

    Así que, si tenéis un rato aburrido, os recomiendo que lo probéis porque es una herramienta tan útil como curiosa para frikear un buen rato.

  • NVidia anuncia un sistema en la nube que mejora las videoconferencias

    NVidia anuncia un sistema en la nube que mejora las videoconferencias

    La empresa fabricante de tarjetas gráficas NVidia lleva algunas semanas dándonos bastantes noticias: la compra de ARM, la creación de su nueva generación de tarjetas gráficas que mejora «en teoría» hasta un 20% el rendimiento de la anterior generación y por último, un sistema en la nube que, potenciado por Inteligencia Artificial gracias a sus procesadores GPU mejoran considerablemente la forma en la que hoy día hacemos videoconferencias.

    El sistema NVIDIA Maxine es una plataforma de videoconferencia potenciada por Inteligencia Artificial que, tal y como podéis ver en el siguiente vídeo, mejora las videoconferencias en tiempo real gracias a varias ventajas:

    Super-Resolución (permite gracias a la inteligencia artificial) crear un vídeo de alta calidad basado en un vídeo de «baja calidad» de manera que, aunque el ancho de banda sea muy limitado, al receptor de la videoconferencia obtendrá una calidad de imagen casi perfecta. Por supuesto, no puede inventar lo que no existe… pero hablando de Inteligencia Artificial… ¿por qué no?

    AutoFrame permite al sistema rastrear y rastrea y mover la sección de video para que siempre esté en el centro de la imagen

    Virtual Background, y es que si esta funcionalidad ya estaba en la mayoría de sistemas de videoconferencias, parece ser que con una GPU y un poco de IA, la detección de fondos puede ser algo mucho más fácil.

    Denoise, para aquellos que tienen bastante ruido de fondo y necesitan que un sistema de IA analice el audio y filtre convenientemente el ruido que no sea el del interlocutor.

    Avatar: de la misma manera que lo hacen los Memojis de Apple, NVidia ha encontrado otra forma de aplicar los movimientos de la cara a figuras y avatares.

    Traducción en tiempo real, y es que esto también es algo que tienen algunos sistemas, gracias a la conexión con una fuente de reconocimiento y traducción automática como la de Google.

    Compresión de vídeo. Esto considero que es algo muy, muy interesante, y es que permite al sistema reconocer tu cara, los gestos y los movimientos para crear por Inteligencia Artificial tu propia imagen con la nueva postura sin llegar a transmitir todo el frame, únicamente la posición de los puntos clave.

    Alineamiento de la cara, y es que ahora gracias a las redes neuronales GAN ya pueden «autocompletar» la información que les falta y pueden mover la cabeza de la persona rellenando con información nueva los datos que no tienen. El resultado es impresionante.


    El vídeo completo podéis verlo aquí, y así poder ver en pleno funcionamiento estas nuevas características. Al parecer ya hay empresas que lo están utilizando para sus sistemas de videoconferencia, no tiene pinta de barato, pero lo que sí está claro es que NVidia está dando unos pasos muy grandes para convertirse en otra de las empresas de oro.

    Vídeo completo donde ver en detalle estas características.

    Otro vídeo por si os habéis quedado con ganas de más

    Vídeo donde se explican con más detalle algunas de las características de Maxine

    Web: https://developer.nvidia.com/maxine

  • Introducción a la Inteligencia Artificial y el Big Data en el ámbito de la VoIP

    Introducción a la Inteligencia Artificial y el Big Data en el ámbito de la VoIP

    Como viene siendo habitual cada año, Sinologic participa en el evento VoIP2DAY impartiendo una conferencia técnica, intentando que sea del agrado de todos los asistentes y de paso, promover ciertas técnicas, tecnologías y acercar ciertos conceptos que normalmente no están al alcance de todos, de una forma más pedagógica y amena en el tiempo disponible.

    En esta ocasión, la conferencia que impartíamos era sobre Inteligencia Artificial y el Big Data, aprovechando que el mundo de la VoIP es un generador nato de información: Llamadas, parámetros de calidad, conversaciones, diálogos, números de destinos, seguridad, paquetes, y un gigantesco número de posibilidades se abren para ser estudiadas y aprovechar el impulso de nuevas técnicas que favorecen el uso de la inteligencia artificial para mejorar las tareas que realizamos en nuestro día a día.

    A continuación, os mostramos el material utilizado durante la conferencia que, por problemas técnicos se quedó un poco en el aire. La razón era que el ordenador donde habíamos preparado algunos ejemplos prácticos no era compatible con la pantalla y, por esa razón, tuvimos que saltarnos las demostraciones que, entre nosotros, eran muy ilustrativas.

    No obstante, en el material he publicado la parte interesante de dichas demostraciones, así como enlaces a los lugares donde podéis verlas más detenidamente.

    Espero que os guste. 😉

    Pulsa la imagen para ver la presentación