Etiqueta: Opensource

  • Whisper: el reconocedor de audio local definitivo

    Whisper: el reconocedor de audio local definitivo

    Whisper es una herramienta gratuita y software libre que utiliza inteligencia artificial local de nuestros sistemas para reconocer palabras en un archivo de audio y convertirlas a texto (lo que se conoce normalmente como ASR: Automatic Speech Recognizer) y que ha sido desarrollada por los creadores de Dall-E2 y ChatGPT: OpenAI.

    Ya conocéis VOSK y vimos sus ventajas y sus inconvenientes, en la mayoría de los casos esta herramienta es más que suficiente para lo que necesita la mayoría que no tenga muchos requisitos. No obstante, cuando apareció Whisper decidimos echarle un vistazo y su resultado nos sorprendió más de lo que pudieramos imaginar. Reconoce nombres, fechas, matrículas, números de ID, y prácticamente cualquier cosa que se dijera, incluso puede reconocer a distintas personas y escribir la conversación como si fuera un guión de una película. Whisper de OpenAI había vuelto a hacerlo aunque no tuviera mucha publicidad de los grandes medios, es una herramienta fabulosa y que merecía la pena probarla en serio.

    Whisper utiliza como «motor de inteligencia artificial» la librería PyTorch, una librería muy conocida y que, aunque lleva muchos años funcionando, es una de las mejores, aunque como tal, requiere de hardware especial.

    Whisper requiere una GPU compatible

    Ahí es donde empezamos a pensar en probarla en local y nos encontramos con algo que ya esperábamos: al trabajar con inteligencia artificial requiere de una gran potencia de cálculo, lo que implica que allá donde queramos ejecutarla necesitaba de una GPU (una tarjeta gráfica potente) que soporte CUDA porque sin esto, reconocer 1 minuto de conversación podía llevar más de 2 horas de cómputo.

    No obstante, entramos en su web e instalamos Whisper para probarlo en un ordenador con una tarjeta gráfica con CUDA y vemos qué tal funciona y los resultados son espectaculares, además de que, a diferencia de otros servicios de OpenAI, Whisper no requiere de conexiones remotas a servidores externos, por lo que el reconocimiento es local.

    Reconocimiento multi-idioma y diferentes modelos

    Reconoce prácticamente cualquier idioma: Español, Inglés, Francés, Catalán, Gallego, y 50 idiomas más.
    Tiene varios modelos separados en función de la calidad del reconocimiento:

    SizeParametersEnglish-only modelMultilingual modelRequired VRAMRelative speed
    tiny39 Mtiny.entiny~1 GB~32x
    base74 Mbase.enbase~1 GB~16x
    small244 Msmall.ensmall~2 GB~6x
    medium769 Mmedium.enmedium~5 GB~2x
    large1550 MN/Alarge~10 GB1x

    Como veis, un reconocimiento mínimo apenas consume 39Mb y 1Gb de RAM, además de ser muy rápido, pero en este caso Vosk es incluso mejor.
    Para que Whisper reconozca medianamente bien, el modelo recomendado es small o medium, y con esto, una conversación telefónica podría ser perfectamente reconocida y procesada, mucho mejor que Vosk.

    Demo gratuito de Whisper

    Como lo mejor es una demo para que lo probéis, aquí hay una web que tiene un procesador especial para probar Whisper remotamente: https://huggingface.co/spaces/anzorq/openai_whisper_stt

  • SIPPTS: Un conjunto de herramientas para ayudarnos con la seguridad de nuestro sistema VoIP

    SIPPTS: Un conjunto de herramientas para ayudarnos con la seguridad de nuestro sistema VoIP

    Nuestro gran colega @Pepelux acaba de publicar la versión 2.0.2 de SIPPTS, un set de herramientas libres para auditar la seguridad de nuestra infraestructura VoIP. Estas herramientas están disponible en su página de GitHub: https://github.com/Pepelux/sippts

    Las herramientas que forman el paquete SIPPTR son:

    • Sipscan un scanner para servicio SIP que puede comprobar varias IPs y rangos de puertos tanto UDP como TCP.
    • Sipexten para comprobar si existe una extensión en un servidor SIP, así como si necesita identificación o no.
    • Sipcracker un crackeador de contraseñas remotas capaz de probar contraseñas para muchos usuarios en distintas IPs y puertos.
    • Sipinvite comprueba si un servidor nos permite hacer llamadas sin autentificación, también si puede hacer llamadas salientes.
    • Sipsniff un simple pero útil sniffer SIP.
    • Sipspy un servidor SIP muy simple que nos permite ver las peticiones y respuestas recibidas.
    • SipDigestLeak Herramienta para explotar la vulnerabilidad SIP descubierta por Sandro Gauci que afecta a un gran número de hardware y software.

    Un kit muy completo y recomendable para hacer pruebas y revisar la seguridad. 😉

  • ¿Dónde se fueron los interfaces libres de Asterisk?

    ¿Dónde se fueron los interfaces libres de Asterisk?

    Todo cambia, y aunque a menudo no nos haga gracia que hayan cambios y que nos puedan parecer algo negativo, lo cierto es que cualquier cambio es positivo. A veces, (cuando las cosas van mejor) pues es lo más evidente, pero cuando las cosas no van como esperaban, el cambio sirve para reafirmar que ese camino no es el correcto y que toca experimentar otros. Por esa razón, cualquier cambio que experimentemos, siempre es bueno.

    Hubo un tiempo en el que llegamos a contar hasta 7 interfaces webs opensource para gestionar Asterisk: Elastix, Asterisk-GUI, FreePBX, Askorzia, Vicidial, IncrediblePBX y algunos otros que no recuerdo. Hoy día solo existen dos interfaces libres que siguen manteniéndose (igual hay más, pero son los que conozco): FreePBX (en manos de Sangoma) e Issabel.

    Es importante notar la diferencia de que «open source» no significa «libre» (que puedas ver el código no significa que lo puedas cambiar a tu gusto y distribuirlo libremente con tus modificaciones).

    Ambos interfaces son muy completos, soportan prácticamente cualquier configuración que nos pueda interesar y si bien cualquiera de ellas nos podría interesar para configurar un Asterisk, no deja de ser irónico que, ahora que Asterisk tiene el mejor soporte para desarrollar interfaces webs (realtime, pjsip, ARI, AMI, etc), sea ahora mismo cuando la cantidad de interfaces web libres haya descendido a un mínimo histórico.

    Desarrollar un interfaz de gestión no es una tarea complicada, pero sí es bastante laboriosa. Crear un interfaz que gestione los usuarios SIP es meramente saber gestionar una tabla o crear un archivo de texto con un formato concreto, pero crear un interfaz que permita configurar las miles de características y posibilidades que ofrece Asterisk, puede ser un arduo trabajo de muchos meses o años dedicados que los usuarios no tienen por qué ver y a la hora de escoger uno u otro interfaz seguirán escogiendo al más completo.

    El paso de las empresas a «la nube», a los sistemas multi-tenant, y las nuevas soluciones comerciales han hecho que, donde antes una empresa que instalaba un servidor Asterisk en cada cliente y que necesitaba de un interfaz para cada cliente, hoy día solo necesita una solución multi-tenant (comercial) en un servidor remoto para ofrecer el mismo servicios a sus clientes, lo que hace que no sea necesaria ese interfaz «local» y, en caso de que sea necesario, siempre se puede optar por una solución comercial con un soporte directo de la empresa desarrolladora y así trasladar costes.

    En definitiva, los interfaces web libres de Asterisk siguen siendo importantes y necesarios, aunque las necesidades cambian y si bien siguen siendo necesarios los interfaces que permiten gestionar un Asterisk individual para una empresa, el «negocio» puede estar más en los nuevos sistemas, más orientados a la nube, a la integración con otros sistemas, eso si, con la mentalidad que muchas empresas tienen, no creo que alguien que desarrolle un sistema así, lo haga opensource.

  • Adiós a Asterisk SCF? Digium paraliza su desarrollo

    Lo bueno del software libre es que cualquiera puede descargar el código fuente de una aplicación, modificarla, mejorarla, arreglarla y publicarla de nuevo: cada modificación forma parte del desarrollo. No obstante, en todo proyecto suele haber una o varias personas que son las que llevan el «liderazgo» de un proyecto, los que confirman los cambios, los que organizan las mejoras que deben aparecer, ya que si cualquiera sube cambios, el proyecto puede acabar en un auténtico desbarajuste caótico difícilmente mejorable.

    Otra posibilidad es crear un fork, una versión paralela en la que dicho liderazgo cambie en la nueva versión, quizá con otras metas u objetivos, quizá con el simple deseo de evitar que el proyecto inicial termine desapareciendo o corrompiéndose.

    Hoy nos hemos levantados con una noticia triste, Digium ha anunciado que no puede continuar con el desarrollo de Asterisk SCF de la misma forma que venía haciéndolo y «como los usuarios de Asterisk están acostumbrados«, lo que implica, no solo que Asterisk SCF pasa a un segundo o un tercer plano, si no que el apoyo de esta solución va a decaer al perder el «liderazgo» del que hablábamos en un principio.

    El agravio comparativo en cuanto a sencillez, cantidad de conocimientos necesarios, etc, con respecto a Asterisk es brutal, por lo que apenas un 0,5% de los usuarios de Asterisk han llegado a instalar Asterisk SCF alguna vez, y de ellos, estoy convencido que muy pocos lo utilizan habitualmente, por lo que, a falta de tiempo y desarrolladores, es preferible continuar con el desarrollo de Asterisk que el de un proyecto que no tiene un público tan numeroso y entusiasmado como Asterisk.

    (más…)

  • Elastix 1.6 stable Released

    En la página de Elastix, encuentro una buena noticia

    Estimados miembros de la comunidad,

    Con orgullo anunciamos que Elastix 1.6 esta listo para descargas en sus 2 versiones ISO de: 32 y 64 bits . Esta versión provee actualizaciones y correcciones de bugs tanto de Elastix como de CentOS. Entre las más importantes destacamos:

    • Asterisk actualizado a 1.4.26.1-4
    • Dahdi actualizado a 2.2.0.2-6
    • Asterisk ahora puede utilizar modems Huawei 3g como troncales. Esto gracias a Odicha creador de chan_sebi
    • Kernel actualizado a la última versión de CentOS 5.3: 2.6.18.164.el5

    logo_elastix

    Ver el changelog completo

    Descargar:
    → Elastix Distro 1.6 Estable (32 bits)
    → Elastix Distro 1.6 Estable (64 bits)

    Visto en Barrapunto

  • Cómo compilar Skype en Linux… 😎

    Si, no me he equivocado de verbo, es compilar. Al parecer, Skype publicó la última versión en un paquete para la distribución Mandriva y Olivier Faurax?, uno de los empaquetadores preguntó en la lista… ¿Porqué no sacar una versión OpenSource que podamos compilar nosotros? a lo que la gente de Skype insinuó que «eso es algo que podría pasar pronto«, tras hacerse eco de este comentario en muchos sitios como Slashdot y algunas otras webs, tuvieron que aclarar el comentario:

    Yes, there’s an open source version of Linux client being developed. This will be a part of larger offering, but we can’t tell you much more about that right now. Having an open source UI will help us get adopted in the «multicultural» land of Linux distributions, as well as on other platforms and will speed up further development. We will update you once more details are available.«

    Así que parece ser que por un motivo o por otro, próximamente tendremos una «versión» opensource de Skype.

    Por supuesto, no hay que hacerse ilusiones ya que eso no significa que vaya a existir Skype opensource, si no que sacarán un interfaz gráfico libre (en el mejor de los casos) que hará uso de un núcleo cerrado y propietario, por lo que Skype seguirá siendo tan cerrado como siempre pero permitiendo a todos los usuarios de Linux compilar su interfaz y no tener que esperar a que lo haga la gente de Skype, ni recurrir a «ñapas» como el que nos decía Saúl el otro día.

    Ya aviso que en los próximos días vereis muchos artículos con el titular: «Skype será software libre!» u otros por el estilo pero cualquiera que lea el comentario de la gente de Skype, se dará cuenta que sólo se refiere al interfaz gráfico. 😉

  • Asterisk reunirá todos los proyectos en un único lugar

    asterisk-forgeA la hora de buscar una aplicación, interfaz, utilidad o módulo relacionado con Asterisk, lo primero que hacemos es ir a Google y buscar. De entre toda la información que nos aparece (cientos de miles de páginas) es fácil perderse entre tanta página, tanta empresa y tanta publicidad y al final, o no encontramos lo que buscamos, o le tenemos que dedicar mucho tiempo.

    Pues bien, Digium acaba de lanzar una nueva página dedicada a alojar aquellos proyectos libres para que los usuarios puedan acceder diréctamente a esta página y ver ellos mismos la oferta disponibles.

    No hay sitio en esta web para proyectos comerciales, para eso ya existe AsteriskExchange.org (otro proyecto del que hablamos hace poco) que se dedica a dar cobertura a este tipo de proyectos.

    La idea es principalmente una especie de SourceForge pero únicamente relativa a proyectos para Asterisk por lo que la web es: http://forge.asterisk.org

    A cada proyecto alojado en esta web, se le ofrecerá:

    • Repositorio Subversion (SVN)
    • Foro de discusión
    • Almacenamiento de Documentación
    • Informes y estadísticas sobre descargas, actualizaciones, etc.
    • y más cosas…

    Enlace: http://forge.asterisk.org

  • Resumen del día de la Comunidad del VoIP2DAY

    Ayer por la tarde terminó la segunda edición del VoIP2DAY con un completo éxito, si bien es cierto que la crisis hizo que el SIMO no tuviera tanto éxito como años anteriores, el día de ayer confirmó que la VoIP sigue en alza y es que en determinados momentos el salón estaba completamente lleno.

    Me alegró poder ver a la gente que conozco y que nos vemos de año en año gracias a estos eventos. También me encantó haber conocido a muchas personas que no conocía o bien los conocía de oídas.

    Siempre es un placer conocer gente interesada y con la compartir conocimientos y el hecho de poder charlar y compartir experiencias es uno de los mayores alicientes que tiene este tipo de eventos.

    Mi charla iba sobre Comunicaciones Unificadas en Grandes Infraestructuras, y como ya comenté, aquí la pongo para el uso y disfrute de todos aquellos que lo deseen.
    Aunque no pude ver todas las conferencias, pude ir el último día y sí que estuve paseándome e intentando atender tanto como me fuese posible y he de decir que todas estuvieron sencillamente geniales:

    La charla de Alberto Sagredo, que era prácticamente un curso acelerado de Asterisk en 45 minutos con bastantes notas curiosas, las del trío SIPDOC (Saúl, Iñaki y Jon) que juntas eran una auténtica bomba digna de repasar tranquilamente y por separado seguían siendo una fuente vital de información, a la vez que muy divertida y bastante friki (ejem… 42 ;P), las Frikadas de la pareja MiniCong con Asterisk recorriendo el mundo con destino Mongolia, la de Nicolás Gudiño mostrándonos la increible evolución del famoso y conocido Flash Operator Panel y por supuesto la de Jesús Rodriguez que dejó nuevamente asombrado a todos los presentes con sus conocimientos sobre SIP y lo que puede dar de sí un procolo como este. Por último y no por ello menos importante, Kevin P. Flemming y Olle Johansson, como siempre, increibles y demostrando porqué son conocidos en todo el mundo.

    Aunque las conferencias se emitieron en directo vía streaming, también se grabaron a alta calidad para ser publicadas en breve en la web oficial del VoIP2DAY, así que, mientras se preparan las grabaciones, aquí teneis la documentación de mi charla.

  • Kamailio, premio «Best of Open Source Software»

    kamailio_infoworldAcabo de saber por Daniel Constantine Mierla, que la revista InfoWorld acaba de publicar las aplicaciones más importantes decada campo y Kamailio aparece como una de las 10 mejores aplicaciones de Software Libre destinada a networking más importantes según esta revista.

    Junto con Kamailio, otras aplicaciones conocidas también han sido premiadas en esta categoría: Cacti, IPCop, KeePass, Nagios, Openfiler, OpenNMS, Puppet y Untangle.

  • BoscliOSS: Potencia al máximo tu consola CLI de Asterisk

    boscliossMi colega Eduardo Ferro me ha mostrado un proyecto libre en el que está trabajando y del que solicita colaboración para mejorarlo. El proyecto se llama BoscliOSS y consiste en una aplicación para Asterisk que nos ayudará con el manejo de la consola de Asterisk (CLI) al poder programar ciertos comandos útiles y que no vienen con los comandos habituales de Asterisk.

    Para entender mejor esto, han puesto un vídeo donde se puede ver su potencial:
    http://oss.alea-soluciones.com/files/screencasts/demo-boscli-oss-asterisk.html

    «El caso es que para nuestros equipos hemos desarrollado unas librerías que nos permiten realizar shells de propósito especifico de una forma muy sencilla y muy rápida. Estás librerías que incluyen un sistema de carga de extensiones y permiten que en un mismo shell tengamos varias exteniones al mismo tiempo (por ejemplo una para trabajar con asterisk, otra para configurar red y otra de utilidades). En el siguiente enlace tienes un screencast de cómo usamos la extensión de asterisk para operar, por supuesto dentro de este shell también tenemos un comando que nos introduce en el shell/cli de asterisk, pero normalmente sólo en un 10% de los casos tenemos que recurrir a el, puesto que vamos metiendo en la extensión de asterisk todo lo que vamos necesitando.«

    En el siguiente enlaces tienes un listado (sin completar) de las funcionalidades soportadas:
    http://oss.alea-soluciones.com/trac/wiki/BoscliOss

    Por otra parte también sería muy interesante saber qué comandos/operaciones serían útiles para introducir y así completar bastante la extensión de asterisk antes de publicar una versión en freshmeat o similares.

    Es un proyecto muy interesante que seguro que será de gran utilidad a todos los administradores de sistemas Asterisk que trabajen continuamente con la consola de Asterisk o bien aquellos desarrolladores que necesiten obtener ciertos datos «específicos» y que el comando típico de la consola no pueda darlos.