A Milestone Systems lançou hoje um avançado modelo de linguagem de visão (VLM) especializado na compreensão de tráfego, com a tecnologia NVIDIA Cosmos Reason. O VLM potencializa dois novos produtos: uma ferramenta de Sumarização de Vídeo para o software de gerenciamento de vídeo XProtect e um VLM como Serviço para integrações de terceiros.
Sumarização de Vídeo para XProtect permite que usuários pesquisem resumos de dados visuais e automatizem relatórios
Os sistemas de vídeo atuais capturam grandes volumes de dados, e a revisão de filmagens continua sendo um processo demorado e amplamente manual. Com a nova ferramenta de Sumarização de Vídeo da Milestone Systems – um plug-in baseado em IA generativa para o XProtect Smart Client – usuários e operadores agora podem contar com um produto especializado que automatiza os fluxos de trabalho do operador, economiza tempo valioso e reduz significativamente a fadiga de alarmes falsos. Relatórios iniciais mostram que a sumarização de vídeo pode reduzir a fadiga de alarmes falsos do operador em até 30%.
A ferramenta de Sumarização de Vídeo analisa as filmagens da câmera e descreve o que está acontecendo. Os usuários simplesmente enviam um trecho de vídeo e um comando descrevendo sua solicitação, e o modelo gerará um resumo em texto em segundos.
Principais recursos incluem:
• Converter segmentos de vídeo em resumos de texto estruturados dentro do XProtect Smart Client
• Pesquisar resumos com base no conteúdo do vídeo, em vez de carimbos de data/hora ou marcação manual
• Marcar e filtrar resumos para otimizar os fluxos de trabalho de revisão
• Integrar-se perfeitamente com a lógica de eventos e regras existente do XProtect para acionar resumos automatizados com base em alarmes ou alertas específicos
• Focar a atenção em eventos válidos, filtrando movimentos ou ruídos irrelevantes
• Acessar VLMs soberanos e personalizados por região, começando com os EUA e a UE. Mais regiões serão adicionadas futuramente.
A Sumarização de Vídeo é gratuita para download e leva apenas alguns minutos para ser instalada diretamente no XProtect Smart Client. E os usuários pagam apenas ao utilizar o VLM.
VLM como Serviço para desenvolvedores: adicione inteligência de vídeo pronta para produção a qualquer aplicação
Com o Hafnia VLM como Serviço (VLMaaS) da Milestone, desenvolvedores, integradores e parceiros obtêm acesso via API a uma inteligência de vídeo pronta para produção, construída com a mais recente tecnologia da NVIDIA e ajustada com dados obtidos de forma responsável.
O VLMaaS ajuda os desenvolvedores a criar soluções baseadas em IA rapidamente, sem a necessidade de configurar, ajustar ou gerenciar seus próprios sistemas de IA – ele aprimora qualquer solução existente com IA generativa, independentemente do nível de análise atualmente em vigor. Isso torna rápido e simples adicionar recursos avançados de inteligência de vídeo a aplicações, seja para testar um produto mínimo viável (MVP) ou para escalar uma plataforma.
Com o VLMaaS, o desenvolvimento de IA e análise pode ser acelerado significativamente – até 70 vezes menos esforço do que o trabalho necessário para ajustar um modelo VLM para fazer o mesmo.
Principais recursos incluem:
• Acesso um modelo de linguagem de visão de alta precisão, ajustado com dados otimizados para tráfego e desenvolvido no NVIDIA Cosmos Reason
• Seguir instruções baseadas em comandos para operações relacionadas ao tráfego
• Entrega API-first – integração simples via HTTPS
• Modelos ajustados para os mercados dos EUA e da UE, com mais regiões a serem adicionadas
• Projetado para construir soluções autônomas ou integrar-se ao portfólio de produtos da Milestone
• Dados de treinamento 100% obtidos de forma responsável, com linhagem de dados auditável, em conformidade com o GDPR e a Lei de IA da UE, usados para o ajuste fino do modelo
O preço do VLMaaS é pago conforme o uso (com base nas chamadas de API), sem grandes investimentos iniciais ou custos de treinamento personalizado.
Inscreva-se para obter acesso antecipado em https://hafnia.milestonesys.com.
Andrew Burnett, Diretor de Tecnologia Interino da Milestone Systems, disse:
“Com o Modelo de Linguagem de Visão como Serviço e a Sumarização de Vídeo para XProtect, estamos enfrentando alguns dos gargalos mais desafiadores: sobrecarga de vídeo e trabalho manual demorado. Os operadores obtêm insights imediatos diretamente no XProtect; os desenvolvedores obtêm acesso API-first a uma inteligência pronta para produção, sem treinamento personalizado ou infraestrutura pesada. Como este modelo é especializado para vídeos de tráfego do mundo real e ajustado com dados obtidos de forma responsável, os clientes podem confiar nos resultados, implantar com confiança e aprimorar todas as soluções existentes. É o caminho mais rápido, avançado e impactante para transformar vídeo em resultados acionáveis.”
Clientes do XProtect, como as cidades de Gênova, na Itália, e Dubuque, em Iowa, nos EUA, estão entusiasmados para usar esses novos recursos, liderando o caminho na adoção de soluções avançadas de inteligência de vídeo para aprimorar o gerenciamento de tráfego.
Desenvolvido com base em IA responsável, impulsionado por dados do mundo real
As duas novas ofertas são impulsionadas pelo Hafnia VLM da Milestone, que foi ajustado em 75.000 horas de dados de vídeo do mundo real, obtidos de forma responsável da Europa ou dos EUA, usando o NVIDIA Cosmos Curator para preparação de dados e executado em infraestrutura de nuvem ou data centers regionais. O aproveitamento do NVIDIA Cosmos Reason VLM e dos dados da Milestone para o ajuste fino o torna uma das plataformas de IA de vídeo mais avançadas do setor.

