Sistema de conferência de transcrição de voz D7601-AI

I. Descrição da solução
Com a crescente demanda por atender registros e necessidades de segurança dos clientes, é necessário registrar, transmitir e garantir a segurança dos conteúdos das reuniões em cenas importantes de reuniões, como treinamento de reuniões, entrevistas e discursos, enfrentando principalmente os seguintes grandes problemas:
Dificuldade em publicar registros de reuniões
1. Publicação intempestiva: altos requisitos para a pontualidade dos registros da reunião; as conclusões da reunião não podem ser comunicadas a tempo.
2. registros incompletos: carga de trabalho pesada, fácil de fadiga, fácil de cometer erros, leva mais de 4 horas para organizar 1 hora de gravação;
3. vazamento de dados sensíveis: os documentos dos registros da reunião não podem ser armazenados, modificados e gerenciados de maneira unificada.
Baixa eficiência de recepção de informações
1. Nenhuma exibição de legenda em tempo real: os ouvintes são facilmente afetados pelo sotaque e som e não podem obter informações precisas por um curto período de tempo, portanto, legendas em tempo real são necessárias para ajudar.
2. Nenhuma retrospectiva de comparação de texto de voz: uma reunião em grande escala leva muito tempo, e o público obtém informações dispersas, por isso é necessário comparar a voz e o texto retrospectivamente após a reunião;
Como um dos principais canais para as pessoas trocarem informações, a voz carrega uma grande quantidade de conteúdo de dados significativo. Com a pesquisa e desenvolvimento de tecnologia de voz inteligente, as máquinas podem substituir os seres humanos por trabalhos relacionados, resolvendo os problemas de registros de reuniões de alto nível em cenários de reuniões importantes e incapacidade de eficiência de registro de mão de obra.

O sistema de conferência de transcrição de voz AI desenvolvido pela DSPPA é um produto de sistema inteligente offline puro especialmente projetado para resolver os problemas de dificuldade na gravação de registros de conferências importantes, baixa eficiência e sem rastreabilidade. Suas funções centrais incluem os seguintes aspectos.
● Libere muito recursos humanos e reduza o custo da empresa e da organização.
● O conteúdo da conferência pode ser editado e revisado de forma portátil, e a velocidade de elaboração é rápida.
● A gravação de áudio da reunião tem comparação de texto, o que é conveniente para revisão.
● Exibição em tempo real de legendas de conferência para construir transmissão de informações multidirecional.
● Os dados da reunião são fáceis de gerenciar e as atas da reunião podem ser rastreadas por comparação de áudio e texto.
● A implantação offline garante a segurança dos dados e os dados são isolados da Internet.

II. Funções de destaque da solução

III. Diagrama de conexão do sistema

A sala de reuniões é de planta XX quadrada, com X metros de comprimento e X metros de largura, utilizada principalmente para diversas formas de reuniões, intercâmbios acadêmicos e técnicos, capacitação interna. A fim de melhorar a eficiência do trabalho e garantir controle unificado e recall preciso do conteúdo da reunião, um conjunto de sistema de transcrição de fala com equipamento avançado e tecnologia perfeita é estabelecido, Que pode ser unificado e usado em cooperação com o sistema de som de conferência da sala de reuniões para realizar aquisição de áudio ou gravação em tempo real em diferentes cenas e conversão em texto em tempo real através da tecnologia de reconhecimento de voz. Para cenários de reunião que precisam exibir o conteúdo da fala, o sistema fornece exibição em tempo real do conteúdo da fala na tela por meio da tecnologia de software. (Pode ser editado de acordo com a situação real do projeto.)

IV. Funções do sistema
● Alta precisão: Baseando-se na tecnologia de voz central, a taxa de precisão do mandarim padrão é de até 98% +.
● Reunião eficiente: toda a gravação é automaticamente transcrita por máquina e o áudio de 1 hora é liberado em 10 minutos no tempo mais rápido.
● Segurança da conferência: O uso de um servidor profissional independente sem rede pode efetivamente evitar o vazamento de conteúdo e informações da conferência.
● Identificação personalizada: Apoie nomes coloquiais personalizados de pessoas e lugares, conduza o treinamento de sotaques especiais e personalize os idiomas locais.
● Separação de papéis: no processo de reunião, o iniciador, participante, presidente, anfitrião, secretário, etc. da reunião podem ser separados dos papéis uns dos outros e automaticamente reconhecidos como texto em tempo real, o que pode aumentar a eficiência da reunião duplamente. Reduzirá muito a intensidade do trabalho e a pressão do gravador de reuniões.
● DiVisão do parágrafo e frases: Ao extrair características semânticas relacionadas ao contexto e combinar características da fala, como pausas, informações de frequência fundamental, a divisão de cláusulas e parágrafos é realizada; uso abrangente de recursos semânticos relacionados ao contexto e recursos fonéticos para resolver problemas de frase e segmentação.
● Texto suave: usando recursos generalizados e combinando características semânticas relacionadas ao contexto e características fonológicas, o sistema elimina palavras de parada, palavras de tom e palavras repetitivas dos resultados da transcrição, tornando o texto suavizado mais fácil de ler.
● Recuperação Inteligente: Associação automática de gravação e texto, reprodução de palavra e comparação de som. Apoie a pesquisa de texto completo e rastreie facilmente os dados históricos.
● Gerenciamento de informações da conferência: Apoie a criação de reuniões locais, gerenciamento de reuniões, exportação de registros de reuniões, construção de base de conhecimento.
● Aplicável a uma variedade de cenários: aplicável a reuniões de escritório, relatórios de trabalho, palestras acadêmicas, treinamento, entrevistas e outros cenários.

V. Principais Dispositivos Introdução
Interface de software de servidor de transcrição de voz D7601ES
O sistema inteligente de transcrição de voz fornece reconhecimento de voz em tempo real e recursos de reconhecimento de arquivo de gravação para atender a uma série de necessidades de transcrição de texto em tempo real, como reuniões diárias, relatórios e discursos, comandos e despacho e arranjos de gravação, que realizam áudio em tempo real ou coleta de gravação em cenários de conferência, E conversão em tempo real em texto através da tecnologia de reconhecimento de voz.

Software Terminal de Transcrição de Voz D7601CS
O sistema tem funções básicas, como gerenciamento de áudio de conferência, revisão e edição em tempo real e transcrição de texto em tempo real. Além disso, fornece marcas-chave, otimização de palavras-chave e outras funções para facilitar e organizar rapidamente os materiais da conferência; fornece segmentação automática, pausar palavras, palavras de tom, repetir a exclusão de palavras e outras funções para otimizar automaticamente os resultados do texto; e fornece a função de pesquisa de texto completo para fácil recuperação de áudio histórico.

Software de transcrição de voz para tela grande
De acordo com as necessidades de diferentes conferências, o sistema não pode apenas editar o primeiro rascunho dos resultados da transcrição em tempo real, mas também exibir os resultados de transcrição de voz em tempo real através da tela da placa de exibição, e a cor da fonte e a cor de fundo da placa de exibição podem ser ajustadas de acordo com a situação real.

Servidor de transcrição de voz D7601DS AI

Como o equipamento principal do sistema de transcrição de voz de conferência inteligente, o servidor de transcrição de voz AI fornece principalmente processamento de serviço de gravação, transferência de dados e outros recursos; o laptop de controle principal é usado principalmente para implantar o software do cliente, controlar o início e o fim da conferência e fornecer várias operações de função.
O servidor de transcrição de voz capta diretamente o áudio do host da conferência através do codificador de áudio, completa a coleção de discurso em tempo real na conferência, transcreve automaticamente a voz para separação de papéis, e envia o resultado da transcrição para o software cliente em tempo real. Com interação manual simples, o conteúdo transcrito pela máquina pode ser editado, modificado e tipificado. Após a reunião, um registro de informações da reunião que é fiel ao texto original é formado, e as atas-chave da reunião também podem ser extraídas de acordo com o registro da reunião.
Para cenas de conferências em grande escala, além da reunião regular, ela também pode ser exibida na tela em tempo real, que pode ser exibida no local.

VI. Aplicações