Sobre a Singulare
A Singulare é uma das mais experientes corretoras de valores do Brasil, com mais de 50 anos, focada no mercado de FIDC’s, Fundo de investimento em direitos creditórios, sendo líder em Administração e Custódia por número de operações desde 2011, com uma capitalização de cerca de $4,68M.
O Desafio
A Singulare utiliza diversas fontes distintas de CCB’s (Cédulas de crédito Bancário), um título de crédito emitido por pessoa física ou jurídica em favor de uma instituição financeira ou de entidade que se assemelhe. Esse título representa a promessa de pagamento em dinheiro decorrente de uma operação de crédito. A movimentação de caixa de CCB’s necessita de validação ativa por parte da equipe, que de forma manual explorava cada uma dessas ligações, por vezes com qualidade de som inferior, em uma grande volumetria diária, tendo que ouvir e transcrever os dados de forma manual para confirmarem a viabilidade de movimentação. Neste cenário, a Darede foi o parceiro escolhido para um trabalho de automação dos processos de validação positiva pela AWS.
A Solução
A Darede começou a atuar criando a infraestrutura como código via Terraform, pois possibilita a automação e a redução da complexidade do gerenciamento da arquitetura como um todo, e continuou com o desenvolvimento do backend utilizando o framework Serverless, centralizando toda a estrutura lógica dos desenvolvimentos de forma mais eficiente, e assim, foi reproduzida a lógica utilizada pela Singulare em suas automações de análise de documentos, replicando-as para receber informações transcritas de áudios de chamadas telefônicas das movimentações de CCB’s dentro do bucket S3 da Amazon.
Todo essa construção foi elaborada para comportar a integração CI/CD (Continuous Integration/Continuous Delivery), suportando atualizações sem impactar o desempenho em produção e SQS (Simple queue service), permitindo que a solução o receba mensagens para ativar os gatilhos que executam as funções Lambda permitindo a automação de todas as etapas.
As etapas se iniciam quando é realizado o upload de um arquivo de áudio na plataforma Singulare. Dessa forma uma mensagem é enviada para o SQS acionando uma função Lambda, que identifica o caminho do áudio e inicia-se sua transcrição com a API-Transcribe. Quando esta transcrição é salva no Bucket S3 da aplicação, outra mensagem é enviada para o SQS com o caminho do texto e, assim, aperfeiçoamos o resultado do texto bruto obtido com a API Spellcheck.
Para melhorar ainda mais a satisfação do cliente e o sucesso do trabalho, passamos a incorporar uma análise do texto corrigido, utilizando a OpenAI do ChatGPT 3 obtendo numa massa de 1000 áudios uma assertividade da transcrição numa média de 80%, mesmo levando em conta áudios com qualidade de gravação inferiores aos previsto em cenários de testes. Essa função é executada através de outra mensagem SQS na finalização do processo de aperfeiçoamento do texto.
Assim, conseguimos, criar uma automação de transcrição de áudios, trazendo um output apenas com os dados necessários para o confronto das CCB’s com a base dos clientes, que agora além de aproveitar sua automação em seu dia a dia, poderá vender essa solução para seus parceiros comerciais.
Porque escolheram a Darede & AWS
Os maiores desafios para esse projeto foram:
- Com uma massa de 1.000 áudios, sem um critério de qualidade padronizado, a equipe se dedicou para trazer nos resultados uma assertividade média de 80% e riqueza de informações nos outputs gerados.
- Por se tratarem de diversas fontes distintas de CCB’s a equipe trabalhou na elaboração de lógicas para identificar padrões nos arquivos para viabilizar a automação das etapas, assegurando os outputs para o confronto com os dados corretos da base do cliente.
As maiores vantagens para esse projeto foram:
- Com o modelo de Squad as a Service, a equipe Singulare pôde aproveitar de uma equipe 100% dedicada para a customização e desenvolvimento do projeto e maior celeridade no alinhamento e ajustes durante o projeto.
- Antes do desenvolvimento da Darede, a exploração dos áudios e o confronto dos dados era realizado de forma manual, onde uma pessoa deveria ouvir a ligação inteira para resgatar, o que tornava o processo difícil e demorado.
- Custo Aproximado: $0,07
- Massa de 500: $36,12
- Assertividade entre 78% e 90%
- Custo Aproximado: $0,07
- Previsão de custo a cada 1000: $71,15