DifBrain

Software de Text Mining capaz de organizar e analisar grandes coleções de documentos de texto de forma qualitativa e quantitativa, extrair informação importante dos mesmos e facilitar sua visualização.
Suas principais ferramentas são:

  • Geração de dados estatísticos a partir de uma base documental, identificando termos e conceitos presentes nos textos que possam ser de interesse para o usuário, bem como sua frequência relativa.
  • Agrupamento de documentos em clusters, identificando características comuns e estabelecendo co-relações entre eles - promove o agrupamento de documentos afins, permitindo a visualização de relações recíprocas entre os documentos e sua análise numa perspectiva sinóptica, o que não seria facilmente perceptível numa postura de análise "ad hoc" dos documentos. A análise de clusters é uma função poderosa que permite ao usuário extrapolar seus horizontes de análise, identificando possibilidades e perspectivas não imaginadas anteriormente. Evidencia a presença de conceitos, tendências, comportamentos e relações entre diferentes fatos e realidades que sejam relevantes em seu contexto de trabalho.
  • Identificação automatizada da estrutura de documentos e criação de um modelo relacional a partir dos dados estruturados.
  • Gestão de dicionários temáticos e classificação automática de documentos em categorias com base em seu conteúdo.
  • Sumarização automática de documentos para facilitar a leitura e reduzir o tempo de análise de cada documento. O processo de geração de resumos é sensível ao contexto e customizável.
  • Busca pró-ativa - descobre novidades e aspectos relevantes em textos, agilizando a percepção de tendências e o comportamento de um fenômeno ao longo do tempo, apresentando ao usuário informações tempestivas e significativas.
  • Busca reativa - recupera informações, sendo promovida diretamente pelo usuário, a partir de critérios de busca. Tem como benefício a recuperação dos documentos de forma organizada, agrupados e classificados de acordo com critérios informados pelos usuários.
  • Pré-processamento dos textos - prepara documentos para serem processados por outras funções. Automatiza o processo de adequação dos documentos, liberando o usuário para tarefas mais especializadas.
  • Armazenamento - mantém em banco de dados cópias íntegras dos textos analisados, com o acréscimo de informações que facilitam a recuperação dos documentos.