Tolky OCR Service

O Tolky OCR é um serviço avançado de processamento de mídias que utiliza OCR (Reconhecimento Óptico de Caracteres) para extrair informações de imagens, vídeos, áudios e páginas web. O serviço é capaz de processar múltiplos tipos de mídia simultaneamente e extrair informações baseadas em um schema específico.

Funcionalidades

  • Processamento de múltiplos tipos de mídia (imagens, vídeos, áudios)
  • Extração de texto de imagens usando OCR
  • Processamento de URLs de páginas web
  • Suporte a schemas personalizados para extração de dados
  • Processamento paralelo de URLs e arquivos de mídia
  • Tratamento robusto de erros

Como Usar

Endpoint

POST /api/externalAPIs/public/tolkyOCR

Autenticação

O serviço requer autenticação através do middleware tolkyAuthMiddleware. As credenciais devem ser fornecidas no cabeçalho da requisição.

Parâmetros da Requisição

ParâmetroTipoDescriçãoObrigatório
schemaObjectSchema para extração de dadosNão
filesString/ArrayCaminhos ou URLs das mídiasSim
generalInstructionsStringInstruções gerais para processamentoNão

Exemplo de Schema

{
  "name": "extract_media_description",
  "description": "Extrai uma descrição detalhada do conteúdo das mídias",
  "parameters": {
    "type": "object",
    "properties": {
      "description": {
        "type": "string",
        "description": "Descrição detalhada do conteúdo das mídias"
      }
    },
    "required": ["description"]
  }
}

Exemplo de Uso com cURL

curl -X POST 'http://seu-servidor/api/externalAPIs/public/tolkyOCR' \
-H 'Content-Type: application/json' \
-H 'Authorization: Bearer seu-token' \
-d '{
  "schema": {
    "name": "extract_media_description",
    "description": "Extrai uma descrição detalhada do conteúdo das mídias",
    "parameters": {
      "type": "object",
      "properties": {
        "description": {
          "type": "string",
          "description": "Descrição detalhada do conteúdo das mídias"
        }
      },
      "required": ["description"]
    }
  },
  "files": [
    "https://exemplo.com/imagem.jpg",
    "https://exemplo.com/documento.pdf"
  ],
  "generalInstructions": "Extraia todo o texto visível e identifique entidades-chave"
}'

Resposta

A resposta será um objeto JSON contendo os dados extraídos com base no schema fornecido:

{
  "data": {
    "description": "Descrição extraída do conteúdo das mídias..."
  },
  "error": null,
  "time": 1250
}

Tratamento de Erros

O serviço retorna códigos de status HTTP apropriados:

  • 200: Processamento bem-sucedido
  • 400: Requisição inválida
  • 401: Não autorizado
  • 500: Erro interno do servidor

Observações

  • O serviço processa URLs e arquivos de mídia em paralelo para melhor performance
  • Se nenhum schema for fornecido, um schema padrão será utilizado
  • O serviço suporta tanto URLs de arquivos quanto URLs de páginas web
  • As descrições são extraídas em português por padrão