CosIng · API · Criterios de selección

Cómo elegir una fuente de datos CosIng: los siete criterios que separan un servicio profesional de un descargador glorificado

7 min
  • El portal oficial CosIng te da un .xls que descargas manualmente y diferencias contra tu versión anterior. A escala, eso no funciona.
  • Evaluar una fuente de datos CosIng — o una API CosIng — requiere siete criterios concretos, no solo el precio.
  • Si tu proveedor actual no puede responder tres de estas cuatro preguntas con evidencia verificable, tienes un problema.

1. Por qué la fuente importa

La base de datos CosIng de la Comisión Europea es pública, gratuita y oficial. También viene en un archivo .xls que tienes que descargar manualmente, comparar contra tu versión anterior línea a línea, y transformar antes de que tu sistema pueda consumirla. Si tu portfolio tiene diez ingredientes activos, eso es una tarde de trabajo cada vez que hay una actualización. Si tienes cincuenta, es un proceso que alguien tiene que coordinar, documentar y revisar. Si tienes cien o más, es un flujo que necesita ingeniería.

La realidad operativa es esta: CosIng no te da los cambios, te da el estado completo. La diferencia entre un descargador de datos y una fuente profesional es exactamente esa — uno te entrega el dump cada vez, el otro te entrega solo lo que cambió, firmado, con trazabilidad desde la publicación oficial hasta tu base de datos. Esa distinción no es técnica ni de marketing. Es la diferencia entre escalar bien y no escalar.

Antes de comprometerte con cualquier fuente de datos, proveedor de API CosIng o servicio de base de datos cosing, estos son los siete criterios que debes evaluar objetivamente.


2. Los siete criterios que debes evaluar

2.1. Frescura del dataset: ¿cada cuánto se actualiza realmente?

La Comisión Europea publica actualizaciones de CosIng de forma periódica, pero no en ciclos fijos que sea sencillo seguir. Un servicio profesional debería reflejar esas actualizaciones en un plazo razonable tras la publicación oficial — no semanas después.

La pregunta relevante no es «¿cuánto dices que tardas?», sino «¿cuándo fue la última actualización real en tu sistema y qué cambió?». Si no pueden responderte eso con una fecha y un changelog verificable, la cadencia declarada es marketing.

Otro dato útil: ¿el proveedor publica un historial de actualizaciones? ¿Hay un feed o endpoint que te permita ver cuándo tocaron el dataset por última vez? Si no existe, estás operando a ciegas respecto a la frescura del dato.

2.2. Diffs incrementales vs. dumps completos

Este es el criterio que más impacto tiene en tu pipeline a largo plazo. Un servicio que solo te entrega la base completa cada vez implica que tú tienes que mantener la lógica de diff en tu lado: descargar todo, comparar contra tu snapshot anterior, identificar lo nuevo, validar los borrados. Eso es trabajo que no debería ser tuyo.

Un servicio bien diseñado te entrega exclusivamente lo que cambió desde la fecha que tú especifiques. La pregunta a hacer es directa: «¿qué endpoint me das para obtener cambios desde la fecha X?». Si la respuesta es un enlace a un Excel descargable, ya tienes tu respuesta.

Los diffs incrementales no son solo comodidad. Son la base para que el procesamiento sea determinista, auditible y eficiente independientemente del tamaño de tu portfolio.

2.3. Formato estructurado vs. PDF/XLS

El formato de entrega define cuánto trabajo queda del lado tuyo. Un archivo Excel requiere un parser, decisiones de tipado, gestión de encoding, y manejo de cambios de estructura cuando la Comisión añade o renombra columnas. Un PDF es directamente inviable para integración automática.

Un formato estructurado — JSON tipado con campos claros, sin ambigüedades — se conecta directamente a tu pipeline: base de datos, ETL, validación de esquema. Las preguntas que tienes que hacer son dos: «¿hay un esquema documentado?» y «¿existe una especificación OpenAPI o equivalente?» Si el esquema no está documentado, el contrato de integración cambia cada vez que el proveedor lo decide, sin aviso.

Punto adicional: ¿el proveedor versiona su API? Una API sin versiones es un riesgo de integración — cualquier cambio puede romper tu consumidor sin previo aviso.

2.4. Autoridad y trazabilidad de la fuente

Este criterio es el más fácil de ignorar y el más crítico en un contexto regulatorio. La pregunta es simple: ¿cómo sé que el dato que me das es el que publicó la Comisión?

Un servicio que hace scraping del portal oficial sin trazabilidad añade una capa de incertidumbre que, en compliance cosmético, no puedes permitirte. Si mañana hay una discrepancia entre lo que tu sistema dice y lo que dice el DOUE, necesitas poder rastrear el origen exacto del dato.

Lo que buscas en un proveedor serio: que pueda decirte la fuente exacta de cada registro (URL o referencia de publicación), la fecha en que el sistema capturó ese cambio, y cualquier transformación aplicada. Si no hay audit trail, no hay trazabilidad. Sin trazabilidad, en una inspección regulatoria dependes de la buena fe del proveedor.

2.5. Entrega activa (webhook) vs. pull pasivo

Si la integración requiere que tu sistema vaya a buscar los datos de forma periódica — polling — estás pagando doble: en coste operativo de infraestructura y en latencia. El polling también introduce ventanas de incertidumbre: ¿el dato que leí hace tres horas ya está desactualizado?

Un servicio con entrega activa invierte la ecuación: cuando hay un cambio, el proveedor te notifica a ti. La pregunta a hacer es: «¿el sistema me avisa cuando hay cambios, o tengo que ir a buscarlos?»

El webhook bien implementado tiene una consecuencia importante que nos lleva al siguiente criterio: la firma del payload.

2.6. Autenticación y firma del payload

Un webhook sin firma es un canal abierto. Cualquier cosa puede POSTear a tu endpoint y, si no tienes validación, tu sistema procesará datos de origen desconocido como si fueran datos regulatorios legítimos. En un contexto donde el dato alimenta decisiones de compliance, eso es un vector de riesgo concreto.

La pregunta que debes hacer es: «¿cómo verifico la integridad de lo que recibo?» La respuesta esperada incluye alguna forma de firma — HMAC-SHA256 es el estándar habitual — con una clave que tú controlas. Si ya has implementado webhooks firmados antes, el proceso es conocido. Si no, ya hemos escrito sobre ello en detalle: cómo verificar firmas HMAC en webhooks de BD-API.

Sin firma, no hay forma de confiar en la integridad del payload. Sin integridad, la entrega activa pierde gran parte de su valor.

2.7. Soporte regulatorio activo vs. solo entrega de datos

CosIng no es un dataset estático. El Reglamento 1223/2009 ha sido modificado decenas de veces desde su publicación. Cada reglamento modificativo de la Comisión puede añadir entradas, modificar restricciones, cambiar la estructura de los Anexos. Cuando eso ocurre, un proveedor que solo entrega datos tiene un problema: el esquema que documentó ya no refleja la realidad.

La pregunta a hacer: «¿qué hace el sistema cuando la Comisión añade un campo nuevo a CosIng?» La respuesta esperada incluye un proceso de actualización del esquema, comunicación proactiva al cliente, y un historial de cómo se han gestionado los cambios estructurales anteriores.

Añade a esto la capa de análisis: ¿el proveedor enriquece los datos con contexto regulatorio — qué Anexo afecta, qué cambió respecto a la versión anterior, cuál es el impacto para tu portfolio — o simplemente te entrega el registro crudo? La diferencia entre datos raw y datos interpretados es la diferencia entre información y decisión.


3. El test rápido de 10 minutos

Antes de comprometerte con ningún proveedor de API CosIng o base de datos cosing, hazle estas preguntas concretas y exige respuestas verificables — no de marketing:

  1. «¿Cuándo fue la última actualización de vuestro dataset y qué cambió?» — Espera una fecha y un changelog o listado de cambios. Si la respuesta es vaga, la cadencia real es desconocida.

  2. «¿Cómo obtengo solo los cambios desde una fecha concreta?» — Espera un endpoint documentado con parámetro de fecha. Si la respuesta es descargar el dataset completo, el diff es tuyo.

  3. «¿Está documentado el esquema de respuesta? ¿Hay una spec OpenAPI o equivalente?» — Espera un enlace. Si no existe, el contrato de integración es informal.

  4. «¿Cómo firma el sistema los webhooks y cómo lo verifico?» — Espera un mecanismo concreto. Si no hay firma, no hay integridad.

Regla práctica: si un proveedor no puede contestar tres de estas cuatro preguntas con evidencia verificable, no estás evaluando un servicio profesional — estás evaluando un descargador glorificado con una capa de presentación encima. Sigue buscando.


4. Errores comunes al evaluar

Son cuatro, son frecuentes, y los tres primeros se cometen antes de hacer una sola prueba técnica.

Quedarse solo con el precio. El coste de integración, el coste de mantenimiento del diff propio, y el coste de un error de compliance que pasa porque el dataset tenía 48 horas de retraso no aparecen en la factura mensual. El precio inicial raramente refleja el coste total.

Elegir el primero que sale en Google. La visibilidad en búsqueda no correlaciona con calidad técnica ni con actualización regulatoria. Los proveedores más activos en SEO no siempre son los más rigurosos con la cadencia de actualización.

No probar la integración antes de firmar. Un servicio con buena documentación puede tener un comportamiento real diferente. Pide un acceso de prueba, conecta tu pipeline, verifica que los diffs funcionan como prometen y que la firma del webhook se valida correctamente. Si no ofrecen prueba, hay algo que no quieren que descubras antes de contratar.

No revisar la cadencia real de actualizaciones del último año. Un proveedor puede haber tenido una cadencia impecable en Q1 y haberse ralentizado en Q2 por razones que no te van a contar. Pide el historial de actualizaciones de los últimos doce meses. Si no existe o no te lo comparten, asume el peor caso.


5. El test final: ¿escala con tu negocio?

La prueba de escala es el criterio que menos se evalúa en la fase de compra y el que más duele en producción.

Una integración que funciona bien con cincuenta ingredientes activos puede comportarse muy diferente con quinientos si el servicio no entrega diffs incrementales. El motivo es aritmético: con dumps completos, el volumen de procesamiento crece linealmente con el tamaño del dataset. Con diffs incrementales, el procesamiento depende del volumen de cambios — que suele ser una fracción pequeña del total, independientemente del tamaño del portfolio.

La pregunta concreta: «¿cómo se comporta el endpoint de cambios si mi portfolio tiene 5.000 ingredientes activos?» La respuesta te dice si el sistema fue diseñado pensando en escala o en el caso de uso más simple.

Añade a esto la latencia: ¿los tiempos de respuesta se mantienen constantes bajo carga, o el proveedor tiene límites de rate que no aparecen documentados hasta que los golpeas? En un proceso de compliance que corre en background cada noche, una latencia que dobla con la carga puede convertirse en un timeout que falla silenciosamente.

Una integración que va bien a 50 productos puede colapsar a 500. Y a 5.000, directamente deja de ser viable si el diseño no contempló ese escenario desde el principio.


6. En resumen

Evaluar una fuente de datos CosIng — ya sea una API, un servicio gestionado o cualquier alternativa a la base de datos cosing oficial — no es solo una decisión técnica. Es una decisión de compliance, de arquitectura y de escala simultáneamente.

Los siete criterios que hemos visto no son exhaustivos, pero cubren los vectores de riesgo más habituales. Úsalos como checklist antes de comprometerte con cualquier proveedor:

  1. Frescura del dataset con evidencia verificable
  2. Diffs incrementales con endpoint documentado
  3. Formato estructurado con esquema publicado
  4. Trazabilidad desde la fuente oficial
  5. Entrega activa con webhook
  6. Firma del payload verificable
  7. Soporte regulatorio activo ante cambios estructurales

Si ya tienes una fuente, puntúala contra los siete criterios. Si la mayoría son verdes, mantenla. Si no, la conversación vale la pena antes de que el problema llegue en forma de error de compliance en producción.

Ver planes de BD-API →

Tarifas transparentes desde el plan Standard hasta Premium con vigilancia regulatoria multi-fuente. Si después quieres comparar con tu proveedor actual, escríbenos al formulario de contacto.

Solicitar acceso