Skip to content

Instantly share code, notes, and snippets.

@catdevnull
Created September 12, 2024 02:17
Show Gist options
  • Save catdevnull/5811b7459ec9e233aa4a4a24c94ecddc to your computer and use it in GitHub Desktop.
Save catdevnull/5811b7459ec9e233aa4a4a24c94ecddc to your computer and use it in GitHub Desktop.
chequeo automatizado via preciazo/sepa-dataset-validator de (2024-09-11) 1e92cd42-4f94-4071-a165-62c4cb2ce23c-revID-bf13841c-463a-400f-b77f-8c9791901ad3-sepa_miercoles.zip-repackaged.tar.zst
chequeando sepa_1_comercio-sepa-16_2024-09-11_09-05-10...
❌ [productos.csv] No pude encontrar la fecha de actualización
❌ [sucursales.csv] No pude encontrar la fecha de actualización
❌ [comercio.csv] No pude encontrar la fecha de actualización
-> CUIT 30612929455: Libertad S.A.
❌ Hubo errores parseando el CSV
chequeando sepa_1_comercio-sepa-47_2024-09-11_09-05-10...
-> CUIT 33529300099: Cooperativa Agricola, Ganadera e Industrial de Patagones y Viedma Ltda
❌ Hubo errores parseando el CSV
chequeando sepa_1_comercio-sepa-4_2024-09-11_09-05-10...
-> CUIT 30537679855: ESTACION LIMA S.A.
chequeando sepa_1_comercio-sepa-15_2024-09-11_09-05-10...
-> CUIT 30685849751: DIA Argentina S.A.
La provincia Buenos Aires no es válida
❌ [sucursales.csv] sucursales_provincia no cumple con ISO 3166-2 (true)
chequeando sepa_2_comercio-sepa-10_2024-09-11_01-05-11...
-> CUIT 30687310434: INC S.A.
chequeando sepa_1_comercio-sepa-3_2024-09-11_09-05-10...
-> CUIT 30516186670: DEHEZA S.A.I.C.F. e I.
chequeando sepa_1_comercio-sepa-13_2024-09-11_09-05-10...
-> CUIT 30525705931: Cooperativa Obrera Limitada de Consumo y Vivienda
chequeando sepa_1_comercio-sepa-12_2024-09-11_09-05-10...
❌ El archivo productos.csv contiene tabs
-> CUIT 30548083156: COTO CENTRO INTEGRAL DE COMERCIALIZACION S.A.
chequeando sepa_2_comercio-sepa-11_2024-09-11_01-05-11...
-> CUIT 30678138300: DORINKA SRL
Las sucursales 1098, 4001, 1019 no existen en sucursales.csv
❌ Sucursales mencionadas en productos.csv existen en sucursales.csv (true)
chequeando sepa_2_comercio-sepa-2013_2024-09-11_01-05-11...
-> CUIT 30716620634: First Label S.R.L.
chequeando sepa_1_comercio-sepa-9_2024-09-11_09-05-10...
-> CUIT 30590360763: Cencosud S.A.
Las sucursales 638 no existen en sucursales.csv
❌ Sucursales mencionadas en productos.csv existen en sucursales.csv (true)
chequeando sepa_1_comercio-sepa-19_2024-09-11_09-05-10...
-> CUIT 30678774495: OPERADORA DE ESTACIONES DE SERVICIOS SA
❌ Hubo errores parseando el CSV
chequeando sepa_1_comercio-sepa-2011_2024-09-11_09-05-10...
-> CUIT 30543659734: Electronica Megatone S.R.L
❌ Hubo errores parseando el CSV
❌ [productos.csv] Nombres de columnas incorrectas (true)
chequeando sepa_1_comercio-sepa-3001_2024-09-11_09-05-10...
-> CUIT 30590360763: CENCOSUD S.A.
chequeando sepa_2_comercio-sepa-36_2024-09-11_01-05-11...
-> CUIT 30710113285: SuperCLC s.a.
chequeando sepa_1_comercio-sepa-35_2024-09-11_09-05-10...
-> CUIT 30666785173: MUCOOP CAP.SARMIENTO
chequeando sepa_1_comercio-sepa-20_2024-09-11_09-05-10...
-> CUIT 33504047089: LA AGRICOLA REGIONAL COOPERATIVA LIMITADA
chequeando sepa_1_comercio-sepa-21_2024-09-11_09-05-10...
-> CUIT 30551497492: Supermercados Toledo S.A.
chequeando sepa_2_comercio-sepa-22_2024-09-11_01-05-11...
-> CUIT 30520739625: La Gallega Supermercados S.A.
chequeando sepa_1_comercio-sepa-2000_2024-09-11_09-05-10...
-> CUIT 33572266449: CARSA SA
Las sucursales 768, 769, 771, 767, 772, 773, 425, 455 no existen en sucursales.csv
❌ Sucursales mencionadas en productos.csv existen en sucursales.csv (true)
❌ Hay productos duplicados con el mismo EAN (true)
chequeando sepa_2_comercio-sepa-2_2024-09-11_01-05-11...
-> CUIT 30506730038: S.A. IMP. Y EXP. DE LA PATAGONIA
chequeando sepa_1_comercio-sepa-23_2024-09-11_09-05-10...
-> CUIT 30695542476: PAN AMERICAN ENERGY SL SUCURSAL ARGENTINA
chequeando sepa_1_comercio-sepa-2007_2024-09-11_09-05-10...
-> CUIT 30679928879: Sony Argentina S.A.
chequeando sepa_1_comercio-sepa-1000_2024-09-11_09-05-10...
-> CUIT 30537869158: FRIGORIFICO GORINA S.A.I.C.
chequeando sepa_2_comercio-sepa-5_2024-09-11_01-05-11...
-> CUIT 30539523410: California S.A.
chequeando sepa_2_comercio-sepa-6_2024-09-11_01-05-11...
-> CUIT 30578411174: Alberdi S.A.
❌ Hubo errores parseando el CSV
Error en columna _errors:
Error en columna productos_cantidad_presentacion: Expected number, received nan
Error en columna productos_precio_referencia: Expected number, received nan
❌ [productos.csv] Nombres de columnas incorrectas (true)
chequeando sepa_1_comercio-sepa-2005_2024-09-11_09-05-10...
-> CUIT 30697465983: Naldo Lombardi SA
¡Haga patria, arregle su dataset!
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment