Skip to content

Интеграция справочных данных: марки, модели, OEM-номера

Дата: 2026-02-14 Статус: Исследование (brainstorm)

Контекст

Маркетплейс Partizap нуждается в актуальных справочных данных:

  1. Каталог автомобилей — марки, модели, поколения (сейчас захардкожены 30 марок в сидере)
  2. OEM-номера — для валидации ввода продавцов при создании объявлений
  3. Кросс-референсы OEM — «деталь X = деталь Y», чтобы покупатели находили все совместимые аналоги

Текущее состояние:

  • Схема БД полностью готова: car_makes, car_models, car_generations, oem_numbers, oem_cross_references, product_oem, product_compatibility
  • Сидер app:seed-reference-data наполняет 30+ марок, 70+ моделей, 180+ поколений из статичных массивов
  • OEM-номера создаются продавцами вручную при добавлении товаров
  • Кросс-референсы не заполнены — таблица oem_cross_references пуста
  • Поле source в oem_cross_references уже предусматривает значение tecdoc

Целевой рынок: Российский (европейские + японские + корейские + китайские марки). Китайские бренды (BYD, Chery, Haval, Geely, Changan, GAC, Li Auto, NIO) критически важны — быстро растут в России.

Бюджет: Минимальный. Предпочтение бесплатным или недорогим разовым источникам.


Подход A: Бесплатные источники + наращивание позже

Рекомендуется для MVP.

Каталог автомобилей

Расширить текущий сидер (30 марок) данными из бесплатных источников:

ИсточникЧто даётОграничения
vehicle-make-model-data (GitHub)19 722 модели, 2001–2015, SQL/CSV/JSONФокус на рынок США, мало китайских марок
automobile-models-and-specs (GitHub)Марки + модели + характеристики двигателей, обновлялось 10/2024Нет поколений (generations)
NHTSA vPIC APIБесплатный API без ключа, данные по годам/маркам/моделямТолько автомобили для рынка США
Ручная курацияДобавить ~20 китайских брендов с моделями и поколениями вручнуюТрудозатраты 4–8 часов

Итого: ~200+ марок с моделями, достаточно для российского рынка.

OEM-номера

Только валидация формата (regex: буквенно-цифровой, нормализация дефисов/пробелов). Продавцы вводят OEM-номера при создании объявлений — мы сохраняем их в oem_numbers (нормализованный + отображаемый формат). Предзаполненной базы OEM нет.

Кросс-референсы

Отсутствуют на старте. Продавцы могут указывать несколько OEM-номеров на товар (уже поддержано через M:N таблицу product_oem). База кросс-референсов растёт органически по мере добавления товаров.

Cron / Регулярные обновления

Не требуются. Однократный импорт через CLI-команду.

Оценка

МетрикаЗначение
Стоимость0 ₽
Покрытие марок~200 марок, хорошее для РФ, частичное по Китаю
Покрытие OEMТолько пользовательские данные
Кросс-референсыНет
Срок реализации1–2 дня

Плюсы

  • Нулевые затраты
  • Быстрый запуск — достаточно для MVP
  • Схема БД уже готова для апгрейда на платные данные

Минусы

  • Неполное покрытие китайских марок — ручная работа
  • Поиск по аналогам OEM невозможен
  • Покупатели не найдут товар по альтернативному OEM-номеру

Подход B: Бесплатные авто + разовая покупка OEM-базы

Лучшее соотношение цена/качество.

Каталог автомобилей

Комбинация бесплатных GitHub-датасетов (как в подходе A) + покупка каталога:

ИсточникЧто даётСтоимость
autodatabases.com — Car Catalogue119 712 автомобилей с идентификаторами TecDoc331 EUR разово
Бесплатные GitHub-репозиторииДополнительные данные для валидации0

Каталог autodatabases.com ориентирован на рынок СНГ — покрывает российский парк автомобилей, включая китайские марки.

OEM-номера и кросс-референсы

ИсточникЧто даётСтоимость
autodatabases.com — Spare Parts Cross-References337 млн строк кросс-референсов (бренд1 + номер1 ↔ бренд2 + номер2)1 658 EUR разово
autodatabases.com — OEM2CARПривязка оригинальных запчастей к автомобилям (applicability)600 EUR разово (опционально)

Все данные поставляются в формате SQL-дампов — можно импортировать напрямую в PostgreSQL.

Cron / Регулярные обновления

  • Первичный импорт: CLI-команда для загрузки SQL-дампов в таблицы Partizap
  • Квартальные обновления: Покупка обновлённых дампов (829 EUR за обновление кроссов — опционально, по мере необходимости)
  • Cron-задача: Не нужна при разовой покупке. При подписке на обновления — скрипт реимпорта по расписанию

Оценка

МетрикаЗначение
Стоимость~2 000 EUR разово (каталог + кроссы), ~2 600 EUR с OEM2CAR
Покрытие марок119 000+ автомобилей, СНГ-рынок
Покрытие OEMМиллионы номеров
Кросс-референсы337 млн строк — поиск по аналогам работает с первого дня
Срок реализации3–5 дней

Плюсы

  • Разовая оплата без подписки
  • Данные ориентированы на СНГ-рынок
  • 337 млн кросс-референсов — покупатель ищет один OEM, находит все аналоги
  • SQL-формат — простой импорт
  • TecDoc-идентификаторы в каталоге — путь для будущего апгрейда

Минусы

  • Разовая стоимость ~2 000 EUR
  • Данные устаревают без покупки обновлений
  • Качество данных autodatabases.com не верифицировано — нужен тестовый образец
  • Импорт 337 млн строк требует оптимизации (батчинг, COPY, индексы)

Подход C: TecDoc API (премиум, подписка)

Максимальное качество, высокая стоимость.

Всё через TecDoc API

TecAlliance TecDoc — индустриальный стандарт для каталогов автозапчастей. Единый API для всех данных:

  • Марки → модели → поколения → модификации
  • OEM-номера с привязкой к автомобилям
  • Кросс-референсы (оригинал ↔ аналог)
  • Категории запчастей (Generic Articles)

Cron / Регулярные обновления

  • Ночная синхронизация: Cron-задача для обновления справочных таблиц (car_makes, car_models, car_generations)
  • On-demand запросы: Валидация OEM-номеров и поиск кроссов через API в реальном времени
  • Кэширование: Redis (DB 1) для часто запрашиваемых OEM-кроссов (TTL 24h)

Архитектура интеграции

Cron (ночь) → Symfony Messenger → TecDocSyncJob
  → GET /makes → upsert car_makes
  → GET /models?makeId=X → upsert car_models
  → GET /generations?modelId=Y → upsert car_generations

API (реалтайм) → TecDocClient
  → GET /articles?oem=Z → валидация OEM
  → GET /cross-references?articleId=N → кроссы

Оценка

МетрикаЗначение
Стоимость500–2 000 EUR/месяц
Покрытие марокГлобальное, максимально полное
Покрытие OEMИндустриальный стандарт
Кросс-референсыВ реальном времени, всегда актуальные
Срок реализации1–2 недели + процесс одобрения заявки TecAlliance

Плюсы

  • Лучшие данные в индустрии
  • Всегда актуальные — API, не дампы
  • Глобальное покрытие, включая китайские марки
  • Стандарт для профессиональных площадок (Exist, Autodoc, Emex)

Минусы

  • 500–2 000 EUR/месяц — дорого для стартапа
  • Процесс подключения: заявка → одобрение → интеграция (2–4 недели)
  • Зависимость от внешнего API (downtime, rate limits)
  • Избыточно для MVP

Сравнительная таблица

Подход A (бесплатный)Подход B (разовая покупка)Подход C (TecDoc API)
Стоимость0~2 000 EUR разово500–2 000 EUR/мес
Марки/модели~200 марок119 000+ автоГлобально
OEM-номераПользовательскиеМиллионыИндустриальный стандарт
Кросс-референсыНет337 млн строкРеалтайм
Китайские маркиРучная курацияЕсть в каталоге СНГПолное покрытие
АктуальностьСтатичнаяКвартальные обновления (платно)Всегда актуально
Срок реализации1–2 дня3–5 дней1–2 недели
CronНе нуженОпционально (реимпорт)Ночная синхронизация

Рекомендация

Начать с подхода A, затем перейти на B когда маркетплейс наберёт трекшн:

  1. Для MVP достаточно расширенного каталога марок + валидации формата OEM
  2. Схема БД уже готова для импорта любых внешних данных
  3. Путь апгрейда A → B — чистый: купить SQL-дамп, запустить команду импорта
  4. Подход C оправдан только при выручке, покрывающей подписку

Источники