Appearance
Интеграция справочных данных: марки, модели, OEM-номера
Дата: 2026-02-14 Статус: Исследование (brainstorm)
Контекст
Маркетплейс Partizap нуждается в актуальных справочных данных:
- Каталог автомобилей — марки, модели, поколения (сейчас захардкожены 30 марок в сидере)
- OEM-номера — для валидации ввода продавцов при создании объявлений
- Кросс-референсы OEM — «деталь X = деталь Y», чтобы покупатели находили все совместимые аналоги
Текущее состояние:
- Схема БД полностью готова:
car_makes,car_models,car_generations,oem_numbers,oem_cross_references,product_oem,product_compatibility - Сидер
app:seed-reference-dataнаполняет 30+ марок, 70+ моделей, 180+ поколений из статичных массивов - OEM-номера создаются продавцами вручную при добавлении товаров
- Кросс-референсы не заполнены — таблица
oem_cross_referencesпуста - Поле
sourceвoem_cross_referencesуже предусматривает значениеtecdoc
Целевой рынок: Российский (европейские + японские + корейские + китайские марки). Китайские бренды (BYD, Chery, Haval, Geely, Changan, GAC, Li Auto, NIO) критически важны — быстро растут в России.
Бюджет: Минимальный. Предпочтение бесплатным или недорогим разовым источникам.
Подход A: Бесплатные источники + наращивание позже
Рекомендуется для MVP.
Каталог автомобилей
Расширить текущий сидер (30 марок) данными из бесплатных источников:
| Источник | Что даёт | Ограничения |
|---|---|---|
| vehicle-make-model-data (GitHub) | 19 722 модели, 2001–2015, SQL/CSV/JSON | Фокус на рынок США, мало китайских марок |
| automobile-models-and-specs (GitHub) | Марки + модели + характеристики двигателей, обновлялось 10/2024 | Нет поколений (generations) |
| NHTSA vPIC API | Бесплатный API без ключа, данные по годам/маркам/моделям | Только автомобили для рынка США |
| Ручная курация | Добавить ~20 китайских брендов с моделями и поколениями вручную | Трудозатраты 4–8 часов |
Итого: ~200+ марок с моделями, достаточно для российского рынка.
OEM-номера
Только валидация формата (regex: буквенно-цифровой, нормализация дефисов/пробелов). Продавцы вводят OEM-номера при создании объявлений — мы сохраняем их в oem_numbers (нормализованный + отображаемый формат). Предзаполненной базы OEM нет.
Кросс-референсы
Отсутствуют на старте. Продавцы могут указывать несколько OEM-номеров на товар (уже поддержано через M:N таблицу product_oem). База кросс-референсов растёт органически по мере добавления товаров.
Cron / Регулярные обновления
Не требуются. Однократный импорт через CLI-команду.
Оценка
| Метрика | Значение |
|---|---|
| Стоимость | 0 ₽ |
| Покрытие марок | ~200 марок, хорошее для РФ, частичное по Китаю |
| Покрытие OEM | Только пользовательские данные |
| Кросс-референсы | Нет |
| Срок реализации | 1–2 дня |
Плюсы
- Нулевые затраты
- Быстрый запуск — достаточно для MVP
- Схема БД уже готова для апгрейда на платные данные
Минусы
- Неполное покрытие китайских марок — ручная работа
- Поиск по аналогам OEM невозможен
- Покупатели не найдут товар по альтернативному OEM-номеру
Подход B: Бесплатные авто + разовая покупка OEM-базы
Лучшее соотношение цена/качество.
Каталог автомобилей
Комбинация бесплатных GitHub-датасетов (как в подходе A) + покупка каталога:
| Источник | Что даёт | Стоимость |
|---|---|---|
| autodatabases.com — Car Catalogue | 119 712 автомобилей с идентификаторами TecDoc | 331 EUR разово |
| Бесплатные GitHub-репозитории | Дополнительные данные для валидации | 0 |
Каталог autodatabases.com ориентирован на рынок СНГ — покрывает российский парк автомобилей, включая китайские марки.
OEM-номера и кросс-референсы
| Источник | Что даёт | Стоимость |
|---|---|---|
| autodatabases.com — Spare Parts Cross-References | 337 млн строк кросс-референсов (бренд1 + номер1 ↔ бренд2 + номер2) | 1 658 EUR разово |
| autodatabases.com — OEM2CAR | Привязка оригинальных запчастей к автомобилям (applicability) | 600 EUR разово (опционально) |
Все данные поставляются в формате SQL-дампов — можно импортировать напрямую в PostgreSQL.
Cron / Регулярные обновления
- Первичный импорт: CLI-команда для загрузки SQL-дампов в таблицы Partizap
- Квартальные обновления: Покупка обновлённых дампов (829 EUR за обновление кроссов — опционально, по мере необходимости)
- Cron-задача: Не нужна при разовой покупке. При подписке на обновления — скрипт реимпорта по расписанию
Оценка
| Метрика | Значение |
|---|---|
| Стоимость | ~2 000 EUR разово (каталог + кроссы), ~2 600 EUR с OEM2CAR |
| Покрытие марок | 119 000+ автомобилей, СНГ-рынок |
| Покрытие OEM | Миллионы номеров |
| Кросс-референсы | 337 млн строк — поиск по аналогам работает с первого дня |
| Срок реализации | 3–5 дней |
Плюсы
- Разовая оплата без подписки
- Данные ориентированы на СНГ-рынок
- 337 млн кросс-референсов — покупатель ищет один OEM, находит все аналоги
- SQL-формат — простой импорт
- TecDoc-идентификаторы в каталоге — путь для будущего апгрейда
Минусы
- Разовая стоимость ~2 000 EUR
- Данные устаревают без покупки обновлений
- Качество данных autodatabases.com не верифицировано — нужен тестовый образец
- Импорт 337 млн строк требует оптимизации (батчинг, COPY, индексы)
Подход C: TecDoc API (премиум, подписка)
Максимальное качество, высокая стоимость.
Всё через TecDoc API
TecAlliance TecDoc — индустриальный стандарт для каталогов автозапчастей. Единый API для всех данных:
- Марки → модели → поколения → модификации
- OEM-номера с привязкой к автомобилям
- Кросс-референсы (оригинал ↔ аналог)
- Категории запчастей (Generic Articles)
Cron / Регулярные обновления
- Ночная синхронизация: Cron-задача для обновления справочных таблиц (
car_makes,car_models,car_generations) - On-demand запросы: Валидация OEM-номеров и поиск кроссов через API в реальном времени
- Кэширование: Redis (DB 1) для часто запрашиваемых OEM-кроссов (TTL 24h)
Архитектура интеграции
Cron (ночь) → Symfony Messenger → TecDocSyncJob
→ GET /makes → upsert car_makes
→ GET /models?makeId=X → upsert car_models
→ GET /generations?modelId=Y → upsert car_generations
API (реалтайм) → TecDocClient
→ GET /articles?oem=Z → валидация OEM
→ GET /cross-references?articleId=N → кроссыОценка
| Метрика | Значение |
|---|---|
| Стоимость | 500–2 000 EUR/месяц |
| Покрытие марок | Глобальное, максимально полное |
| Покрытие OEM | Индустриальный стандарт |
| Кросс-референсы | В реальном времени, всегда актуальные |
| Срок реализации | 1–2 недели + процесс одобрения заявки TecAlliance |
Плюсы
- Лучшие данные в индустрии
- Всегда актуальные — API, не дампы
- Глобальное покрытие, включая китайские марки
- Стандарт для профессиональных площадок (Exist, Autodoc, Emex)
Минусы
- 500–2 000 EUR/месяц — дорого для стартапа
- Процесс подключения: заявка → одобрение → интеграция (2–4 недели)
- Зависимость от внешнего API (downtime, rate limits)
- Избыточно для MVP
Сравнительная таблица
| Подход A (бесплатный) | Подход B (разовая покупка) | Подход C (TecDoc API) | |
|---|---|---|---|
| Стоимость | 0 | ~2 000 EUR разово | 500–2 000 EUR/мес |
| Марки/модели | ~200 марок | 119 000+ авто | Глобально |
| OEM-номера | Пользовательские | Миллионы | Индустриальный стандарт |
| Кросс-референсы | Нет | 337 млн строк | Реалтайм |
| Китайские марки | Ручная курация | Есть в каталоге СНГ | Полное покрытие |
| Актуальность | Статичная | Квартальные обновления (платно) | Всегда актуально |
| Срок реализации | 1–2 дня | 3–5 дней | 1–2 недели |
| Cron | Не нужен | Опционально (реимпорт) | Ночная синхронизация |
Рекомендация
Начать с подхода A, затем перейти на B когда маркетплейс наберёт трекшн:
- Для MVP достаточно расширенного каталога марок + валидации формата OEM
- Схема БД уже готова для импорта любых внешних данных
- Путь апгрейда A → B — чистый: купить SQL-дамп, запустить команду импорта
- Подход C оправдан только при выручке, покрывающей подписку
Источники
- vehicle-make-model-data (GitHub) — 19K моделей, SQL/CSV
- automobile-models-and-specs (GitHub) — марки + характеристики
- NHTSA vPIC API — бесплатный API, рынок США
- CarQuery API — JSON API для марок/моделей
- autodatabases.com — базы данных СНГ (каталог, кроссы, OEM)
- autodatabases.com — прайс-лист — цены на базы данных
- parts-crossreference.com — бесплатный поиск кроссов (веб)
- TecAlliance TecDoc — индустриальный стандарт API