Appearance
Источники данных авто-каталога и запчастей: стратегии
Сводный отчёт по исследованию источников данных для маркетплейса Б/У запчастей Partizap. Объединяет ландшафтный обзор (Этап 1), верификацию конкретики (Этап 1, второй движок), оценку даркнет-сорсинга (Этап 3) и детальную проверку 4 кандидатов (Этап 2).
1. Резюме и рекомендация
Главный вывод. Данные распадаются на два слоя, которые нельзя получать одним способом:
- Скелет авто (марки → модели → поколения → модификации) — берётся одной выгрузкой (дампом) и грузится в нашу БД. Это дёшево и технически просто.
- Применимость / OEM-номера / кроссы — у платных каталогов (ACAT, NLA24, Laximo) это только пер-запросный lookup: единой выгрузки нет, а лицензия ACAT прямо запрещает экспорт данных в стороннее ПО (в т.ч. тех, что вы сами загрузили). То есть массово залить применимость к себе нельзя — только живые запросы к API с кэшированием в рамках лицензии.
Рекомендованная архитектура (ранжировано):
- Скелет авто — bulk-дамп из carsBase / Auto-Parser. Вы уже залили марки/модели; поколения и модификации добираются дёшево: carsBase тариф «Стандарт» 560 ₽/мес (3360 ₽/6 мес) отдаёт поколения/конфигурации/модификации (65 параметров) в MySQL/CSV/JSON/XLSX + REST API; Auto-Parser — те же 5 таблиц в CSV/SQL. Маппится прямо в
car_makes/car_models/car_generations/car_modifications, минимальный ETL. Оговорка: данные собраны с auto.ru → риск ст. 1334 ГК, нужен юрист. - Применимость/OEM/кроссы — live-lookup к платному API, разложенный по сегментам:
- ACAT (19 990 ₽/мес) — отечественные + спецтехника (глубокий ГАЗ), широкий парк, поиск по VIN.
- NLA24 (пер-показ, 6–18k ₽) — китайские + Lada (OEM, кроссы, поколения).
- Laximo (по запросу) — широта/премиум по легковым (применимость — отдельная платная функция).
- Рост базы OEM из объявлений — продавцы вводят номера при создании объявления (механика уже есть), база кроссов растёт органически. Это бесплатный и легально чистый слой.
Что критично перед запуском (не закрывается ресёрчем): заключение юриста РФ по ст. 1334 (и по auto.ru-данным, и по условиям лицензий платных API) + триалы на реальную глубину покрытия по вашим маркам.
2. Контекст и задача
Маркетплейсу нужны актуальные справочные данные двух видов:
- Каталог авто — чтобы продавец мог выбрать марку/модель/поколение/модификацию при создании объявления (это блокер для «полноценно добавить объявление»).
- Запчасти — OEM-номера (валидация и поиск), кроссы-аналоги (покупатель находит совместимые), применимость «деталь↔авто» (вторично).
Ограничения: российский рынок (включая отечественные, китайские, японские/корейские, американские марки), минимальный бюджет, без дорогого официального лицензирования TecDoc, стратегия «стартовое наполнение + рост из объявлений».
Опорные факты из Этапа 1 (кратко):
- Применимость — единственный по-настоящему платный пласт; базовый каталог авто, OEM и кроссы добываются дёшево/бесплатно.
- Ни один источник не закрывает все сегменты — нужна комбинация.
- Каталог авто для РФ лучше всего закрывают рунет-источники (carsBase: 423 марки / ~4900 моделей с кириллицей, включая отечественные, китайские и американские).
3. Сводная таблица кандидатов (Этап 2)
| Кандидат | Модель доступа | Bulk-выгрузка | Цена (подтверждено) | Покрытие RU/китайцы | Трудозатраты импорта | Юр-чистота | Итог |
|---|---|---|---|---|---|---|---|
| carsBase / Auto-Parser (скелет авто) | Дамп + REST | Да (MySQL/CSV/JSON/XLSX/SQL) | Мини 0 ₽; Стандарт 560 ₽/мес; Полный 696 ₽/мес | Полное по марке/модели/поколению (RU+китай+US) | Минимальные (5–7 норм. таблиц → прямой маппинг) | Риск ст.1334 (данные с auto.ru) — нужен юрист | Основа для скелета авто |
| ACAT API (применимость/OEM) | Пер-запрос REST | Нет (лицензия запрещает экспорт) | 19 990 ₽/мес (100k запросов, вкл. 10k VIN) | Глубокий ГАЗ (CARS_NATIVE), широкий парк + спецтехника | Не bulk-импортируется; только live-запросы | Лицензия неисключительная, экспорт/хранение в стороннее ПО запрещены, штраф до 1 млн ₽ | Lookup по отеч.+спецтехника |
| NLA24 (применимость/OEM) | Пер-запрос | Нет | 6 000–18 000 ₽ за 1000–4000 показов номера | Lada (глубоко) + 24 китайских; нет ГАЗ/УАЗ/BYD, Москвич только Model 3 | Не bulk; live-запросы | Платный доступ; глубина за регистрацией | Lookup по китайцам + Lada |
| Laximo.OEM | Пер-запрос (SOAP, пачка ≤5) | Нет | По запросу (не публикуется); применимость — отдельная платная функция | 45 марок (не перечислены) — покрытие по RU/китайцам не подтверждено | Не bulk; live-запросы | Доступ по логину/паролю; условия по запросу | Дополнение по широте (после запроса цены) |
| Amayama / MegaZip (JDM) | — | — | — | Японский сегмент | — | — | Не исследовано в Этапе 2 — отдельная проверка |
4. По каждому кандидату детально
Везде явно разделено: [Подтверждено ресёрчем] (первоисточники/официальные SDK) и [Проверить вживую] (запрос вендору / триал / юрист).
4.1. carsBase / Auto-Parser.ru — скелет авто (рекомендуется как основа)
[Подтверждено]
- Единственный кандидат с реальной bulk-выгрузкой: carsBase отдаёт расширенную базу (поколения/конфигурации/модификации, 65 параметров, 187 опций; 7 связанных таблиц) в MySQL/JSON/CSV/XLSX + REST API; рабочие эндпоинты подтверждены (cars-base.ru).
- Тарифы: Мини — 0 ₽ (марки/модели), Стандарт — 560 ₽/мес (3360 ₽/6 мес; + поколения/конфигурации/модификации, логотипы, выгрузки, API), Полный — 696 ₽/мес (+ фото).
- Auto-Parser.ru — эквивалент из auto.ru: «5 таблиц (марок, моделей, поколений, конфигураций, модификаций)», основной формат CSV, по запросу EXCEL/SQL, ежедневные обновления (auto-parser.ru).
- Нормализованная иерархия марка→модель→поколение→конфигурация→модификация ложится напрямую в PostgreSQL — самый низкий ETL из четырёх.
[Проверить вживую]
- Условия лицензии/использования на странице carsBase — прочитать напрямую (тезис «на странице нет условий/источника» в верификации не подтвердился, т.е. условия там, скорее всего, есть).
- Заключение юриста по ст. 1334 ГК (данные собраны с auto.ru) — см. раздел 7.
4.2. ACAT API — применимость/OEM по отечественным и спецтехнике
[Подтверждено]
- Тариф API — 19 990 ₽/мес, до 100 000 запросов/мес (вкл. 10 000 VIN), весь каталог + спецтехника; дешёвые тарифы (4 990–7 990 ₽) — без API (acat.online/rates).
- Доступ строго пер-запросный («запрос» = переход по каталогу или поиск по VIN/frame); REST, без эндпоинта выгрузки/дампа.
- Лицензия (оферта /rules) прямо запрещает экспорт данных в стороннее ПО — §1.2, §3.2.7, §5.2.13, в т.ч. данные, загруженные самим лицензиатом; лицензия неисключительная; запрет автосбора/индексирования; штраф до 1 000 000 ₽ (acat.online/rules).
- Глубокое покрытие ГАЗ (CARS_NATIVE: 14/21/24/3102/3110/2705/3302/Maxus и др., двигатели ЗМЗ/УМЗ) — закрывает дыру NLA24 (CARS_NATIVE/GAZ).
[Проверить вживую]
- Возможен ли B2B-дамп off-API по договору (публично нет, лицензия против — но не опровергнуто).
- Глубина OEM-кроссов/аналогов (на витрине не заявлены) — триал.
- Точные условия хранения/перепродажи (/agreement, /rules#policy) — прочитать юристу.
- ⚠️ Тезис «ACAT добавил Chery 10.03.2025 / Haval 15.12.2025» в верификации опровергнут (0-3) — не опираться.
4.3. NLA24 — применимость/OEM по китайцам и Lada
[Подтверждено]
- Каталог (28 брендов, подтверждён двумя выборками): Lada (Aura/Granta/Largus/Niva Travel/Vesta/XRAY) + 24 китайских — Chery, Haval, Geely, Changan, BAIC, GAC, Great Wall, Exeed, Omoda, Jetour, Tank и др. (nla24.ru/car).
- Дыры покрытия: нет ГАЗ, нет УАЗ, нет BYD (страница
/car/byd— 404), Москвич только Model 3. - Глубина поколений/модификаций подтверждена на брендовых страницах; цена — пер-показ номера (6–18k ₽ за 1000–4000), не bulk.
[Проверить вживую]
- Реальная глубина OEM-кроссов/применимости по каждому бренду — за регистрацией (один отзыв: «неполно и платно»). Нужен триал.
4.4. Laximo.OEM — широта/премиум (после запроса цены)
[Подтверждено]
- Цена не публикуется — модель «по запросу» (контакт feedback@technologytrade.ru); доступ по логину/паролю; интеграция только SOAP, пачка ≤ 5 команд (technologytrade.ru/oem, SDK guayaquillib).
- Есть функция применимости «деталь↔авто», но она отдельно платная/гейтится по тарифу (подтверждено интеграторами ABCP, PARTS SOFT).
- Заявлено 45 марок — список не раскрыт.
[Проверить вживую]
- Фактическая цена и является ли применимость отдельной статьёй или функцией старшего тарифа — только у отдела продаж Laximo.
- Конкретный список 45 марок и глубина по Lada/ГАЗ/УАЗ/Москвич и китайцам — запрос/триал.
4.5. Amayama / MegaZip — JDM (не закрыто Этапом 2)
[Подтверждено] — у MegaZip есть партнёрская программа (megazip.net/affiliate-prog); существует неофициальный API к каталогу Toyota на Apify.
[Проверить вживую] — условия доступа/выгрузки/партнёрского API Amayama и MegaZip в Этапе 2 не верифицированы (ноль подтверждённых утверждений). Требуется отдельная мини-проверка перед включением японского сегмента.
5. Что отклонено и почему
| Вариант | Причина отклонения |
|---|---|
| Серый/«пиратский» дамп TecDoc | Конкретика непроверяема (цена/свежесть/состав рефутированы в Этапе 1); нелицензионная копия охраняемой БД → высокий риск ст. 1334 ГК. |
| Сорсинг из даркнета | Этап 3, вердикт «не стоит»: те же дампы открыто лежат в клирнете (бесплатно на GitHub и за ~2000 € на обычных сайтах), даркнет добавляет только скам/малварь; любой дамп нелегален независимо от источника — прецедент взыскания 5,28 млн ₽ (СИП, А56-39703/2022), при краденых ПДн — ст. 272.1 УК (до 4 лет) и штрафы до 15 млн ₽. Экономия несопоставима с санкциями. |
| Зарубежные открытые датасеты (vPIC, us-car-models-data) | US-рынок, нет Lada/ГАЗ/УАЗ и большинства китайцев, нет запчастей — для РФ нерелевантны. |
| Полная bulk-загрузка применимости из ACAT/NLA24/Laximo | Технически нет выгрузки + лицензии запрещают экспорт/хранение. Применимость доступна только как live-lookup. |
6. Каталог авто — принятое решение
Источник: carsBase (бесплатный API + платная расширенная база).
- Марки/модели — актуализированы и залиты в БД (отдельная сессия). carsBase даёт 423 марки / ~4900 моделей с кириллицей, странами и годами, включая отечественные (Lada, ГАЗ, УАЗ, Москвич, Aurus, Атом), китайские (130 марок: BYD, Chery, Changan, Geely, Haval, Avatr, BAIC…) и американские (55 марок: Ford 107 моделей, Chevrolet 100, Cadillac, GMC, Buick, Chrysler, Dodge, Jeep, Tesla…).
- Поколения/модификации — следующий шаг: бесплатный тариф их не содержит; добираются из carsBase «Стандарт» (560 ₽/мес) или Auto-Parser (CSV/SQL), маппинг прямой в
car_generations/car_modifications. - Нормализованная выгрузка под нашу схему сохранена:
work/car-actualization/carsbase_normalized.json.
Примечание по американским маркам: они есть в данных в полном объёме. В Этапе 1 они не фигурировали как отдельный сегмент (в охвате значились EU + JP/KR + отечественные + китайские) — это была недоработка постановки, на сам каталог авто не влияющая.
7. Юридическая сводка
Главный правовой узел — ст. 1334 ГК РФ (исключительное право изготовителя БД, sui generis). База с ≥ 10 000 самостоятельных элементов презюмируется охраняемой; извлечение существенной части без разрешения правообладателя запрещено.
- carsBase / Auto-Parser собраны парсингом auto.ru, чей каталог уверенно превышает 10 000 элементов → риск ст. 1334 реален. Статья сама по себе не решает вопрос правомерности конкретного коммерческого использования — нужен юрист РФ.
- Платный API не снимает риск автоматически: лицензии ACAT/NLA24/Laximo — неисключительные, с прямыми запретами на экспорт/хранение/перепродажу (ACAT — штраф до 1 млн ₽). То есть платный доступ заменяет риск ст. 1334 на ограничения лицензии, которые тоже нужно прочитать юристу до запуска.
- Главный регуляторный риск проекта в целом — не каталог, а персональные данные из объявлений (телефоны/ФИО продавцов): 152-ФЗ (штрафы до 15–20 млн ₽ с 30.05.2025), ст. 272.1 УК (с 11.12.2024), локализация ПДн в РФ (с 01.07.2025). Уголовная 272.1 относится к ПДн, не к справочному каталогу запчастей.
- Серый дамп / даркнет — отклонены (раздел 5): нелегальны независимо от источника, прецедент взыскания 5,28 млн ₽.
Вывод: до продакшена обязательны два юридических заключения — (1) по использованию auto.ru-данных (carsBase/Auto-Parser) в коммерческом продукте; (2) по тому, что именно разрешают лицензии платных API (хранение, кэш, отображение).
8. Открытые вопросы и следующие шаги
Закрывается только действиями вне ресёрча:
- Запросы вендорам. Продаст ли кто-то из ACAT/NLA24/Laximo разовый B2B-дамп off-API и почём (публично нет, ACAT-лицензия против). Реальная цена Laximo и статус применимости (отдельная плата или старший тариф).
- Триалы на глубину. Реальная полнота OEM-кроссов/применимости по Lada/ГАЗ/УАЗ/Москвич и Chery/Haval/Geely/Changan/BYD у ACAT, NLA24, Laximo (наличие марки ≠ глубина данных — она за регистрацией).
- Юрист РФ. Заключение по ст. 1334 (auto.ru-данные) и по условиям лицензий платных API.
- Японский сегмент. Отдельно проверить условия доступа/выгрузки Amayama и MegaZip (в Этапе 2 не закрыто).
- Поколения. Подключить carsBase «Стандарт» (560 ₽/мес) или Auto-Parser, залить
car_generations/car_modifications.
Предлагаемая последовательность внедрения:
- Скелет авто: марки/модели (готово) → поколения/модификации (carsBase Стандарт).
- OEM из объявлений — включить валидацию/нормализацию (механика есть).
- Параллельно — триалы ACAT + NLA24, запрос цены Laximo.
- Юрист — до подключения платных API в продакшен.
- Применимость — live-lookup по выбранному API (по сегментам), без bulk-хранения.
9. Источники (ключевые первоисточники)
Кандидаты:
- cars-base.ru · auto-parser.ru/auto_catalog · GitHub blanzh/carsBase
- acat.online/rates · acat.online/rules · CARS_NATIVE/GAZ · API docs
- nla24.ru/car
- technologytrade.ru/oem · SDK guayaquillib
- megazip.net/affiliate-prog · amayama.com
Право:
- ст. 1334 ГК РФ (КонсультантПлюс)
- Прецедент СИП А56-39703/2022 (взыскание 5,28 млн ₽ за извлечение авто-БД)
Интеграторы (вторичные, по применимости/тарифам):
Полные отчёты по этапам (в архиве сессии research_20260621_161e10): FINAL_REPORT.md (Этап 1, ландшафт) · engineB-deep-research.md (Этап 1, верификация) · etap3-darknet-otsenka.md (Этап 3, даркнет).
Отчёт подготовлен по результатам многоэтапного исследования источников (ландшафт → верификация → даркнет-оценка → детальная проверка 4 кандидатов). Все цены и покрытие проверены на первоисточниках в июне 2026; к моменту внедрения перепроверить.