О проекте
Барахолка Нячанга · агрегатор

Full Catalog — все объявления Нячанга в одном месте

Мы собираем посты из 15+ Telegram-каналов и чатов барахолки Нячанга, превращаем их в структурированный каталог с поиском, фильтрами и категориями. Без дублей, с актуальными ссылками и удобной карточкой товара.

Зачем мы это сделали

В Нячанге десятки Telegram-каналов и чатов с объявлениями. Найти нужную вещь — значит вручную листать ленты, ловить дубли и копировать ссылки на пост. Full Catalog убирает это трение: вы видите один каталог, а вся «сырая» работа (подписка, нормализация, дедуп, проверка актуальности) происходит на нашей стороне.

Что внутри

Шесть ключевых возможностей, которые отличают агрегатор от ручного поиска по Telegram.

Один каталог — все барахолки

Объявления из 15+ Telegram-каналов и чатов Нячанга собраны в единый каталог с поиском, фильтрами и категориями. Не нужно скроллить десятки лент.

AI-нормализация

Из каждого поста автоматически извлекаем заголовок, описание, цену и категорию. Многотоварные посты разбиваются на отдельные карточки.

Дедупликация

Один и тот же товар, опубликованный в нескольких каналах, склеивается в одну карточку. Все источники остаются доступны в карточке товара.

Цены и валюты

Понимаем форматы VND, USD, EUR, RUB, плюс шорткаты: «2,5к», «128 млн», «3 mil». Аномальные цены проверяем дополнительной AI-проверкой.

Фото и галереи

Альбомы из Telegram сохраняются полностью, HEIC автоматически конвертируется в JPEG. Для постов с несколькими товарами AI Vision сопоставляет фото с конкретными позициями.

Архив и снятые с продажи

Если пост старше 8 дней или удалён продавцом — товар уходит в архив. Регулярно проверяем ссылки в Telegram и возвращаем товар в каталог при свежем репосте.

Как это работает

От публикации в Telegram до появления карточки в каталоге проходит, как правило, меньше минуты. Дальше товар живёт по правилам актуальности.

Слушаем Telegram в реальном времени

Worker на Telethon подписан на все настроенные каналы и чаты. Каждый новый или отредактированный пост попадает в обработку сразу же.

Нормализуем текст и медиа

OpenAI-классификатор извлекает название, описание, цену, валюту и категорию. Альбомы фото скачиваются и нормализуются (HEIC → JPEG).

Склеиваем дубли

Считаем хэш текста, медиа-сигнатуру и комбинируем с автором поста. Перепосты и репорты одного автора объединяются в один товар.

Контроль качества

Рискованные карточки (странная цена, конфликтная категория) попадают в фоновую AI-перепроверку — без задержки публикации.

Поддерживаем актуальность

Раз в 3 часа проверяем ссылки на Telegram-посты: удалённые объявления автоматически уходят в архив, а свежие репосты возвращают товар в основной каталог.

Правила каталога и архива

Главное правило простое: вы видите только живые предложения.

В основном каталоге

Товары, у которых есть хотя бы один пост в Telegram моложе 8 дней и он не удалён автором. Любой свежий репост возвращает товар из архива обратно в каталог.

В архиве

Товары, у которых все ссылки старше 8 дней либо удалены. Карточка остаётся доступной по ссылке, но не показывается в основном поиске.

Технологии

Открытый стек, проверенный в проде: легко масштабировать и поддерживать.

Backend: Python + FastAPI

Асинхронные API, миграции на Alembic, очереди фоновых задач.

Telethon (user-session)

Подписки на каналы/чаты и чтение истории сообщений в реальном времени.

OpenAI

Нормализация полей, классификация категорий, AI Vision для медиа.

PostgreSQL + JSONB

Канонические товары, провенансы по источникам, GIN-индексы для поиска.

Frontend: Next.js + React

Серверный рендер, SEO-метаданные, адаптивная вёрстка.

Docker Compose + Caddy

Прод-стек с автоматическим HTTPS, изолированными контейнерами и health-проверками.

Готовы посмотреть, что сейчас продаётся в Нячанге?

Откройте каталог — товары и категории обновляются автоматически.