Все потоки

SQL *

Формальный непроцедурный язык программирования

СтатьиПостыНовостиАвторыКомпании

men10577 4 часа назад

16 часов и 8600 строк: как Claude Code помог собрать персональный супер-апп

9 мин

3.9K

Nginx * Python * JavaScript * SQL * PostgreSQL *

Кейс

Я решил собрать для себя приложение, которое объединит несколько AI-модулей в одном месте: фитнес-трекер с AI-тренером, новостной дайджест по AI/ML, дашборды для других проектов. Не SaaS для всех, а инструмент для себя. PWA, чтобы работало как нативное приложение на телефоне.

В итоге: 4 дня по 4 часа, 8600 строк кода, работающий продукт в production. Расскажу как это получилось.

Читать далее

+3

thousandsofraccoons 5 часов назад

Как я ускорил наш Prisma API в 5 раз без переписывания запросов

Средний

4 мин

3.8K

Open source * SQL * TypeScript * Базы данных *

Ретроспектива

Путь разработчика от «Prisma — это магия» через «почему это так медленно?» к решению, которое сохраняет и DX, и производительность.

Читать далее

+1

rozhnev 7 часов назад

Интерактивный SQL в браузере: как я создал встраиваемую песочницу с поддержкой 20+ СУБД

Простой

4 мин

4.1K

SQL * Базы данных * Веб-разработка * Подготовка технической документации * Учебный процесс в IT

В статье разбирается техническая реализация SQLize Embed — легковесного JS-компонента для создания интерактивных песочниц прямо в тексте технических статей. Автор подробно описывает архитектуру решения: от использования MutationObserver для инициализации редакторов на фронтенде до обеспечения безопасности и изоляции запросов в Docker-контейнерах на бэкенде.

Вы узнаете, как реализована поддержка более 20 СУБД (включая PostgreSQL 18, MS SQL 2025 и Oracle 23ai) и как встроить «живые» примеры кода в свой проект всего парой строк HTML.

Читать далее

+6

a_dzhal 20 янв в 09:00

Выжимаем максимум из опенсорсных моделей и готовим Text2SQL

12 мин

5.2K

Блог компании X5 TechБлог компании Конференции Олега Бунина (Онтико)Машинное обучение * Big Data * SQL *

Кейс

В любой крупной компании есть повторяющийся сценарий. Аналитик сидит над экспериментом или моделью, строит А/В тесты и дашборды, и в этот момент приходит бизнес и просит быстро посмотреть «продажи жвачки за вчера». Аналитик переключается, пишет запрос, отдаёт результат, а через десять минут прилетает почти такой же вопрос. Потом ещё один и ещё. День заканчивается, а свои задачи стоят и покрываются ржавчиной.

Так выглядит ручной доступ к данным. Бизнес понимает, что нужные данные в хранилище есть, но не всегда может их быстро получить. А аналитик становится «бутылочным горлышком», через которое проходит большой поток запросов.

Мы хотели упростить работу с данными. Чтобы пользователь задавал вопрос, сервис превращал его в SQL, выполнял в хранилище и возвращал аналитический ответ. Чтобы рутина уходила в инструмент, а аналитик переставал быть «бутылочным горлышком».

Вроде ничего нового, но в реальной инфраструктуре вскрывается много интересного: специфическая лексика, свойственная каждому из направлений бизнеса, громоздкие витрины, опыт работы с легаси системами и поведение LLM, которую сначала надо надрессировать.

Читать далее

+10

thousandsofraccoons 19 янв в 18:06

Prisma ORM на скорости чистого SQL? Конвертация JSON-запросов в SQL-строку

Средний

9 мин

9.6K

PostgreSQL * SQL * TypeScript *

В 1974 году, когда SQL только вышел из исследовательских лабораторий IBM, работа с базами данных выглядела просто: разработчик писал запрос и получал результат. Без слоёв, абстракций и фреймворков — только строки, описывающие нужные данные.

Эта прямота дорого обходилась. Переименование колонки превращалось в поиск по тысячам строк кода в надежде отловить все упоминания. Неаккуратная работа с пользовательским вводом приводила к SQL-инъекциям. Миграция с Oracle на PostgreSQL часто означала переписывание значительной части запросов из-за различий диалектов.

К середине 1990-х проблема стала настолько заметной, что начали появляться Object-Relational Mapper’ы (ORM). Идея выглядела привлекательно: работать с таблицами как с объектами, писать код на «родном» языке программирования вместо SQL-строк, а перевод на SQL оставлять фреймворку.

Читать далее

+4

pluzanov 19 янв в 16:55

PostgreSQL 19: Часть 2 или Коммитфест 2025-09

Средний

6 мин

8.4K

Блог компании Postgres ProfessionalPostgreSQL * SQL * Базы данных *

Обзор

Продолжаем цикл статей с обзором изменений 19-й версии. На этот раз рассмотрим что появилось в рамках сентябрьского коммитфеста 2025 года.

Самое интересное из первого июльского коммитфеста можно прочитать здесь: 2025-07.

Читать далее

+16

devozerov 19 янв в 07:30

Как мы переписали ядро Trino на Rust

20 мин

7.8K

Блог компании CedrusDataSQL * Data Engineering * Big Data * Распределённые системы *

CedrusData Engine — это lakehouse-движок, основанный на Trino. На реальных нагрузках наш продукт рутинно превосходит по производительности другие технологии (Trino, Doris, Dremio, StarRocks) в 1.5-3 раза, с еще более значительным отрывом от устаревших Greenplum и Impala. Эти результаты — следствие постоянных вложений в разработку новейших техник обработки больших данных. В этой статье я расскажу про проект Oxide — одну из наших ключевых инициатив прошлого года по переписыванию ядра Trino с Java на Rust.

Читать далее

+13

PaulNoks 17 янв в 11:15

От скриншота до PostgreSQL: парсим банковские операции через Claude Vision

Средний

8 мин

11K

Data Engineering * IT-инфраструктура * PostgreSQL * Python * SQL *

Из песочницы

Это первая статья из цикла о построении CDC-пайплайна в домашней лаборатории.
Полный путь: Telegram → PostgreSQL → Debezium → Kafka → HDFS → DWH.
Но любой пайплайн начинается с данных — и эта статья про их получение.

Читать далее

+5

BackDoorMan 16 янв в 10:43

Куда Clickhouse прячет данные и как их восстановить

Средний

3 мин

7.9K

Базы данных * SQL * Big Data *

Кейс

Clickhouse никогда не удаляет ваши данные, главное помнить об этом и знать где искать. Наш кейс миграции на Clickhouse Keeper, история потери и восстановления данных

Читать далее

+2

kirya522 16 янв в 07:10

«Мы падаем, а клиенты не замечают» или подходы к раздаче редко изменяемых данных

Средний

8 мин

7.7K

Блог компании AvitoTechАнализ и проектирование систем * Высоконагруженные системы * Data Engineering * SQL *

Кейс

Всем привет! Меня зовут Кирилл Грищук, я Tech Lead в команде Инфомодели в Авито. Мы развиваем платформу объявлений и их характеристики.

В предыдущей статье я рассказал, как мы строим отказоустойчивые системы при работе с многомиллионным трафиком.

В этой статье рассказываю, почему, даже когда всё падает, никто этого не замечает. Статья будет полезна всем, кто хочет погрузиться в проблему раздачи и обработки редко изменяемых данных.

Читать далее

+31

ShapitoS999 14 янв в 13:52

База данных как ресурс в микросервисной архитектуре

Сложный

17 мин

7.2K

Микросервисы * SQL * NoSQL * Kotlin *

FAQ

Многие опытные разработчики недооценивают мощь инструментария БД при работе с микросервисами. По каким-то причинам в IT-сообществе приняты эмпирические правила - сервис маленький, значит и база маленькая. Но это не совсем так.

Скорее всего, при проектировании архитектуры у нас в голове чаще всего возникает паттерн database-per-service. И когда мы начинаем рисовать схемы, то возникает соблазн покрутить кирпичики модулей так, чтобы красиво их соединить стрелочками с цилиндриками, обозначающими БД.

С другой стороны, все знают, что много микросервисов, взаимодействующих через одну общую монструозную базу как Oracle, ElasticSearch и другие - это антипаттерн.

Поэтому выбирают маленькие(!) Postgres или MySQL.

Читать далее

+2

alex7six 14 янв в 10:33

Как ускорить SQL-запрос в миллион раз без изменения кода: кейс со STATMULTIPLIER в Postgres

8 мин

19K

Блог компании Тантор ЛабсPostgreSQL * SQL * Базы данных * 1С *

Кейс

Однажды при мониторинге мы обратили внимание на запрос, который занимал первое место по длительности: 40+ секунд на выполнение при 657 вызовах за день. Причина состояла в том, что из-за неточной статистики распределения данных выбирался неподходящий индекс. В статье расскажем о том, как с помощью параметра STATMULTIPLIER в СУБД Tantor Postgres этот проблемный запрос удалось ускорить примерно в миллион раз — до 0.042 миллисекунды, — просто повысив точность статистики без изменения кода или структуры базы данных.

Читать далее

+17

ShapitoS999 13 янв в 13:15

И снова про алгоритмы и структуры данных…

Средний

8 мин

13K

Java * Kotlin * SQL * Алгоритмы *

Мнение

За годы разработки приходит понимание, что происходит в тех или иных сервисах, когда они тормозят, лагают, выдают «неожидаемое» поведение. В данной статье хочу рассмотреть проблему неправильного использования алгоритмов и архитектурных решений с бытовой, общечеловеческой стороны.

Читать далее

-5

koanse 13 янв в 04:50

Ускорение разработки с ИИ на примере DAX и Power BI

Простой

6 мин

3.3K

Искусственный интеллектВизуализация данных * SQL * Big Data *

Кейс

Сезон ИИ в разработке

Привет, Хабр! С каждым годом ИИ способен решать более сложные задачи, одной из задач является понимание DAX, связанных предметных областей и генерация кода. Можно выделить несколько задач, которые не являются первостепенными, тем не менее актуальны для анализа или работы в Power BI, например, от простейших — создание клиента для выполнения DAX запросов в Power BI из произвольной среды (например, из .NET приложения) и импорт метаданных TOM модели, до более сложных задач — экспорта схемы данных и самих данных из Power BI в произвольную СУБД (понятно, что такая задача не всегда актуальна с точки зрения ETL, т.к. проще взять данные из исходных источников, а не из Power BI, но польза решения задачи «интуитивно понятна» пользователю) и задач генерации SQL запросов на основе DAX для заданной СУБД, причем результаты сгенерированного SQL должны совпадать с результатами DAX запросов.

Интересующимся применением ИИ на примере DAX из Power BI — добро пожаловать под кат :)

Читать далее

0

pluzanov 12 янв в 16:32

PostgreSQL 19: Часть 1 или Коммитфест 2025-07

Средний

7 мин

11K

Блог компании Postgres ProfessionalPostgreSQL * SQL * Базы данных *

Обзор

Начинаем новый цикл статей с обзором изменений 19 версии. И первая статья о событиях летнего июльского коммитфеста прошлого года.

Читать далее

+21

Kilor 12 янв в 06:10

SQL HowTo: немного геометрии (Advent of Code 2025, Day 9: Movie Theater)

Простой

5 мин

7.3K

Блог компании ТензорPostgreSQL * SQL * Занимательные задачкиАлгоритмы *

Кейс

Осторожно, спойлеры! Не читайте, пока хотите решить задачу самостоятельно.

В этой челлендж-серии статей, начатой с прошлогоднего эвента, попробуем использовать PostgreSQL как среду для решения задач Advent of Code 2025.

Возможно, SQL не самый подходящий для этого язык, зато мы рассмотрим его различные возможности, о которых вы могли и не подозревать.

Читать далее

+12

OlegIct 10 янв в 14:58

Если UPDATE столкнулся с заблокированной строкой

Средний

3 мин

13K

Блог компании Тантор ЛабсPostgreSQL * SQL * Базы данных *

Обзор

В PostgreSQL и Oracle Database команда UPDATE, столкнувшаяся с заблокированной строкой, ведёт себя по-разному. В статье рассматривается, как выполняется UPDATE в этих базах данных. Это может быть полезно при миграции кода приложения мжду этими базами данных.

Читать далее

+21

kirya522 9 янв в 16:19

Как обрабатывать 5 млн изменяющихся форм в минуту с SLI 99.99%

Средний

13 мин

11K

Блог компании AvitoTechАнализ и проектирование систем * Высоконагруженные системы * SQL * Data Engineering *

Кейс

Всем привет! Меня зовут Кирилл Грищук, я Tech Lead в команде Инфомодели в Авито. Мы занимаемся тем, что обрабатываем формы от пользователей: от 5 млн до 15 млн форм в минуту, а это более 150 тысяч в секунду.

В этой статье на примере Авито я рассказываю, зачем мы стремимся к SLI 99.99%. Внутри — обзор и сравнение решений по доставке неизменных данных, учитывая специфику нашего сервиса. Показываю на примере форм, какие интересные доработки мы придумали, чтобы достичь этих четырёх девяток, и какие ошибки совершали по пути.

Статья будет полезна всем, кто хочет погрузиться в проблему раздачи и обработки редко изменяемых данных.

Читать далее

+32

MalblshProgrammist 7 янв в 05:22

Парсинг тарифов интернета и ТВ: Архитектура БД и бэкенд на SQL

Средний

4 мин

7.7K

PostgreSQL * Базы данных * Data Engineering * SQL * Python *

Роадмэп

За 5 лет работы в B2B и B2C сегментах у телеком-провайдеров я столкнулся с одной из проблем: абоненты годами сидят на архивных дорогих тарифах или пользуются услугами операторов, которые не идут на уступки, не снижают цены на тарифы, пользователи просто не знают, что в их же доме есть альтернативные провайдеры с тарифами более выгодными для них.

Я решил объединить свой опыт в телекоме с навыками в программировании. Так появилась идея по парсенгу тарифов. Цель — создать инструмент, который автоматически мониторит провайдеров, избавляя пользователей от ручного сравнения и помогая им находить оптимальные условия по тарифу.

Сейчас я работаю аналитиком БД, параллельно изучаю архитектуру, построение данных. Решил начать проект с проектирования структуру на PostgreSQL по схеме "Звезда". Таблицей фактов у меня будет таблица со связью города с провайдером, таблицы измерений – таблица с информацией о тарифах, городами и провайдерами.

Читать далее

-1

PhoenixLi 7 янв в 02:51

Инструмент перехвата медленных запросов StarRocks

Средний

8 мин

6.2K

Data Engineering * Базы данных * Big Data * Open source * SQL *

Туториал

Практическое руководство по построению сервиса перехвата медленных запросов в StarRocks: правила kill и пороги (full table scan, scan rows/bytes), анализ execution plan, интеграции с Grafana и Feishu, SQL-схемы и YAML-конфигурация для продакшена.

Читать далее

0

1

2 3 ...