В этом уроке мы покажем вам, как установить DuckDB в Ubuntu 24.04 LTS. DuckDB — это мощная система управления базами данных SQL с открытым исходным кодом, хранящаяся в памяти, предназначенная для быстрой аналитической обработки. Он предлагает уникальное сочетание простоты, производительности и гибкости, что делает его привлекательным выбором как для аналитиков данных, так и для разработчиков. Способность DuckDB эффективно обрабатывать сложные запросы к большим наборам данных сделала ее все более популярной в сообществе аналитиков данных.

В этой статье предполагается, что у вас есть хотя бы базовые знания Linux, вы умеете использовать оболочку и, самое главное, размещаете свой сайт на собственном VPS. Установка довольно проста и предполагает, что вы работаете под учетной записью root, в противном случае вам может потребоваться добавить ‘sudo‘ к командам для получения root-прав. Я покажу вам пошаговую установку DuckDB на Ubuntu 24.04 (Noble Numbat). Вы можете следовать тем же инструкциям для Ubuntu 22.04 и любого другого дистрибутива на основе Debian, такого как Linux Mint, Elementary OS, Pop!_OS и других.

Предварительные условия

  • Сервер под управлением одной из следующих операционных систем: Ubuntu и любого другого дистрибутива на основе Debian, например Linux Mint.
  • Рекомендуется использовать новую установку ОС, чтобы предотвратить любые потенциальные проблемы.
  • Не менее 2 ГБ ОЗУ и 10 ГБ свободного места на диске.
  • Доступ к серверу по SSH (или просто откройте терминал, если вы находитесь на рабочем столе).
  • Активное подключение к Интернету. Вам понадобится подключение к Интернету, чтобы загрузить необходимые пакеты и зависимости.
  • Система Ubuntu 24.04 с root-доступом или пользователь с привилегиями sudo.

Установите DuckDB на Ubuntu 24.04 LTS Noble Numbat

Шаг 1. Обновление репозитория пакетов.

Чтобы обеспечить плавный процесс установки, необходимо обновить системные пакеты до последних версий. Откройте терминал и выполните следующие команды:

sudo apt update
sudo apt upgrade

apt update команда обновляет список пакетов, а apt upgrade устанавливает доступные обновления. Этот шаг помогает решить любые проблемы с зависимостями и обеспечивает доступ к последним обновлениям безопасности и исправлениям ошибок.

Шаг 2. Установка зависимостей.

DuckDB требует установки нескольких зависимостей в вашей системе. Чтобы установить их, выполните следующую команду:

sudo apt install git g++ cmake ninja-build libssl-dev

Шаг 3. Установка DuckDB в Ubuntu.

После установки зависимостей вы можете загрузить исходный код DuckDB из официального репозитория GitHub. Используйте следующую команду для клонирования репозитория:

git clone https://github.com/duckdb/duckdb.git

Перейдите в каталог DuckDB, используя следующую команду:

cd duckdb

Теперь вы можете собрать DuckDB из исходного кода с помощью CMake и Ninja. Выполните следующие команды:

mkdir build
cd build
cmake -DCMAKE_BUILD_TYPE=Release -G Ninja ..
ninja

Эти команды создадут новый каталог «сборки», перейдут в него и сгенерируют файлы сборки с помощью CMake. -DCMAKE_BUILD_TYPE=Release Флаг гарантирует, что DuckDB построен с оптимизацией для повышения производительности. Наконец, ninja Команда скомпилирует исходный код и создаст исполняемый файл DuckDB.

Если у вас возникнут какие-либо проблемы в процессе сборки, убедитесь, что вы установили все необходимые зависимости и имеете достаточно места на диске и доступной памяти.

После успешной сборки DuckDB вы можете установить интерфейс командной строки (CLI) DuckDB, используя следующую команду:

sudo ninja install

Чтобы проверить установку, выполните следующую команду:

duckdb --version

Если установка прошла успешно, вы должны увидеть номер версии DuckDB, отображаемый в терминале.

Шаг 4. Использование DuckDB с Python.

DuckDB легко интегрируется с Python, что позволяет вам использовать его мощные аналитические возможности в ваших скриптах Python. Чтобы использовать DuckDB с Python, вам необходимо установить клиент DuckDB Python.

Сначала убедитесь, что в вашей системе установлены Python и pip. Затем выполните следующую команду, чтобы установить клиент DuckDB Python:

pip install duckdb

После установки вы можете начать использовать DuckDB в своих скриптах Python. Вот базовый пример:

import duckdb

con = duckdb.connect('example.db')
con.execute("CREATE TABLE users (id INTEGER, name VARCHAR)")
con.execute("INSERT INTO users VALUES (1, 'John'), (2, 'Alice')")
result = con.execute("SELECT * FROM users")

for row in result.fetchall():
    print(row)

В этом примере показано, как подключиться к базе данных DuckDB, создать таблицу, вставить данные и выполнить запрос SELECT для получения результатов.