Ważne: Free LLM API nie instaluje się lokalnie – to zestaw darmowych zewnętrznych API od dostawców (Groq, Google, Cohere, Mistral, itd.). Na Debianie instalujesz tylko biblioteki Python/Node.js używające tych API.
Jeśli chcesz lokalny model LLM bez internetu – zainstaluj Ollama (lokalny serwer LLM).
OPCJA 1: Cloud API (darmowe API online)
Krok 1: Zainstaluj Python i pip
sudo apt update
sudo apt install -y python3 python3-pip python3-venvKrok 2: Utwórz wirtualne środowisko
cd ~
mkdir free-llm-api
cd free-llm-api
python3 -m venv venv
source venv/bin/activateKrok 3: Zainstaluj bibliotekę OpenAI (kompatybilna z większością darmowych API)
pip install openaiKrok 4: Pobierz klucz API (darmowy, bez karty)
Najlepsza opcja na start – Groq:
-
Wejdź: https://console.groq.com/keys
-
Utwórz darmowy klucz API (bez karty kredytowej)
-
Limity: 30 RPM, 14,400 RPD, Llama 3.3 70B za darmoreddit+1
Krok 5: Stwórz plik testowy
nano test_llm.pyWklej:
from openai import OpenAI
# Konfiguracja клиента
client = OpenAI(
api_key="TWÓJ_GROQ_API_KEY", # wklej swój klucz
base_url="https://api.groq.com/openai/v1"
)
# Wywołanie API
response = client.chat.completions.create(
model="llama-3.3-70b-versatile",
messages=[
{"role": "user", "content": "Cześć! Jak się masz?"}
]
)
print(response.choices[0].message.content)Zapisz (Ctrl+O, Enter, Ctrl+X).
Krok 6: Uruchom test
python test_llm.pyJeśli zobaczysz odpowiedź od Llama 3.3 70B – działa!
OPCJA 2: Lokalny model LLM (Ollama) – bez internetu
Jeśli chcesz uruchomić własny model AI offline na Debianie:
Krok 1: Zainstaluj Ollama
curl -fsSL https://ollama.com/install.sh | sudo shZajatwierdź instalację i pozwól skryptowi pobrać pliki.youtube
Krok 2: Uruchom Ollama jako usługa
sudo systemctl enable ollama
sudo systemctl start ollamaKrok 3: Pobierz model
# Llama 3.3 70B (wymaga ~40 GB RAM):
ollama pull llama3.3
# Llama 3.1 8B (lżejszy, ~5 GB):
ollama pull llama3.1
# Deposit: Llama 3.2 3B (bardzo lekki, ~2 GB):
ollama pull llama3.2Krok 4: Przetestuj model w terminalu
ollama run llama3.1Napisz: Cześć, jak się masz? – model odpowie lokalnie.youtube
Krok 5: Uruchom API lokalne (OpenAI-compatible)
Ollama automatycznie uruchamia API na http://localhost:11434:
curl http://localhost:11434/api/generate -d '{
"model": "llama3.1",
"prompt": "Czym jest sztuczna inteligencja?",
"stream": false
}'Krok 6: Podłącz z Python (OpenAI SDK)
from openai import OpenAI
client = OpenAI(
base_url="http://localhost:11434/v1",
api_key="ollama" # niepotrzebny, ale wymagany przez SDK
)
response = client.chat.completions.create(
model="llama3.1",
messages=[{"role": "user", "content": "Cześć!"}]
)
print(response.choices[0].message.content)OPCJA 3: Darmowe API bez rejestracji (mlvoca)
Jeśli nie chcesz się rejestrować:
import requests
response = requests.post(
"https://mlvoca.com/api/generate",
json={
"model": "tinyllama",
"prompt": "Czym jest Python?",
"stream": False
}
)
print(response.json()["response"])Bez klucza API, bez limitów, ale wolniejsze.mlvoca.github
Porównanie opcji
| Opcja | Koszt | Internet | Wymagania sprzętowe | Prędkość |
|---|---|---|---|---|
| Groq (Cloud) | 0 zł | TAK | 100 MB RAM | Bardzo szybka (2,600 tok/s) github |
| Ollama (Local) | 0 zł | NIE | 8–40 GB RAM, GPU (opcja) | Wolniejsza (20–200 tok/s) |
| mlvoca (Cloud) | 0 zł | TAK | 100 MB RAM | Wolna (brak limitów) mlvoca.github |
Rekomendacja
-
Dla_devów/eksperekmentów: Groq + Llama 3.3 70B (najszybszy, darmowy)
-
Dla_privatności/offline: Ollama + Llama 3.1 8B (lokalnie, bez internetu)
-
Dla_beginnerów: mlvoca (bez rejestracji, testowanie)