0.1 📘 BookStack – appunto tecnico

Capitolo: Setup ambiente Mac mini

Installato Homebrew
Installato Node.js
Installato Ollama
Test esecuzione modello locale

Motivazione:
Base per Lyren Core.

🔥 Strategia

Se brew ora funziona:

Nel tuo ultimo messaggio di oggi mi scrivi:

output brew --version
se vuoi, RAM del Mac ( → Informazioni su questo Mac)

E io ti preparo:

scelta definitiva modello
struttura progetto Lyren Fase 1
schema minimal Node server

Così domani partiamo già con il codice.

Jarvis/Visione sta prendendo forma.

E no, Alexa ancora non è stata informata 😌

🧠 Stato attuale del tuo Mac Mini

Hai:

✅ Homebrew installato
✅ Node.js funzionante (v25.6.1)
✅ Ollama installato
✅ Ollama server attivo su 127.0.0.1:11434
✅ Modello Qwen2.5 7B Instruct caricato
✅ GPU Metal (Apple M2) in uso
✅ 4.6 GB allocati su GPU per il modello

In pratica:

Il tuo Mac Mini è ora un server AI locale funzionante.

Non teoria.
Funzionante.

📊 Cosa sta succedendo dietro le quinte

Dal log:

Traduzione:

Il modello è ~7 miliardi di parametri
È quantizzato (Q4_K) → ridotto a ~4.3GB
Sta girando in GPU Metal
Hai ~5.3GB VRAM disponibile
Il modello usa ~4.6GB

👉 Sei praticamente al limite sano.
Ma è perfettamente stabile.

🏗 Architettura attuale (reale)

Dato che mi hai detto:

Node.js è sul server, non sul Mac Mini
Lo usiamo per monitorare RAM, GPU, CPU, storage del server

Allora l’architettura è questa:

                ┌────────────────────────┐
                │        SERVER          │
                │------------------------│
                │ Node.js Monitoring     │
                │ CPU / RAM / Storage    │
                │ GPU Stats              │
                └──────────┬─────────────┘
                           │ API / JSON
                           │
                ┌──────────▼─────────────┐
                │      Mac Mini M2       │
                │------------------------│
                │ Ollama (LLM runtime)   │
                │ Qwen2.5 7B             │
                │ Local AI brain         │
                └──────────┬─────────────┘
                           │
                           │
                   ┌───────▼───────┐
                   │   Dashboard   │
                   │ (frontend?)   │
                   └───────────────┘

Il Mac Mini non monitora.
Il Mac Mini pensa.

Il server monitora.
Il server manda dati.

🔥 Ora il punto importante

Ollama è in modalità serve.

Questo significa che:

Risponde via HTTP su http://127.0.0.1:11434
Puoi interrogarlo da Node
Puoi creare un tuo orchestratore
Puoi costruire il tuo Jarvis

Esempio chiamata da Node:

1️⃣ Come contattare Ollama

Al momento Ollama è in modalità server sul tuo Mac Mini, quindi lo “contatti” via HTTP API.

URL: http://127.0.0.1:11434
Porta: 11434
Endpoint principale per generare testo: /api/generate

Esempio semplice da terminale/mac:

curl -X POST http://127.0.0.1:11434/api/generate \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen2.5:7b",
    "prompt": "Ciao Ollama, presentati!"
  }'

Risposta: JSON con il testo generato dal modello.

2️⃣ Contattarlo dal tuo smartphone

Da casa, se il Mac Mini resta nella rete locale, serve port forwarding sul router oppure collegarti tramite VPN alla rete domestica.
Con IP statico Iliad, puoi aprire la porta 11434 sul router e collegarti con: http://[IP_pubblico]:11434.
Con DDNS, diventa più semplice perché puoi usare un nome tipo macmini.servezzio.ddns.net:11434.

⚠️ Attenzione: aprire la porta direttamente su Internet senza sicurezza non è consigliato. Meglio VPN o SSH tunnel.

3️⃣ Posizionamento e demo a Orion

Puoi lasciarlo al lavoro per ora.
Quando vuoi farlo vedere a Orion, basta collegarsi via VPN o temporaneamente portare il Mac Mini a casa.
Funzionerà sempre come server AI locale: Orion può fare chiamate all’API da qualsiasi client (Node.js, Python, browser).

0.1

📘 Titolo pagina: Mac Mini AI – Ollama Qwen2.5

Stato attuale

0.1

📘 BookStack – appunto tecnico