Strumenti · Observability LLM

Langfuse

Vedi cosa fanno davvero i tuoi LLM in produzione. Trace ogni chiamata, misuri latenza e costo, debug degli output sbagliati. Senza Langfuse, l'AI è una scatola nera che a volte funziona.

Non puoi migliorare quello che non misuri.

Langfuse — Observability LLM

In 30 secondi

Ogni chiamata LLM diventa un trace strutturato.

Langfuse intercetta le chiamate ai modelli LLM dalle tue applicazioni e le memorizza in modo strutturato: input, output, prompt, parametri, latenza, costo, user_id, sessione. Una dashboard mostra metriche aggregate (richieste/giorno, costo, errori) e permette di entrare nel singolo trace per debug. Equivalente di Datadog/Sentry, ma specifico per il dominio LLM.

Per il business

I quattro vantaggi che contano

Visibilità sui costi

Sai esattamente quanto costa ogni utente, ogni feature, ogni modello. Niente più bollette a fine mese senza idea di chi consumi cosa.

Debug delle risposte sbagliate

Risposta inaspettata? Apri il trace, vedi prompt, output, contesto, retrieval. Capisci la causa in minuti, non in giorni di tentativi.

A/B test e prompt versioning

Test prompt diversi su sottoinsiemi di utenti reali. Misura quale converte meglio o risponde più velocemente. Tieni il prompt versionato come codice.

Self-hosted = log non escono

Container Docker che gira nella tua rete. Le conversazioni con i tuoi LLM (che possono contenere dati sensibili) non vanno mai fuori.

Quando ha senso

Casi d'uso reali

  • Monitorare LLM in produzione (chat aziendale, agenti, RAG)
  • Tracking costi per attribuire spesa AI per team o feature
  • Debug iterativo di prompt e flussi RAG
  • Audit compliance: registro di chi ha chiesto cosa al modello

Quando NON ha senso

Limiti onesti

  • Aggiunge latenza se il SDK non è in modalità asincrona
  • Storage cresce con il volume: pianifica retention/archiviazione
  • Setup iniziale richiede modifica codice applicativo (1-2 righe per chiamata)

Installazione

Stack docker-compose. SDK Python/JS in 10 righe.

Stack docker-compose con Langfuse + Postgres + Clickhouse. SDK ufficiali per Python, TypeScript, Java, Go. Integrazione con LangChain, LlamaIndex out-of-box. Dashboard web pronta su porta 3000.

Vuoi capire se Langfuse ha senso per la tua organizzazione?

La valutazione iniziale chiarisce il caso d'uso, l'integrazione con il resto dello stack, l'investimento. Senza presentazioni generiche.