IA

Modelos preditivos, pipelines de LLM e ferramental de IA de ponta a ponta.

▸train.pye:0s:00000● LIVE

loss: 2.4500
val_loss: 2.7000
acc: 0.220
ppl: 11.59
lr: 3.00e-4
batch: 32
grad_nrm: 0.870
tok/s: 38,400
gpu_mem: 14.2/16G

train_loss2.450

val_loss2.700

acurácia0.220

grad ∥.∥ by layer12 layers

▄▅▄▄▄▄▅▅▅▄▅▄

emb·······lm_head

▸jeff.pytemp: 0.8

TEMP

0.8

peça pro jeff fazer seu dever de casa, ele sabe de (quase) tudo

▸ai.mdselecione texto → probe

Treino modelos do zero — tratamento de dados, engenharia de features, design de função de loss e loops de treinamento — com Python como meu daily driver e PyTorch, TensorFlow ou scikit-learn dependendo do que o problema pede. Nada é terceirizado pro autoML: eu quero entender por que a loss tá se mexendo.

Pra produtos movidos a LLM, monto pipelines de retrieval-augmented: modelos do Hugging Face quando self-host faz sentido, PostgreSQL com pgvector pra busca por embeddings, tool calling e function calling custom pro modelo fazer coisas de verdade, e prompt cache agressivo pra conta não pegar fogo.

Também escrevo meu próprio ferramental pros modelos não serem caixa-preta — exportadores de IDA que mandam código decompilado pra IA analisar, helpers de disassembly e utilitários que tornam inspeção, rotulação e curadoria de dataset suportáveis.

▸tokenizer.pyvocab:faketokens:20MOCK

entrada

tokens · 20

#0I0x0364#1_0x8F7F#2want0x112F#3_0x8F7F#4to0x4824#5_0x8F7F#6unde0x0E6D#7rsta0x0009#8nd0x61CF#9_0x8F7F#Awhy0x0E39#B_0x8F7F#Cthe0xB21C#D_0x8F7F#Eloss0x7B1A#F_0x8F7F#10is0x8F15#11_0x8F7F#12movi0xED30#13ng0x6362

attention (causal, self-attention head 0)

q╲k0123456789ABCDEF10111213

1#@

2++#

3.++*

4...+*

5 ..++

6 ..++

7 .++

8 ..+

9 ...+

A ...+

B ...+

C ....

D ...

E .+

F ....

10 ....

11 ..

12 ...

13 ...

passe o mouse para valores exatos

ESC