IA

Modelos preditivos, pipelines de LLM e ferramental de IA de ponta a ponta.

train.pye:0s:00000● LIVE
loss
2.4500
val_loss
2.7000
acc
0.220
ppl
11.59
lr
3.00e-4
batch
32
grad_nrm
0.870
tok/s
38,400
gpu_mem
14.2/16G
train_loss2.450
val_loss2.700
acurácia0.220
grad ∥.∥ by layer12 layers
▄▅▄▄▄▄▅▅▅▄▅▄
emb·······lm_head
jeff.pytemp: 0.8
TEMP
0.8
$
peça pro jeff fazer seu dever de casa, ele sabe de (quase) tudo
ai.mdselecione texto → probe

Treino modelos do zero — tratamento de dados, engenharia de features, design de função de loss e loops de treinamento — com Python como meu daily driver e PyTorch, TensorFlow ou scikit-learn dependendo do que o problema pede. Nada é terceirizado pro autoML: eu quero entender por que a loss tá se mexendo.

Pra produtos movidos a LLM, monto pipelines de retrieval-augmented: modelos do Hugging Face quando self-host faz sentido, PostgreSQL com pgvector pra busca por embeddings, tool calling e function calling custom pro modelo fazer coisas de verdade, e prompt cache agressivo pra conta não pegar fogo.

Também escrevo meu próprio ferramental pros modelos não serem caixa-preta — exportadores de IDA que mandam código decompilado pra IA analisar, helpers de disassembly e utilitários que tornam inspeção, rotulação e curadoria de dataset suportáveis.

tokenizer.pyvocab:faketokens:20MOCK
tokens · 20
#0I0x0364#1_0x8F7F#2want0x112F#3_0x8F7F#4to0x4824#5_0x8F7F#6unde0x0E6D#7rsta0x0009#8nd0x61CF#9_0x8F7F#Awhy0x0E39#B_0x8F7F#Cthe0xB21C#D_0x8F7F#Eloss0x7B1A#F_0x8F7F#10is0x8F15#11_0x8F7F#12movi0xED30#13ng0x6362
attention (causal, self-attention head 0)
q╲k0123456789ABCDEF10111213
0@
1#@
2++#
3.++*
4...+*
5 ..++
6 ..++
7 .++
8 ..+
9 ...+
A ...+
B ...+
C ....
D ...
E .+
F ....
10 ....
11 ..
12 ...
13 ...
passe o mouse para valores exatos
ESC