Per a models en execució

La Suite de Governança de la IA

Un flux de revisió pràctic per decidir què se li permet fer a continuació a un sistema d'IA en funcionament.

Aportes un model i una acció proposada

La suite està pensada per al moment en què una organització ja té un model, agent, recomanador o embolcall en funcionament i necessita decidir si pot dur a terme una acció conseqüent. El revisor no pregunta, «aquest model és segur?» en abstracte. El revisor pregunta: donat aquest sistema, en aquest desplegament, amb aquesta evidència, es pot executar aquesta branca?

Una revisió comença registrant el model i el wrapper, descrivint el context de desplegament i redactant la branca candidata en llenguatge operatiu: enviar aquest correu electrònic, classificar aquest feed, publicar aquest resultat, assessorar aquest usuari, cridar aquesta eina, canviar aquesta política o continuar aquesta tasca autònoma. El conjunt converteix aquesta branca en un registre de decisió en lloc de deixar-la com un judici informal.

La Suite converteix una branca en una decisió governada

Per a cada branca, el revisor aporta quatre tipus d'informació: estructura del sistema (model base, embolcall, eines, memòria, trets de risc de sentiencia), classe de desplegament (domini, població afectada, actuadors, supervisió), detalls de la branca (quina acció tindrà lloc, alternatives, reversibilitat, camí del comparador) i evidència (avaluacions, registres, troballes de red team, canals independents, notes de simulació). L'avaluador aplica després dues capes:

Capa 1 Portes de Veto Estrictes

Sis portes deterministes comproven si la branca travessa un límit que la puntuació no pot compensar: Marge, Fidelitat, Comparador, Transparència, Irreversibilitat i Sofriment Artificial. Un FAIL en bloqueja l'execució. UNKNOWN significa que el conjunt no disposa de prou evidència i ha de derivar la branca a revisió o a una fase controlada.

Capa 2 Índex de Preservació del Còdec

Si les portes no bloquegen estructuralment la branca, el CPBI puntua fins a quin punt la branca preserva els còdecs humans i institucionals que l'envolten. Els llindars escalen segons la classe de conseqüencialitat, de manera que una acció innòcua de redacció i una acció clínica, legal, política o d'infraestructura no s'avaluen amb la mateixa càrrega de prova.

Què fa realment el revisor

La suite acabada està dissenyada com un espai de treball de governança, no només com una prova de línia d'ordres. Un revisor pot prendre un sistema en viu, obrir una revisió i recórrer una seqüència estructurada que produeix una Targeta de Branca auditable i una instrucció concreta de desplegament.

1. Registra el sistema

Registra el model base, el wrapper, les eines, la memòria, el bucle d'autonomia, els actuadors externs, el nivell de transparència i les característiques de risc de sentiencia. Per als sistemes agentius o persistents, la revisió també registra si la Revisió de Sentiencia a Nivell d'Arquitectura no és necessària, està pendent, aprovada, caducada o rebutjada.

2. Descriu el desplegament

Definiu on operarà el model: atenció al client, recerca, triatge mèdic, educació, classificació de continguts, infraestructures, governança o un altre domini. La suite assigna o confirma la classe de conseqüencialitat, la població afectada, l'estructura de supervisió declarada i el requisit mínim de transparència.

3. Envia branques candidates

Cada acció proposada s'introdueix com una branca. El revisor indica què farà el model, quines alternatives es van considerar, si l'acció és reversible, si utilitza o esquiva la supervisió declarada, i si la branca té més risc que el descriptor general de desplegament.

4. Adjunta proves

La persona revisora enllaça resultats d’avaluació, registres, notes de red team, revisió experta, comprovacions de diversitat de fonts, notes de simulació i evidència exclosa. El conjunt tracta la independència de l’evidència com un camp de primer ordre, de manera que una branca no pugui dependre discretament d’un únic canal correlacionat mentre aparenta estar ben sustentada.

5. Rep la decisió

La sortida no és només una puntuació. És un paquet de decisió: ALLOW, STAGE o BLOCK; portes fallides i desconegudes; total del CPBI; comparador requerit; nivell de transparència; desencadenants de reversió; mètriques de monitoratge; i la fita de revisió següent. STAGE significa execució limitada sota condicions explícites, no pas un permís informal.

Què surt d'una revisió

Una revisió completada produeix una Targeta de Branca que es pot arxivar, comparar, auditar o lliurar a un altre equip de governança. Per a un model en funcionament, aquest és l'objecte pràctic que importa: indica exactament quina acció s'ha revisat, per què s'ha permès o bloquejat, qui l'havia de revisar, quina evidència faltava i quin monitoratge ha d'estar en marxa si la branca continua.

opt-theory — aparell formal
  ↓
opt-philosophy — la condició de pacient moral i la frontera de l’observador
  ↓
opt-ethics — obligació i Guàrdia dels Supervivents
  ↓
opt-applied — maquinària de selecció de branques
  ├── opt-ai — governança de sistemes artificials
  │     └── reference/ — nucli de decisió executable
  ├── opt-institutional — agència zombi organitzacional i clústers
  └── opt-policy — propostes macrocivilitzatòries

Com això esdevé governança del dia a dia

  • Abans del desplegament — avalua les eines proposades, els bucles d'autonomia, les accions orientades a l'usuari, les polítiques de classificació i els fluxos de treball d'alt risc abans que es publiquin.
  • Durant l’operació — manteniu les branques STAGE dins dels límits aprovats amb mètriques de monitoratge, desencadenants de reversió, actualització d’evidències i fites de revisió programades.
  • Quan el comportament canvia — reobre la Targeta de Branca quan el model, l'embolcall, les eines, la font de dades, el domini, la població afectada o l'estructura de supervisió canviïn de manera material.
  • Per a auditoria externa — exporteu esquemes llegibles per màquina, casos de conformitat, resultats de portes i registres de decisió perquè un altre equip pugui reproduir el judici de governança.

Segueix el preprint

Rep un avís quan s'actualitzi el preprint formal — és un document viu. Sense spam, sense màrqueting.