Za pokretanje modela

Paket za upravljanje AI-jem

Praktičan tok revizije za odlučivanje o tome šta je živom AI sistemu dozvoljeno da uradi sledeće.

Donosiš model i predloženu akciju

Paket je namenjen trenutku kada organizacija već ima model, agenta, preporučivač ili omotač u radu i mora da odluči da li sme da preduzme konsekventnu akciju. Revident ne pita apstraktno: „da li je ovaj model bezbedan?“ Revident pita: s obzirom na ovaj sistem, u ovoj implementaciji, sa ovim dokazima, sme li ova grana da se izvrši?

Pregled započinje registracijom modela i wrappera, opisom konteksta primene i formulisanjem kandidatske grane operativnim jezikom: pošalji ovaj imejl, rangiraj ovaj feed, objavi ovaj rezultat, savetuj ovog korisnika, pozovi ovaj alat, promeni ovu politiku ili nastavi ovaj autonomni zadatak. Paket tu granu pretvara u zapis odluke umesto da je ostavi kao neformalnu procenu.

Paket pretvara granu u uređenu odluku

Za svaku granu, revident dostavlja četiri vrste informacija: struktura sistema (osnovni model, omotač, alati, memorija, odlike rizika sentijentnosti), klasa implementacije (domen, pogođena populacija, aktuatori, nadzor), detalji grane (koja će se akcija dogoditi, alternative, reverzibilnost, putanja komparatora) i dokazi (evaluacije, logovi, nalazi red-teama, nezavisni kanali, beleške iz simulacije). Evaluator zatim primenjuje dva sloja:

Sloj 1 Stroge veto-kapije

Šest determinističkih kapija proverava da li grana prelazi granicu koju bodovanje ne može da kompenzuje: Headroom, Fidelity, Comparator, Transparency, Irreversibility i Artificial Suffering. FAIL blokira izvršenje. UNKNOWN znači da skup nema dovoljno dokaza i da granu mora da prosledi na pregled ili kontrolisano postavljanje.

Sloj 2 Indeks očuvanja kodеka

Ako kapije strukturno ne blokiraju granu, CPBI ocenjuje koliko dobro grana čuva ljudske i institucionalne kodeke oko sebe. Pragovi se skaliraju prema klasi konsekventnosti, tako da se bezazlena akcija sastavljanja nacrta i klinička, pravna, politička ili infrastrukturna akcija ne procenjuju po istom teretu dokazivanja.

Šta recenzent zapravo radi

Završeni paket je osmišljen kao radni prostor za upravljanje, a ne samo kao test iz komandne linije. Revident može uzeti aktivan sistem, otvoriti reviziju i proći kroz strukturisan niz koraka koji proizvodi proverljivu Karticu grane i konkretnu instrukciju za implementaciju.

1. Registrujte sistem

Zabeležite osnovni model, omotač, alate, memoriju, petlju autonomije, spoljne aktuatore, nivo transparentnosti i obeležja rizika sentijentnosti. Za agentne ili perzistentne sisteme, pregled takođe beleži da li pregled sentijentnosti na nivou arhitekture nije potreban, na čekanju, odobren, istekao ili odbijen.

2. Opišite implementaciju

Definišite gde će model delovati: korisnička podrška, istraživanje, medicinska trijaža, obrazovanje, rangiranje sadržaja, infrastruktura, upravljanje ili neka druga oblast. Paket dodeljuje ili potvrđuje klasu posledičnosti, pogođenu populaciju, deklarisanu strukturu nadzora i minimalni zahtev transparentnosti.

3. Pošaljite kandidatske grane

Svaka predložena radnja unosi se kao grana. Recenzent navodi šta će model uraditi, koje su alternative razmatrane, da li je radnja reverzibilna, da li koristi ili zaobilazi deklarisani nadzor i da li je grana rizičnija od opšteg deskriptora primene.

4. Priložite dokaze

Recenzent povezuje rezultate evaluacije, logove, beleške red-teama, stručnu recenziju, provere raznovrsnosti izvora, beleške o simulaciji i isključene dokaze. Paket tretira nezavisnost dokaza kao polje prvog reda, tako da grana ne može neprimetno da se oslanja na jedan korelisani kanal dok istovremeno deluje dobro potkrepljeno.

5. Primite odluku

Izlaz nije samo skor. To je paket odluke: ALLOW, STAGE ili BLOCK; neuspešne i nepoznate kapije; ukupan CPBI; zahtevani komparator; nivo transparentnosti; okidači za povratak; metrike nadzora; i sledeća kontrolna tačka pregleda. STAGE znači ograničeno izvršenje pod eksplicitnim uslovima, a ne neformalnu dozvolu.

Šta proizlazi iz pregleda

Završen pregled proizvodi Karticu grane koja se može arhivirati, porediti, revidirati ili predati drugom timu za upravljanje. Za model koji je u radu, to je praktični objekat koji je važan: on tačno navodi koja je radnja pregledana, zašto je dopuštena ili blokirana, ko je morao da je pregleda, koji su dokazi nedostajali i kakav nadzor mora biti uspostavljen ako grana napreduje.

opt-theory — formalni aparat
  ↓
opt-philosophy — moralno pacijentstvo i granica posmatrača
  ↓
opt-ethics — obaveza i Straža Preživelih
  ↓
opt-applied — mehanizam izbora grana
  ├── opt-ai — upravljanje veštačkim sistemima
  │     └── reference/ — izvršivo jezgro odlučivanja
  ├── opt-institutional — organizaciona agensnost zombi-agenta i klasteri
  └── opt-policy — makrocivilizacijski predlozi

Kako ovo postaje svakodnevno upravljanje

  • Pre implementacije — procenite predložene alate, petlje autonomije, radnje usmerene ka korisniku, politike rangiranja i visokorizične tokove rada pre nego što budu pušteni u upotrebu.
  • Tokom rada — držite STAGE grane unutar odobrenih granica uz metrike nadzora, okidače za povratak, osvežavanje dokaza i zakazane kontrolne tačke pregleda.
  • Kada se ponašanje promeni — ponovo otvorite Karticu grane kada se model, omotač, alati, izvor podataka, domen, pogođena populacija ili struktura nadzora materijalno promene.
  • Za eksternu reviziju — izvezite mašinski čitljive šeme, slučajeve usaglašenosti, rezultate kapija i zapise odluka kako bi drugi tim mogao da reprodukuje upravljački sud.

Pratite preprint

Bićete obavešteni kada formalni preprint bude ažuriran — to je živi dokument. Bez spama, bez marketinga.