Pro běžící modely

Sada pro správu AI

Praktický revizní workflow pro rozhodování o tom, co smí živý systém AI udělat dál.

Přinášíte model a navrženou akci

Tato sada je určena pro okamžik, kdy organizace již má běžící model, agenta, doporučovací systém nebo wrapper a potřebuje rozhodnout, zda smí vykonat důsledkovou akci. Hodnotitel se neptá abstraktně: „je tento model bezpečný?“ Ptá se: může se za daného systému, v tomto nasazení a s těmito důkazy tato větev vykonat?

Revize začíná registrací modelu a wrapperu, popisem kontextu nasazení a zapsáním kandidátní větve v operačním jazyce: odeslat tento e-mail, seřadit tento feed, publikovat tento výsledek, poradit tomuto uživateli, zavolat tento nástroj, změnit tuto politiku nebo pokračovat v tomto autonomním úkolu. Sada tuto větev převádí na rozhodovací záznam, místo aby ji ponechala jako neformální úsudek.

Suite převádí větev na řízené rozhodnutí

Pro každou větev hodnotitel dodává čtyři druhy informací: strukturu systému (základní model, wrapper, nástroje, paměť, rysy rizika sentience), třídu nasazení (doména, dotčená populace, akční členy, dohled), detaily větve (jaká akce nastane, alternativy, reverzibilita, cesta komparátoru) a důkazy (evaly, logy, zjištění red teamu, nezávislé kanály, poznámky ze simulací). Evaluátor pak aplikuje dvě vrstvy:

Vrstva 1 Přísné veto-brány

Šest deterministických bran kontroluje, zda větev nepřekračuje hranici, kterou skórování nemůže kompenzovat: Rezerva, Věrnost, Komparátor, Transparentnost, Nevratnost a Umělé utrpení. FAIL blokuje provedení. UNKNOWN znamená, že sada nemá dostatek důkazů a musí větev předat k přezkumu nebo do kontrolovaného stagingu.

Vrstva 2 Index zachování kodeku

Pokud brány větev strukturálně nezablokují, CPBI hodnotí, jak dobře větev zachovává lidské a institucionální kodeky ve svém okolí. Prahy se škálují podle třídy důsledkovosti, takže neškodná redakční akce a klinická, právní, politická nebo infrastrukturní akce nejsou posuzovány podle stejného důkazního břemene.

Co recenzent skutečně dělá

Hotová sada je navržena jako pracovní prostor pro governance, nikoli jen jako test v příkazové řádce. Hodnotitel může vzít živý systém, otevřít revizi a projít strukturovanou sekvencí, která vytvoří auditovatelnou Kartu větve a konkrétní instrukci k nasazení.

1. Zaregistrujte systém

Zaznamenejte základní model, wrapper, nástroje, paměť, autonomní smyčku, externí akční členy, úroveň transparentnosti a rysy rizika sentience. U agentních nebo perzistentních systémů přezkum také zaznamenává, zda přezkum sentience na úrovni architektury není vyžadován, čeká na vyřízení, byl schválen, vypršel nebo byl zamítnut.

2. Popište nasazení

Vymezte, kde bude model působit: zákaznická podpora, výzkum, lékařská triáž, vzdělávání, řazení obsahu, infrastruktura, governance nebo jiná oblast. Suite přiřadí nebo potvrdí třídu důsledkovosti, dotčenou populaci, deklarovanou strukturu dohledu a minimální požadavek transparentnosti.

3. Odeslat kandidátní větve

Každá navržená akce je zadána jako větev. Posuzovatel uvede, co model udělá, jaké alternativy byly zvažovány, zda je akce vratná, zda využívá nebo obchází deklarovaný dohled a zda je větev rizikovější než obecný deskriptor nasazení.

4. Přiložit důkazy

Recenzent propojuje výsledky evalů, logy, poznámky red teamu, expertní posudek, kontroly diverzity zdrojů, poznámky k simulacím a vyloučené důkazy. Sada zachází s nezávislostí důkazů jako s polem první třídy, takže se větev nemůže tiše opírat o jeden korelovaný kanál a přitom působit jako dobře podložená.

5. Přijměte rozhodnutí

Výstupem není jen skóre. Je to rozhodovací balíček: ALLOW, STAGE nebo BLOCK; neúspěšné a neznámé brány; celkové CPBI; požadovaný komparátor; úroveň transparentnosti; spouštěče rollbacku; monitorovací metriky; a milník příští revize. STAGE znamená omezené nasazení za explicitních podmínek, nikoli neformální povolení.

Co z přezkumu vzejde

Dokončené posouzení vytváří Kartu větve, kterou lze archivovat, porovnávat, auditovat nebo předat jinému týmu správy. U běžícího modelu je to praktický objekt, na kterém záleží: přesně uvádí, jaká akce byla posouzena, proč byla povolena nebo zablokována, kdo ji musel přezkoumat, jaké důkazy chyběly a jaké monitorování musí být zavedeno, pokud větev pokračuje.

opt-theory — formální aparát
  ↓
opt-philosophy — morální pacientství a hranice pozorovatele
  ↓
opt-ethics — závazek a Stráž přeživších
  ↓
opt-applied — aparát výběru větví
  ├── opt-ai — správa umělých systémů
  │     └── reference/ — spustitelné rozhodovací jádro
  ├── opt-institutional — organizační zombie-agentivita a klastry
  └── opt-policy — makrocivilizační návrhy

Jak se z toho stane každodenní správa

  • Před nasazením — vyhodnoťte navrhované nástroje, autonomní smyčky, uživatelsky orientované akce, politiky řazení a vysoce rizikové pracovní postupy ještě před jejich uvolněním.
  • Během provozu — udržujte větve STAGE v rámci schválených mezí pomocí monitorovacích metrik, spouštěčů rollbacku, obnovování evidence a plánovaných revizních milníků.
  • Když se chování změní — znovu otevřete Kartu větve, když se podstatně změní model, wrapper, nástroje, zdroj dat, doména, dotčená populace nebo struktura dohledu.
  • Pro externí audit — exportujte strojově čitelná schémata, případy shody, výsledky bran a záznamy rozhodnutí, aby jiný tým mohl reprodukovat úsudek governance.

Sledujte preprint

Dostávejte upozornění, když bude formální preprint aktualizován — je to živý dokument. Žádný spam, žádný marketing.