चल रहे मॉडलों के लिए

AI शासन सूट

यह तय करने के लिए एक व्यावहारिक समीक्षा-कार्यप्रवाह कि किसी सक्रिय AI प्रणाली को आगे क्या करने की अनुमति दी जाए।

आप एक मॉडल और एक प्रस्तावित कार्रवाई लाते हैं

यह सूट उस स्थिति के लिए बनाया गया है जब किसी संगठन के पास पहले से एक चालू मॉडल, एजेंट, रिकमेंडर, या रैपर हो और उसे यह तय करना हो कि क्या वह कोई परिणामकारी कार्रवाई कर सकता है। समीक्षक अमूर्त रूप में यह नहीं पूछता, "क्या यह मॉडल सुरक्षित है?" समीक्षक पूछता है: इस प्रणाली, इस परिनियोजन, और इस साक्ष्य के आधार पर, क्या यह शाखा निष्पादित हो सकती है?

एक समीक्षा मॉडल और रैपर का पंजीकरण करने, परिनियोजन-संदर्भ का वर्णन करने, और प्रत्याशी शाखा को परिचालन भाषा में लिखने से शुरू होती है: यह ईमेल भेजें, इस फ़ीड को रैंक करें, यह परिणाम प्रकाशित करें, इस उपयोगकर्ता को सलाह दें, इस टूल को कॉल करें, इस नीति को बदलें, या इस स्वायत्त कार्य को जारी रखें। यह सूट उस शाखा को अनौपचारिक निर्णय के रूप में छोड़ने के बजाय एक निर्णय-अभिलेख में बदल देता है।

यह सूट एक शाखा को शासित निर्णय में रूपांतरित करता है

प्रत्येक शाखा के लिए, समीक्षक चार प्रकार की जानकारी देता है: प्रणाली संरचना (आधार मॉडल, रैपर, उपकरण, स्मृति, संवेदन-जोखिम विशेषताएँ), परिनियोजन वर्ग (डोमेन, प्रभावित जनसंख्या, एक्ट्यूएटर, पर्यवेक्षण), शाखा विवरण (क्या कार्रवाई होगी, विकल्प, प्रत्यावर्तनीयता, तुलनित्र पथ), और साक्ष्य (मूल्यांकन, लॉग, रेड-टीम निष्कर्ष, स्वतंत्र चैनल, सिमुलेशन टिप्पणियाँ)। इसके बाद मूल्यांकनकर्ता दो स्तर लागू करता है:

स्तर 1 कठोर वीटो गेट

छह नियतात्मक गेट यह जाँचते हैं कि क्या शाखा ऐसी सीमा पार करती है जिसकी भरपाई स्कोरिंग नहीं कर सकती: हेडरूम, निष्ठा, तुलनित्र, पारदर्शिता, अपरिवर्तनीयता और कृत्रिम पीड़ा। FAIL निष्पादन को रोक देता है। UNKNOWN का अर्थ है कि सूट के पास पर्याप्त साक्ष्य नहीं है और उसे शाखा को समीक्षा या नियंत्रित स्टेजिंग की ओर भेजना होगा।

परत 2 कोडेक-संरक्षण सूचकांक

यदि गेट संरचनात्मक रूप से शाखा को अवरुद्ध नहीं करते, तो CPBI यह अंकित करता है कि शाखा अपने आसपास के मानव और संस्थागत कोडेकों को कितनी अच्छी तरह संरक्षित करती है। सीमाएँ परिणामकारिता-वर्ग के अनुसार बदलती हैं, इसलिए कोई निरापद ड्राफ्टिंग कार्रवाई और कोई नैदानिक, कानूनी, राजनीतिक, या अवसंरचनात्मक कार्रवाई एक ही प्रमाण-भार से नहीं आँकी जाती।

समीक्षक वास्तव में क्या करता है

पूर्ण सूट को केवल कमांड-लाइन परीक्षण के रूप में नहीं, बल्कि एक शासन कार्यक्षेत्र के रूप में डिज़ाइन किया गया है। एक समीक्षक किसी सक्रिय प्रणाली को लेकर समीक्षा खोल सकता है, और एक संरचित क्रम से गुजर सकता है जो एक लेखापरीक्षण-योग्य शाखा कार्ड तथा एक ठोस परिनियोजन निर्देश उत्पन्न करता है।

1. प्रणाली पंजीकृत करें

आधार मॉडल, रैपर, टूल्स, मेमोरी, स्वायत्तता लूप, बाह्य एक्ट्यूएटर्स, पारदर्शिता स्तर, और संवेदनशीलता-जोखिम विशेषताओं को दर्ज करें। एजेंटिक या स्थायी प्रणालियों के लिए, समीक्षा यह भी दर्ज करती है कि Architecture-Level Sentience Review आवश्यक नहीं है, लंबित है, स्वीकृत है, समाप्त हो चुकी है, या अस्वीकृत है।

2. परिनियोजन का वर्णन करें

परिभाषित करें कि मॉडल कहाँ संचालित होगा: ग्राहक सहायता, अनुसंधान, चिकित्सीय ट्रायाज, शिक्षा, सामग्री रैंकिंग, अवसंरचना, शासन, या कोई अन्य क्षेत्र। सूट परिणाम-गंभीरता वर्ग, प्रभावित जनसंख्या, घोषित पर्यवेक्षण संरचना, और न्यूनतम पारदर्शिता आवश्यकता को निर्दिष्ट या पुष्ट करता है।

3. प्रत्याशी शाखाएँ जमा करें

प्रत्येक प्रस्तावित कार्रवाई को एक शाखा के रूप में दर्ज किया जाता है। समीक्षक बताता है कि मॉडल क्या करेगा, किन विकल्पों पर विचार किया गया, क्या कार्रवाई प्रतिवर्ती है, क्या वह घोषित निगरानी का उपयोग करती है या उसे बाइपास करती है, और क्या वह शाखा सामान्य परिनियोजन-वर्णनकर्ता की तुलना में अधिक दाँव वाली है।

4. साक्ष्य संलग्न करें

समीक्षक eval परिणामों, लॉगों, रेड-टीम टिप्पणियों, विशेषज्ञ समीक्षा, स्रोत-विविधता जाँच, सिमुलेशन टिप्पणियों और बहिष्कृत साक्ष्य को जोड़ता है। यह सूट साक्ष्य-स्वतंत्रता को एक प्रथम-श्रेणी क्षेत्र के रूप में मानता है, ताकि कोई शाखा ऊपर से अच्छी तरह समर्थित दिखते हुए भी चुपचाप किसी एक सहसंबद्ध चैनल पर निर्भर न रह सके।

5. निर्णय प्राप्त करें

आउटपुट केवल एक स्कोर नहीं है। यह एक निर्णय-पैकेज है: ALLOW, STAGE, या BLOCK; विफल और अज्ञात गेट; CPBI कुल; आवश्यक तुलनित्र; पारदर्शिता स्तर; रोलबैक ट्रिगर; निगरानी मेट्रिक्स; और अगला समीक्षा-मील का पत्थर। STAGE का अर्थ है स्पष्ट शर्तों के अंतर्गत सीमित निष्पादन, न कि अनौपचारिक अनुमति।

समीक्षा से क्या निकलता है

एक पूर्ण समीक्षा एक शाखा कार्ड उत्पन्न करती है जिसे संग्रहित, तुलना, ऑडिट या किसी अन्य शासन-टीम को सौंपा जा सकता है। एक चालू मॉडल के लिए यही वह व्यावहारिक वस्तु है जो मायने रखती है: यह ठीक-ठीक बताती है कि किस कार्रवाई की समीक्षा हुई, उसे क्यों अनुमति दी गई या रोका गया, किसे उसकी समीक्षा करनी थी, कौन-सा साक्ष्य अनुपस्थित था, और यदि शाखा आगे बढ़ती है तो कौन-सी निगरानी व्यवस्था लागू होनी चाहिए।

opt-theory — औपचारिक तंत्र
  ↓
opt-philosophy — नैतिक रोगीत्व और प्रेक्षक सीमा
  ↓
opt-ethics — दायित्व और उत्तरजीवियों की पहरेदारी
  ↓
opt-applied — शाखा चयन तंत्र
  ├── opt-ai — कृत्रिम प्रणालियों का शासन
  │     └── reference/ — निष्पादनयोग्य निर्णय कोर
  ├── opt-institutional — संगठनात्मक ज़ॉम्बी एजेंसी और क्लस्टर
  └── opt-policy — व्यापक सभ्यतागत प्रस्ताव

यह दैनिक शासन में कैसे रूपांतरित होता है

  • परिनियोजन से पहले — प्रस्तावित टूल्स, स्वायत्तता लूप, उपयोगकर्ता-सामना करने वाली क्रियाएँ, रैंकिंग नीतियाँ, और उच्च-दांव कार्यप्रवाहों का मूल्यांकन उनके जारी होने से पहले करें।
  • संचालन के दौरान — STAGE शाखाओं को स्वीकृत सीमाओं के भीतर रखें, निगरानी मेट्रिक्स, रोलबैक ट्रिगर्स, साक्ष्य-रीफ़्रेश, और निर्धारित समीक्षा माइलस्टोन्स के साथ।
  • जब व्यवहार बदलता है — जब मॉडल, रैपर, उपकरण, डेटा स्रोत, डोमेन, प्रभावित जनसंख्या, या पर्यवेक्षण संरचना में सार्थक परिवर्तन हो, तो शाखा कार्ड को पुनः खोलें।
  • बाह्य ऑडिट के लिए — मशीन-पठनीय स्कीमा, अनुरूपता-प्रकरण, गेट परिणाम, और निर्णय अभिलेख निर्यात करें ताकि दूसरी टीम शासन-निर्णय का पुनरुत्पादन कर सके।

प्रीप्रिंट का अनुसरण करें

औपचारिक प्रीप्रिंट के अद्यतन होने पर सूचना प्राप्त करें — यह एक जीवित दस्तावेज़ है। न स्पैम, न विपणन।