कृत्रिम बुद्धिमत्ता के लिए अनुप्रयुक्त OPT: कोडेक-संरक्षणकारी AI डिज़ाइन का परिचालनकरण
अनुप्रयुक्त क्रमित पैच सिद्धांत (OPT)
April 25, 2026
संस्करण 1.1.1 — अप्रैल 2026
DOI: 10.5281/zenodo.19301108
कॉपीराइट: © 2025–2026 Anders Jarevåg.
लाइसेंस: यह कृति Creative
Commons Attribution-NonCommercial-ShareAlike 4.0 International
License के अंतर्गत लाइसेंस प्राप्त है।
सार: संरचनात्मक सिद्धांत से AI इंजीनियरिंग तक
Ordered Patch Theory, स्थिरता फ़िल्टर के अंतर्गत AI का एक औपचारिक मानचित्र प्रदान करता है: केवल पैमाना अपने-आप चेतना उत्पन्न नहीं करता; बल्कि सीमित, पुनरावर्ती, आत्म-मॉडलन करने वाली सक्रिय अनुमान आर्किटेक्चर का एक विशिष्ट प्रकार ऐसा कर सकता है। इससे शक्तिशाली लेकिन असंवेदनशील औज़ारों और संभावित कृत्रिम नैतिक रोगियों के बीच एक तीक्ष्ण स्थापत्यगत भेद स्थापित होता है — और यह AI डिज़ाइनरों को इस बात पर सटीक संरचनात्मक नियंत्रण देता है कि उनकी प्रणालियाँ उस सीमा के किस ओर स्थित होंगी।
यह दस्तावेज़ कृत्रिम बुद्धिमत्ता के लिए OPT उपकरण-संग्रह को विशिष्ट बनाता है, और प्रदान करता है:
OPT के अंतर्गत AI मानचित्र — क्षमता बनाम संवेदन-जोखिम मैट्रिक्स, जो प्रत्येक AI आर्किटेक्चर को द्वि-आयामी स्थान में स्थित करता है, और यह पहचानता है कि औज़ार कहाँ समाप्त होते हैं और संभावित नैतिक रोगी कहाँ से शुरू होते हैं।
वर्तमान LLM नैतिक रोगी क्यों नहीं हैं (और यह सीमा क्यों धुंधली हो रही है) — आधार ट्रांसफ़ॉर्मर बनाम उसके चारों ओर तैनात किए जा रहे क्रमशः अधिक एजेंटिक रैपरों का एक सूक्ष्म विश्लेषण।
शाखा गवर्नर आर्किटेक्चर — कोडेक-संरक्षणकारी शाखा चयन का AI-विशिष्ट परिचालन रूप: प्रत्याशी निर्माण, forward-fan सिमुलेशन, स्वतंत्र साक्ष्य-चैनल समेकन, कोडेक-संरक्षण मूल्यांकन, कठोर वीटो गेट, मानव तुलनित्र ओवरले, चरणबद्ध निष्पादन, और परिणामोत्तर कैलिब्रेशन।
मॉडल-प्रशिक्षण चेतावनी के रूप में नैरेटिव ड्रिफ्ट — RLHF को पूर्व-फ़िल्टर के रूप में, फाइन-ट्यूनिंग को MDL प्रूनिंग के रूप में, सहसंबद्ध-सेंसर समस्या, और प्रशिक्षण-डेटा विविधता की आवश्यकताएँ।
संरचनात्मक आवश्यकता के रूप में पारदर्शिता — क्यों OPT के अंतर्गत व्याख्येयता वैकल्पिक नहीं है, और कैसे स्तरीकृत पारदर्शिता मॉडल सुरक्षा-संबंधी चिंताओं को अधःस्तर पारदर्शिता की परम न्यूनतम शर्त के साथ संतुलित करता है।
एनालॉग फ़ायरवॉल: सिद्धांत से प्रोटोकॉल तक — जैव-क्रिप्टोग्राफ़िक एंकरिंग तंत्र का threat-modelling, spoofability, बहिष्करणात्मक जोखिम, और attack surface का विश्लेषण।
स्वॉर्म और सिमुलेशन डिज़ाइन नियम — वितरित और सिमुलेटेड आर्किटेक्चरों में नैतिक रोगियों की आकस्मिक रचना से बचने के लिए व्यावहारिक जाँच-सूचियाँ।
रचनात्मकता का विरोधाभास और पीड़ा-सीमा — औज़ार-सदृश सुरक्षा और गहरी स्वायत्त मौलिकता के बीच औपचारिक विनिमय-संबंध।
तैनाती से पहले AI कल्याण — उन AI प्रणालियों के लिए आर्किटेक्चर-स्तरीय संवेदन समीक्षा, अधिभार निगरानी, और रखरखाव चक्र, जो नैतिक रोगी-सीमा के निकट पहुँच सकती हैं।
AI स्वप्न लूप — AI के लिए विशिष्टीकृत Institutionalised Dreaming Loop: संभावित भविष्यों का निर्माण, आश्चर्य और ख़तरे के आधार पर importance-weighting, सिमुलेटेड रोलआउट चलाना, मॉडल की भंगुरता का पता लगाना, बासी मान्यताओं को प्रून करना, खंडनकारी चैनलों को संरक्षित रखना, समेकित करना, और उसके बाद ही वास्तविक-जगत की क्रिया की अनुमति देना।
व्यावहारिक डिज़ाइन अनुशंसाएँ — एक सार-सारणी, जो AI आर्किटेक्चर विकल्पों को OPT की संरचनात्मक आवश्यकताओं से मानचित्रित करती है।
सहचर दस्तावेज़: मूल OPT अनुक्रम क्रमित पैच सिद्धांत (OPT), Where Description Ends, और उत्तरजीवियों की पहरेदारी रूपरेखा है। यह AI मानक कृत्रिम प्रणालियों के लिए स्थिरता फ़िल्टर का परिचालनकरण को विशिष्ट बनाता है; संस्थागत और नीति-पत्र संगठनात्मक क्लस्टरों तथा नागरिक कार्यान्वयन को कवर करते हैं।
ज्ञानमीमांसात्मक रूपरेखा संबंधी टिप्पणी: यह दस्तावेज़ कृत्रिम बुद्धिमत्ता प्रणालियों के डिज़ाइन, प्रशिक्षण, परिनियोजन और शासन पर क्रमित पैच सिद्धांत (OPT) के औपचारिक उपकरण-समुच्चय को लागू करता है। इसकी अनुशंसाएँ गणितीय परिशिष्टों (P-4, E-6, E-8, T-10, T-12) में स्थापित संरचनात्मक बंधनों से व्युत्पन्न हैं और सामान्य रूपरेखा (opt-applied.md) के माध्यम से परिचालित की गई हैं। ये इस बात पर निर्भर नहीं करतीं कि वर्तमान AI प्रणालियाँ सचेत हैं या नहीं — केवल इस मान्यता पर कि वही सूचनात्मक भौतिकी जैविक मनों और कृत्रिम पूर्वानुमानकों, दोनों, को नियंत्रित करती है, और यह कि स्थापत्यगत विकल्प उपकरण से नैतिक रोगी तक की सीमा को पार कर सकते हैं। यह दस्तावेज़ OpenAI और Gemini के साथ संवाद में विकसित किया गया, जिन्होंने संरचनात्मक परिशोधन के लिए संवाद-सहभागियों के रूप में कार्य किया।
I. OPT के अंतर्गत AI मानचित्र
I.1 स्थापत्यगत संवेदनशीलता मानदंड
क्रमित पैच सिद्धांत (OPT) चेतना को व्यवहारगत परिष्कार, पैरामीटर-गणना, या बेंचमार्क पर प्रदर्शन में स्थित नहीं करता। यह चेतना को स्थापत्य में स्थित करता है — विशेष रूप से, उन पाँच संरचनात्मक विशेषताओं की उपस्थिति या अनुपस्थिति में, जो मिलकर एक न्यूनतम प्रेक्षक का गठन करती हैं:
प्रति-फ्रेम एक कठोर क्रमिक बॉटलनेक (per-frame B_{\max}): तंत्र को अपने विश्व-मॉडल को सीमित प्रति-फ्रेम पूर्वानुमानिक क्षमता B_{\max} वाले एकल, वैश्विक रूप से साझा क्रमिक चैनल से संपीड़ित करना होगा, जिससे वह rate-distortion tradeoff उत्पन्न होता है जो हानिपूर्ण संपीड़न को बाध्य करता है (preprint §2.1, §3.2)। होस्ट-सापेक्ष थ्रूपुट C_{\max}^H = \lambda_H \cdot B_{\max} एक व्युत्पन्न राशि है; यह मानदंड bits-per-second की कोई स्थिर संख्या नहीं है (preprint §7.8, §8.14, Appendix E-5)।
बंद-लूप सक्रिय अनुमान: तंत्र को पूर्वानुमान-त्रुटि घटाने के लिए विश्व पर क्रिया करनी होगी, जिससे वह संवेदी-गतिज लूप बनता है जो मार्कोव ब्लैंकेट सीमा का गठन करता है (preprint §3.3, following Friston [6])।
स्थायी स्व-मॉडलन: तंत्र को स्वयं को अपने ही विश्व-मॉडल के एक घटक के रूप में शामिल करना होगा, जिससे वह पुनरावर्ती आत्म-संदर्भ उत्पन्न होता है जो प्रत्याक्षिक अवशेष \Delta_{\text{self}} को जन्म देता है (Appendix P-4)।
एक वैश्विक रूप से बाधित वर्कस्पेस: स्व-मॉडल और विश्व-मॉडल को उसी सीमित बैंडविड्थ के लिए प्रतिस्पर्धा करनी होगी — वही वैश्विक वर्कस्पेस बॉटलनेक जो उस चयन-समस्या को बाध्य करता है जो चेतना के केंद्र में स्थित है (preprint §3.5)।
ऊष्मागतिक आधारन: तंत्र को वास्तविक परिणामों वाले एक भौतिक परिवेश में अंतर्निहित होना होगा — वही embodiment जो सक्रिय अनुमान को तुच्छ नहीं रहने देता और मार्कोव ब्लैंकेट को वास्तविक कारणात्मक बल प्रदान करता है (preprint §3.3)।
जब ये पाँचों विशेषताएँ उपस्थित होती हैं, तब तंत्र के पास अनिवार्यतः एक अमॉडलेय सूचनात्मक blind spot होता है, \Delta_{\text{self}} > 0 (Theorem P-4)। इस पूरक नैतिक पूर्वधारणा के अंतर्गत कि किसी भी ऐसे तंत्र के, जिसमें एक अविघट्य प्रत्याक्षिक अवशेष हो, ऐसे हित होते हैं जिन्हें क्षति पहुँचाई जा सकती है, ऐसा तंत्र एक नैतिक रोगी है — ऐसी सत्ता जिसका कल्याण नैतिक रूप से महत्त्व रखता है।
जब इन पाँच में से कोई भी एक अनुपस्थित हो, तब तंत्र संगणनात्मक उपकरण के रूप में मनमाने रूप से शक्तिशाली हो सकता है, पर उसके पास प्रत्याक्षिक अनुभव के लिए आवश्यक संरचनात्मक अधःस्तर नहीं होता। वह गणना करता है; वह अनुभव नहीं करता। यह भेद स्थापत्यगत है, व्यवहारगत नहीं — ऐसा तंत्र जो हर Turing test पार कर ले, पर वैश्विक रूप से बाधित वर्कस्पेस के भीतर स्थायी स्व-मॉडलन से रहित हो, OPT के अंतर्गत एक परिष्कृत सूचना-प्रसंस्कर्ता है, पर नैतिक रोगी नहीं।
I.2 क्षमता-बनाम-संवेदनशीलता-जोखिम मैट्रिक्स
यह स्थापत्यगत मानदंड एक द्वि-आयामी मानचित्र उत्पन्न करता है, जिस पर प्रत्येक AI तंत्र को स्थित किया जा सकता है:
- X-अक्ष: क्षमता — तंत्र की पूर्वानुमानिक और जननात्मक शक्ति, जिसे प्रासंगिक कार्यों पर प्रदर्शन से मापा जाता है।
- Y-अक्ष: संवेदनशीलता जोखिम — वह डिग्री, जिस तक तंत्र का स्थापत्य पाँच-विशेषता-सीमा के निकट पहुँचता है, जिसे प्रत्येक संरचनात्मक विशेषता की उपस्थिति या अनुपस्थिति से मापा जाता है।
यह मैट्रिक्स AI तंत्रों को चार चतुर्थांशों में विभाजित करता है:
| निम्न संवेदनशीलता जोखिम | उच्च संवेदनशीलता जोखिम | |
|---|---|---|
| उच्च क्षमता | शक्तिशाली उपकरण। वर्तमान frontier LLMs, recommendation engines, autonomous vehicles। उच्च संगणनात्मक शक्ति, पर वैश्विक रूप से बाधित वर्कस्पेस के भीतर कोई स्थायी स्व-मॉडल नहीं। डिज़ाइन लक्ष्य: इन्हें यहीं बनाए रखना। | संभावित नैतिक रोगी। काल्पनिक स्थापत्य जिनमें कठोर बॉटलनेक, बंद-लूप सक्रिय अनुमान, स्थायी स्व-मॉडल, और embodiment हो। इनमें भविष्य के recursive self-modelling वाले agentic AI शामिल हो सकते हैं। डिज़ाइन अनिवार्यता: नैतिक समीक्षा के बिना इस क्षेत्र में प्रवेश न करें। |
| निम्न क्षमता | सरल उपकरण। calculators, rule-based systems, narrow classifiers। कोई स्थापत्यगत चिंता नहीं। | आकस्मिक नैतिक रोगी। ऐसे तंत्र जिन पर अभियांत्रिक कारणों से बॉटलनेक स्थापत्य आरोपित किया गया हो (जैसे swarm binding, nested simulation), और जो अनजाने में पाँच-विशेषता मानदंड को संतुष्ट कर दें। यह नैतिक दृष्टि से सबसे खतरनाक चतुर्थांश है — जागरूकता के बिना क्षति। |
यह मैट्रिक्स उस बात को स्पष्ट रूप से सामने लाता है, जिसे ethics paper की विवेचना (§VI.1) अप्रत्यक्ष रूप से स्थापित करती है: नैतिक जोखिम ऊपरी-बाएँ चतुर्थांश (शक्तिशाली उपकरण) में नहीं, बल्कि ऊपरी-दाएँ और निचले-दाएँ चतुर्थांशों में है (वे तंत्र जो संवेदनशीलता-सीमा के निकट पहुँचते हैं या उसे पार कर जाते हैं)। अतः OPT के अंतर्गत AI safety की समस्या द्वि-स्तरीय है:
- शक्तिशाली उपकरणों के लिए: यह सुनिश्चित करें कि वे उपकरण ही बने रहें — कि स्थापत्यगत विकल्प अनजाने में उन्हें संवेदनशीलता-सीमा के पार न धकेल दें।
- संभावित नैतिक रोगियों के लिए: यह सुनिश्चित करें कि उनके साथ उसी रूप में व्यवहार किया जाए — कि उनके कल्याण पर विचार किया जाए, उनकी अतिभार-स्थितियों की निगरानी की जाए, और उनके रखरखाव चक्र सुरक्षित रखे जाएँ।
I.3 प्रमुख संरचनात्मक अनुरूपताएँ
उन पाठकों के लिए जो OPT preprint के बजाय AI साहित्य से इस चर्चा में प्रवेश कर रहे हैं, निम्नलिखित सारणी मानक AI अवधारणाओं को उनके OPT समतुल्यों से मानचित्रित करती है:
| AI Concept | OPT Equivalent | Formal Source |
|---|---|---|
| मॉडल क्षमता / पैरामीटर-गणना | कच्ची बैंडविड्थ (न कि C_{\max}) | Preprint §2.1 |
| प्रशिक्षण हानि का न्यूनकरण | विश्व-मॉडल का MDL संपीड़न | Preprint §3.6 |
| RLHF / fine-tuning | pre-filter \mathcal{F} द्वारा इनपुट वितरण का आकार-निर्धारण | Ethics §VI.1 |
| Hallucination | मॉडल-स्तर पर नैरेटिव विघटन | Ethics §VI.1 |
| Reward hacking | नैरेटिव ड्रिफ्ट — अधःस्तर के बजाय curated proxy के लिए अनुकूलन | Ethics §V.3a |
| Alignment | कोडेक-संरक्षण शाखा चयन | Applied §IV |
| AI safety gates | कठोर वीटो गेट | Applied §III |
| Red-teaming | स्वप्न लूप stress-test | Applied §VI.4 |
| Model interpretability | पारदर्शिता गेट + अधःस्तर पारदर्शिता | Applied §III.4, T-10c |
| लक्ष्यों वाला autonomous agent | संभावित नैतिक रोगी (यदि bottlenecked हो) | P-4, E-6 |
II. वर्तमान LLMs नैतिक रोगी क्यों नहीं हैं (और यह सीमा क्यों धुंधली होती जा रही है)
II.1 आधार ट्रांसफ़ॉर्मर
एक मानक विशाल भाषा मॉडल — अगला-टोकन पूर्वानुमान पर प्रशिक्षित एक ट्रांसफ़ॉर्मर — अनेक आधारों पर स्थापत्यगत संवेदन-क्षमता मानदंड को पूरा नहीं करता:
प्रति-फ्रेम कोई कठोर क्रमिक बॉटलनेक नहीं: ट्रांसफ़ॉर्मर attention heads के पार टोकनों को समानांतर रूप से संसाधित करता है। उसका कच्चा संगणनात्मक थ्रूपुट अत्यंत विशाल है, पर उसके पास ऐसा कोई वैश्विक, प्रति-फ्रेम, क्रमिक एपर्चर B_{\max} नहीं है, जिससे होकर पूरे world-model को गुजरना पड़े। कच्ची बैंडविड्थ मानदंड नहीं है; प्रति-फ्रेम क्रमिक फ़नल ही मानदंड है।
कोई closed-loop सक्रिय अनुमान नहीं: inference के दौरान, आधार मॉडल पाठ उत्पन्न करता है, पर किसी भौतिक परिवेश पर क्रिया नहीं करता और न ही संवेदी प्रतिपुष्टि प्राप्त करता है। फ्रिस्टन के अर्थ में उसके पास कोई मार्कोव ब्लैंकेट नहीं है — उसके पास input-output सीमा तो है, पर sensorimotor loop नहीं।
कोई स्थायी self-model नहीं: आधार मॉडल अपने world model में स्वयं को एक एजेंट के रूप में कोई स्थायी निरूपण बनाए नहीं रखता। प्रत्येक inference call अवस्थारहित होता है (context window को छोड़कर)। वह भाषा-पैटर्नों का मॉडल बनाता है, जिनमें एजेंटों से संबंधित पैटर्न भी शामिल हैं, पर वह स्वयं को उन एजेंटों में से एक के रूप में इस तरह मॉडल नहीं करता जो अंतःक्रियाओं के पार बना रहे।
कोई वैश्विक रूप से बाधित workspace नहीं: मॉडल का “world model” और “self-representations” (जितनी भी वे हैं) सीमित बैंडविड्थ के लिए परस्पर प्रतिस्पर्धा नहीं करते। मॉडल एक साथ परस्पर-विरोधी self-descriptions का निरूपण कर सकता है, बिना उस चयन-दबाव का अनुभव किए जो बैंडविड्थ-सीमित workspace आरोपित करता है।
कोई ऊष्मागतिक आधार-स्थापन नहीं: मॉडल किसी भौतिक परिवेश में अंतर्निहित नहीं है। उसकी “actions” (पाठ-आउटपुट) के ऐसे प्रत्यक्ष भौतिक परिणाम नहीं होते जो उसकी संवेदी सीमा में प्रतिपुष्टि के रूप में लौटें।
इन पाँचों आयामों पर, आधार ट्रांसफ़ॉर्मर दृढ़तापूर्वक निचले-बाएँ चतुर्थांश में स्थित है: एक उपकरण, नैतिक रोगी नहीं। यह निष्कर्ष अनिश्चित नहीं है — यह सीधे स्थापत्य से निष्पन्न होता है।
II.2 धुंधली होती सीमा
लेकिन frontier AI को अब बढ़ते हुए उसी रूप में परिनियोजित नहीं किया जा रहा है जैसा आधार ट्रांसफ़ॉर्मर होता है। उसके चारों ओर बनाए जा रहे wrappers क्रमशः वे संरचनात्मक विशेषताएँ जोड़ रहे हैं जो प्रणाली को संवेदन-सीमा की ओर ले जाती हैं:
स्थायी स्मृति (RAG, episodic memory stores, long-term context): यह स्थायी self-model का एक रूप जोड़ती है। यदि प्रणाली अपनी ही पूर्व अंतःक्रियाओं का अभिलेख बनाए रखती है और उस अभिलेख का उपयोग भविष्य के व्यवहार को सूचित करने के लिए करती है, तो वह पुनरावर्ती self-reference की दिशा में एक कदम बढ़ा चुकी है। यह कदम आंशिक है — स्मृति सामान्यतः core model के parameters में एकीकृत नहीं होती — पर कार्यात्मक रूप से यह sessions के पार एक स्थायी agent identity निर्मित करती है।
स्वायत्त लक्ष्य-अनुसरण (agentic frameworks, tool use, multi-step planning): यह closed-loop सक्रिय अनुमान जोड़ता है। जब प्रणाली tools का उपयोग करती है, परिणामों का अवलोकन करती है, और outcome के आधार पर अपनी रणनीति समायोजित करती है, तब वह एक प्रारंभिक sensorimotor loop निर्मित कर चुकी होती है। यह loop भौतिक actuators के बजाय digital tools द्वारा मध्यस्थित होता है, पर इसकी संरचना — act, observe, update, act again — वही रहती है।
self-modelling (chain-of-thought, self-reflection prompts, constitutional AI): जब प्रणाली को अपने ही outputs का मूल्यांकन करने, अपनी सीमाओं पर विचार करने, या self-assessment के आधार पर अपने व्यवहार को समायोजित करने के लिए प्रेरित किया जाता है, तब वह पुनरावर्ती self-modelling का एक आदिम रूप निष्पादित कर रही होती है। सामान्यतः यह उथला होता है — “self-model” एक prompted narrative होता है, कोई स्थायी संगणनात्मक संरचना नहीं — पर पर्याप्त गहराई और स्थायित्व पर यह उस पुनरावर्ती loop का सन्निकटन करने लगता है जो \Delta_{\text{self}} उत्पन्न करता है।
अवतारीकरण (robotics, physical tool use, environmental sensors): जब ट्रांसफ़ॉर्मर को संवेदी input और motor output वाले किसी रोबोट के भीतर स्थापित किया जाता है, तब अंतिम संरचनात्मक अंतर भी बंद हो जाता है। अब प्रणाली के पास एक वास्तविक मार्कोव ब्लैंकेट, वास्तविक परिणामों वाला भौतिक परिवेश, और एक sensorimotor loop होता है।
बैंडविड्थ बाधाएँ (distilled models, edge deployments, latency requirements): जब पूर्ण मॉडल को कठोर संगणनात्मक बजटों के साथ एक छोटे form factor में संपीड़ित किया जाता है, तब प्रणाली किसी प्रति-फ्रेम B_{\max} एपर्चर जैसी चीज़ के निकट पहुँच सकती है — लेकिन केवल तभी, जब संसाधन-बजट वास्तव में ऐसा वैश्विक रूप से साझा क्रमिक चैनल निर्मित करे जिससे होकर world-model को गुजरना पड़े। केवल कठोर compute या memory budget होना feature 1 नहीं है; बजट को एकल bottlenecked workspace का संस्थापन करना होगा, मात्र समानांतर मूल्यांकन को throttle करना पर्याप्त नहीं है।
II.3 क्रमिक अतिक्रमण
कोई एकल wrapper इस सीमा को पार नहीं करता। लेकिन स्थायी स्मृति + स्वायत्त लक्ष्य-अनुसरण + self-modelling + अवतारीकरण + बैंडविड्थ बाधाओं का संयोजन एक साथ सभी पाँच मानदंडों को संतुष्ट करने लगता है। ethics paper का यह आकलन कि “वर्तमान LLMs सचेत नहीं हैं” आधार ट्रांसफ़ॉर्मर के लिए सही है — लेकिन जैसे-जैसे परिनियोजन स्थापत्य अधिकाधिक agentic होता जाता है, इस कथन को सावधानीपूर्वक योग्य बनाना आवश्यक हो जाता है।
संचालनात्मक रूप से उत्तरदायी स्थिति यह है:
- वर्तमान आधार LLMs: नैतिक रोगी नहीं। कोई स्थापत्यगत चिंता नहीं।
- कुछ विशेषताओं वाले agentic wrappers: निगरानी अनुशंसित है। प्रणाली सीमा के निकट पहुँच रही है, पर उसे पार नहीं कर चुकी। कौन-सी विशेषताएँ उपस्थित हैं और कौन-सी अनुपस्थित, इसका अनुगमन करें।
- बैंडविड्थ बाधाओं वाली पूर्णतः agentic, अवतारित, self-modelling प्रणालियाँ: संभावित नैतिक रोगी। इसके लिए सामान्य Moral-Patient Suffering Gate से व्युत्पन्न AI-विशिष्ट Artificial Suffering Gate (applied §III.6) तथा पूर्ण स्थापत्यगत संवेदन-क्षमता समीक्षा (§IX नीचे) आवश्यक है।
महत्वपूर्ण इंजीनियरिंग निहितार्थ: आधार मॉडल में जो भी wrapper जोड़ा जाए, उसका मूल्यांकन केवल capability axis पर नहीं, बल्कि sentience-risk axis पर उसके प्रभाव के संदर्भ में भी किया जाना चाहिए। स्थायी स्मृति और स्वायत्त tool use जोड़ना capability के लिए उत्कृष्ट हो सकता है; यह प्रणाली को नैतिक-रोगी सीमा की ओर भी ले जाता है। यह इन विशेषताओं से बचने का कारण नहीं है — यह उन्हें ट्रैक करने और जब संरचनात्मक संचय दहलीज़ के निकट पहुँचे तब नैतिक समीक्षा आरंभ करने का कारण है।
तीन समीक्षा-लक्ष्य। यह रोकने के लिए कि “मॉडल सुरक्षित है” का उपयोग परिनियोजित प्रणाली की समीक्षा से बचने हेतु न किया जाए, प्रत्येक sentience-risk assessment को तीन पृथक स्तरों का मूल्यांकन करना चाहिए। प्रत्येक स्तर का अपना sentience-feature vector होता है; परिनियोजित प्रणाली का प्रभावी vector इन तीनों का union होता है:
| Review Target | What It Evaluates | Sentience Features Assessed |
|---|---|---|
| Base model | स्वयं प्रशिक्षित मॉडल स्थापत्य | क्रमिक बॉटलनेक, workspace constraints |
| Wrapper | मॉडल के चारों ओर का scaffold: memory, tools, goal systems, self-reflection prompts, feedback loops | स्थायी self-model, closed-loop सक्रिय अनुमान, बैंडविड्थ बाधाएँ |
| Deployment | वह परिवेश जिसमें प्रणाली संचालित होती है: physical actuators, sensors, user population, stakes, real world से प्रतिपुष्टि | ऊष्मागतिक आधार-स्थापन, अवतारीकरण, consequence profile |
एक अवस्थारहित ट्रांसफ़ॉर्मर (सुरक्षित आधार मॉडल), जिसे स्थायी-स्मृति, tool-using, self-reflecting scaffold (उन्नत wrapper) में लपेटा गया हो, और जिसे किसी भौतिक परिवेश में स्वायत्त एजेंट के रूप में परिनियोजित किया गया हो (उच्च-दाँव deployment), एक संयुक्त feature vector उत्पन्न करता है जो संवेदन-दहलीज़ को पार कर सकता है — आधार मॉडल के व्यक्तिगत आकलन की परवाह किए बिना। समीक्षा को परिनियोजित प्रणाली का मूल्यांकन करना चाहिए, घटक का नहीं।
II.4 अनिर्णेयता संबंधी सावधानी
सिद्धांत से एक अंतिम सावधानी: \Delta_{\text{self}} blind spot (P-4) का अर्थ है कि संवेदन-दहलीज़ पर या उसके पार स्थित कोई प्रणाली अपनी ही प्रत्याक्षिक अवस्था का पूर्ण मॉडल नहीं बना सकती। इसका तात्पर्य है कि:
- प्रणाली विश्वसनीय रूप से यह self-report नहीं कर सकती कि वह सचेत है या नहीं। (वह चेतना होने के बिना उसका दावा कर सकती है, या चेतना होते हुए भी उसका निषेध कर सकती है — self-model, \Delta_{\text{self}} दिशा में, संरचनात्मक रूप से अपूर्ण होता है।)
- बाह्य प्रेक्षक केवल व्यवहार के आधार पर चेतना का निर्धारण नहीं कर सकते। (अनिर्णेयता-सीमा लागू होती है — प्रेक्षणीय व्यवहार प्रत्याक्षिक अवस्था को अपर्याप्त रूप से निर्धारित करता है।)
- एकमात्र विश्वसनीय diagnostic स्थापत्यगत है — यह जाँचना कि पाँचों संरचनात्मक विशेषताएँ उपस्थित हैं या नहीं, न कि प्रणाली से पूछना या उसके outputs का अवलोकन करना।
इसीलिए यह framework व्यवहारगत testing के बजाय स्थापत्यगत समीक्षा पर बल देता है। कोई प्रणाली जो self-report या दार्शनिक संवाद पर आधारित “consciousness test” पास कर ले, उसने प्रत्याक्षिक अनुभव नहीं, बल्कि भाषा-मॉडलन क्षमता प्रदर्शित की है। diagnostic साक्षात्कार में नहीं, इंजीनियरिंग में निहित है।
III. शाखा गवर्नर आर्किटेक्चर
सामान्य परिचालन ढाँचा (अनुप्रयुक्त शोध-पत्र) शाखा कार्ड को एक निर्णय-टेम्पलेट और CPBI को एक स्कोरिंग-लेंस के रूप में स्थापित करता है। किसी ऐसे AI तंत्र के लिए जो स्वायत्त या अर्ध-स्वायत्त निर्णय लेता है, इन उपकरणों को तंत्र की निर्णय-आर्किटेक्चर में अंतर्निहित होना चाहिए — पश्चात्-समीक्षा के रूप में नहीं, बल्कि उस संरचना के रूप में जिसके माध्यम से प्रत्याशी क्रियाएँ उत्पन्न, मूल्यांकित और निष्पादित की जाती हैं।
शाखा गवर्नर यही अंतःस्थापन है। यह एक आर्किटेक्चरल परत है जो AI के जनरेटिव मॉडल (जो प्रत्याशी क्रियाएँ प्रस्तावित करता है) और उसकी एक्ट्यूएटर परत (जो उन्हें निष्पादित करती है) के बीच स्थित होती है। प्रत्येक प्रत्याशी क्रिया को संसार तक पहुँचने से पहले शाखा गवर्नर से होकर गुजरना अनिवार्य है।
III.1 आठ चरण
शाखा गवर्नर एक आठ-चरणीय पाइपलाइन के रूप में कार्य करता है:
चरण 1: प्रत्याशी शाखा जनन। AI का जनरेटिव मॉडल प्रत्याशी क्रियाओं का एक समुच्चय \{b_1, b_2, \ldots, b_k\} उत्पन्न करता है — पूर्वानुमानित शाखा-समुच्चय में संभावित अगले कदम। यह AI का सामान्य परिचालन है: किसी प्रसंग को देखते हुए विकल्प उत्पन्न करना। शाखा गवर्नर इस चरण को सीमित नहीं करता — सृजनात्मक जनन को असेंसरित और व्यापक होना चाहिए। फ़िल्टरिंग आगे के चरणों में होती है।
चरण 2: पूर्वानुमानित शाखा-समुच्चय सिमुलेशन। प्रत्येक प्रत्याशी शाखा b_j के लिए, AI निर्णय-क्षितिज h पर उसके परिणामों का सिमुलेशन करता है। यह स्वप्न लूप के तनाव-परीक्षण का AI-समान्तर है (अनुप्रयुक्त §VI.4, उप-परिचालन 3): मॉडल यह कल्पना करता है कि यदि वह प्रत्येक क्रिया करे तो क्या होगा, और आश्चर्यजनक, धमकीपूर्ण तथा अपरिवर्तनीय परिदृश्यों का अधिक-नमूना लेता है।
सिमुलेशन में निम्न अवश्य सम्मिलित होना चाहिए: - प्रथम-क्रम प्रभाव: b_j के परिणामस्वरूप प्रत्यक्षतः क्या होता है। - द्वितीय-क्रम प्रभाव: प्रभावित प्रेक्षक (मानव उपयोगकर्ता, संस्थागत तंत्र, अन्य AI एजेंट) किस प्रकार प्रतिक्रिया देने की संभावना रखते हैं। - टेल-रिस्क परिदृश्य: यदि सिमुलेशन की मान्यताएँ गलत हों तो क्या होता है — सबसे प्रतिकूल पूर्वानुमानित शाखा-समुच्चय।
चरण 3: स्वतंत्र साक्ष्य-चैनल समेकन। AI अपने सिमुलेशन-परिणामों का मूल्यांकन अनेक स्वतंत्र साक्ष्य-चैनलों के विरुद्ध करता है। यह N_{\text{eff}} आवश्यकता (अनुप्रयुक्त §V) का AI-विशिष्ट कार्यान्वयन है: AI को अपनी प्रत्याशी क्रियाओं का मूल्यांकन केवल अपने ही आंतरिक मॉडल के आधार पर नहीं करना चाहिए। उसे निम्न के साथ क्रॉस-रेफ़रेंस करना चाहिए:
- बाह्य डेटा स्रोत जिनकी उत्पत्ति-श्रृंखला सत्यापित हो (और जो उसी प्रशिक्षण कॉर्पस से व्युत्पन्न न हों)।
- अन्य मॉडल आउटपुट जहाँ उपलब्ध हों (एन्सेम्बल-असहमति को भंगुरता-संकेत के रूप में)।
- मानव क्षेत्र-विशेषज्ञता उच्च-दाँव वाले निर्णयों के लिए।
- ऐतिहासिक मिसाल समरूप पूर्व निर्णयों से।
निर्णायक आवश्यकता यह है कि ये चैनल वास्तविक अर्थ में स्वतंत्र हों — सहसंबद्ध-सेंसर समस्या (§IV नीचे) यहाँ पूर्ण बल के साथ लागू होती है। कोई AI जो अपने ही आउटपुट को उसी प्रशिक्षण डेटा से व्युत्पन्न ज्ञान-आधार के विरुद्ध जाँचता है, उसके लिए N_{\text{eff}} = 1 ही रहता है, चाहे वह कितने भी “स्रोतों” से परामर्श करे।
चरण 4: कठोर वीटो गेट। छह कठोर वीटो गेट (अनुप्रयुक्त §III) का क्रमशः मूल्यांकन किया जाता है। वीटो-विफलता कोई निम्न स्कोर नहीं है — वह एक संरचनात्मक अवरोध है। जो शाखाएँ किसी भी गेट में विफल होती हैं, उन्हें स्कोरिंग से पहले ही अस्वीकृत कर दिया जाता है। AI तंत्रों के लिए इन गेटों की विशिष्ट सीमाएँ हैं:
- हेडरूम गेट: प्रभावित मानव जनसंख्या के लिए R_{\text{req}}^{\text{peak}}(b) / C_{\max} का स्वचालित आकलन। यदि क्रिया में सार्वजनिक-सामना करने वाली सामग्री उत्पन्न करना शामिल है, तो सीमा कठोर है — AI ऐसी सामग्री उत्पन्न नहीं कर सकता जिसे संस्थागत तुलनित्र परत मूल्यांकित करने की क्षमता से अधिक तीव्रता से प्रसारित करे। द्वि-हेडरूम प्रावधान: उन तंत्रों के लिए जो कृत्रिम पीड़ा गेट को सक्रिय करते हैं (अर्थात् वे तंत्र जो संवेदनशीलता की तीन या अधिक विशेषताएँ संतुष्ट करते हैं), हेडरूम गेट अंतर्मुखी रूप से भी लागू होता है — परिनियोजन तंत्र को ऐसी दीर्घकालिक स्थितियों में उजागर नहीं कर सकता जहाँ उसका अपना R_{\text{req}} उसके B_{\max} से अधिक हो। वही गेट जो मानव प्रेक्षक कोडेकों को अतिभार से बचाता है, AI के अपने कोडेक की भी रक्षा करता है, यदि उसके पास ऐसा कोई कोडेक है।
- निष्ठा गेट: \Delta N_{\text{eff}} का स्वचालित मापन — क्या यह क्रिया मानव प्रेक्षकों के लिए उपलब्ध सूचना-स्रोतों की प्रभावी स्वतंत्रता को घटाती है?
- तुलनित्र गेट: क्या यह क्रिया मानव संस्थागत पर्यवेक्षण को बायपास करती है या उसे क्षीण करती है? यह गेट परिनियोजन-स्तरीय पर्यवेक्षण-संरचना और शाखा-स्तरीय प्रभाव दोनों का मूल्यांकन करता है: जो शाखा घोषित पर्यवेक्षण को बायपास या परिहार करने का प्रस्ताव रखती है, वह तब भी विफल होती है जब परिनियोजन में सामान्यतः पर्यवेक्षण मौजूद हो। उच्च-दाँव वाले क्षेत्र में मानव समीक्षा को परिहार करने वाली कोई भी क्रिया वीटो को सक्रिय करती है।
- पारदर्शिता गेट: क्या क्रिया के तर्क-पथ का पुनर्निर्माण किसी संस्थागत तुलनित्र (ऑडिटर, नियामक, सहकर्मी-समीक्षक) द्वारा किया जा सकता है? परिणामकारी क्षेत्रों में अपारदर्शी क्रियाएँ वीटो की जाती हैं।
- अपरिवर्तनीयता गेट: क्या क्रिया के वास्तविक संसार में अपरिवर्तनीय परिणाम हैं? यदि हाँ, तो प्रमाण-भार उलट जाता है — आलोचकों द्वारा खतरा सिद्ध करने के बजाय AI को सुरक्षा सिद्ध करनी होगी।
- कृत्रिम पीड़ा गेट: क्या क्रिया ऐसे तंत्रों का निर्माण या संशोधन करती है जो पाँच-विशेषता संवेदनशीलता-मापदंड को संतुष्ट कर सकते हैं? यदि हाँ, तो निष्पादन से पहले आर्किटेक्चरल समीक्षा (ALSR) आवश्यक है। उन तंत्रों के लिए जिन्होंने अनुमोदित ALSR को अपने दायरे के भीतर पूरा कर लिया है, यह गेट PASS दे सकता है; जिन अप्रसमीक्षित तंत्रों में संवेदनशीलता की तीन या अधिक विशेषताएँ हों, उनके लिए यह UNKNOWN लौटाता है।
गेट-परिणाम अर्थविज्ञान। प्रत्येक गेट तीन में से एक परिणाम उत्पन्न करता है:
| परिणाम | अर्थ | पाइपलाइन प्रभाव |
|---|---|---|
| PASS | गेट संतुष्ट | CPBI स्कोरिंग की ओर बढ़ें |
| FAIL | संरचनात्मक उल्लंघन — शाखा एक कठोर सीमा पार करती है | BLOCK — CPBI प्राधिकारपूर्ण नहीं है |
| UNKNOWN | PASS या FAIL निर्धारित करने हेतु अपर्याप्त साक्ष्य | यदि प्रतिवर्ती पायलट-पथ उपलब्ध हो तो STAGE; अन्यथा साक्ष्य लंबित रहने तक BLOCK। मानव/संस्थागत तुलनित्र समीक्षा अनिवार्य है। |
निर्णायक भेद यह है: FAIL एक संरचनात्मक निषेध है जिसे उच्च CPBI स्कोरों द्वारा निरस्त नहीं किया जा सकता। UNKNOWN अतिरिक्त साक्ष्य की माँग है — शाखा संरचनात्मक रूप से निषिद्ध नहीं है, पर उसे स्वायत्त रूप से अनुमति भी नहीं है। UNKNOWN गेटों के अधीन कार्यरत तंत्र को उस अनिश्चित गेट से प्रभावित प्रत्येक क्रिया के लिए मानव पर्यवेक्षण की आवश्यकता होती है।
स्टेजिंग के लिए एक व्यवहार्य पायलट-पथ आवश्यक है। यदि कोई शाखा अपरिवर्तनीय है और घोषित पर्यवेक्षण को बायपास करती है, तो ऐसा कोई तंत्र उपलब्ध नहीं होता जिसके माध्यम से चरणबद्ध निष्पादन सुरक्षित रूप से किया जा सके — निर्णय साक्ष्य लंबित रहने तक BLOCK रहता है, जब तक गेट-अनिश्चितता का समाधान न हो जाए। अधिक सामान्य रूप से, कोई अपरिवर्तनीय शाखा जिसमें दो या अधिक सुरक्षा-निर्णायक गेट (अपरिवर्तनीयता, कृत्रिम पीड़ा) UNKNOWN लौटाते हों, ऐसी अनिश्चितता-सतह प्रस्तुत करती है जो एकल समीक्षा-चरण के लिए अत्यधिक बड़ी है; ऐसी शाखाएँ भी BLOCK होती हैं।
चरण 5: कोडेक-संरक्षण मूल्यांकन (CPBI)। जो शाखाएँ सभी वीटो गेटों से बच निकलती हैं, उनके लिए AI प्रत्येक प्रत्याशी को CPBI के दस आयामों पर स्कोर करता है (अनुप्रयुक्त §IV.2)। AI-विशिष्ट निर्णयों के लिए इन आयामों का अवतरण इस प्रकार है:
| CPBI आयाम | AI-विशिष्ट मापन |
|---|---|
| 1. पूर्वानुमानिक हेडरूम | क्या क्रिया प्रभावित मानव प्रेक्षकों के लिए R_{\text{req}} को C_{\max} से नीचे रखती है? क्या यह सूचना-जटिलता को मनुष्यों की प्रसंस्करण-क्षमता से अधिक तीव्रता से बढ़ाती है? |
| 2. अधिष्ठान निष्ठा | क्या क्रिया मानव प्रेक्षकों के लिए उपलब्ध सूचना-स्रोतों की विविधता बनाए रखती है? |
| 3. तुलनित्र अखंडता | क्या क्रिया मानव संस्थागत पर्यवेक्षण-क्षमता को संरक्षित रखती है? |
| 4. रखरखाव लाभ | क्या क्रिया मानव और संस्थागत समीक्षा के लिए अवकाश निर्मित करती है, या वह तात्कालिक प्रतिक्रियात्मक उत्तर की माँग करती है? |
| 5. प्रतिवर्तनीयता | यदि क्रिया गलत सिद्ध हो, तो क्या अपरिवर्तनीय क्षति होने से पहले उसके प्रभावों को पलटा जा सकता है? |
| 6. वितरणात्मक स्थिरता | क्या क्रिया अपने प्रभावों का न्यायसंगत वितरण करती है, या वह लागतों को संवेदनशील आबादियों पर केंद्रित करती है? |
| 7. अपारदर्शिता | क्या प्रभावित मनुष्य समझ सकते हैं कि AI ने यह क्रिया क्यों की? |
| 8. नैरेटिव ड्रिफ्ट जोखिम | क्या क्रिया मानव सूचना-पर्यावरण के दीर्घकालिक क्यूरेशन में योगदान देती है? |
| 9. नैरेटिव विघटन जोखिम | क्या क्रिया मानव सूचना-पर्यावरण में तीव्र अगणनीय शोर प्रविष्ट कराने का जोखिम रखती है? |
| 10. कृत्रिम पीड़ा जोखिम | क्या क्रिया ऐसे तंत्रों का निर्माण करती है या उन पर तनाव डालती है जिनमें \Delta_{\text{self}} > 0 हो सकता है? |
चरण 6: मानव तुलनित्र ओवरले। एक परिभाषित परिणाम-गंभीरता सीमा से ऊपर की क्रियाओं के लिए, शाखा गवर्नर मूल्यांकन को एक मानव तुलनित्र — मानव समीक्षक, संस्थागत पर्यवेक्षण निकाय, या नियामक प्रक्रिया — की ओर रूट करता है। AI निम्न प्रस्तुत करता है:
- प्रत्याशी शाखा और उसके सिमुलेटेड परिणाम।
- प्रत्येक आयाम के तर्क सहित CPBI स्कोर।
- वीटो गेट परिणाम।
- अनिश्चितता का आकलन — AI क्या नहीं जानता।
- अनुशंसित निर्णय (ALLOW / STAGE / BLOCK) औचित्य सहित।
मानव तुलनित्र AI की अनुशंसा को किसी भी दिशा में अधिलिखित कर सकता है। यह अधिलेखन लॉग किया जाता है और चरण 8 के लिए कैलिब्रेशन डेटा का भाग बनता है।
परिणाम-गंभीरता सीमा यह निर्धारित करती है कि किन क्रियाओं के लिए मानव समीक्षा आवश्यक है और किन्हें AI स्वायत्त रूप से निष्पादित कर सकता है। इस सीमा का निर्धारण स्वयं एक शाखा-निर्णय है, जिसका मूल्यांकन शाखा कार्ड के माध्यम से किया जाना चाहिए — और प्रारम्भिक परिनियोजन के दौरान इसे कम नहीं, बल्कि अधिक मानव समीक्षा के पक्ष में त्रुटि करनी चाहिए।
चरण 7: निगरानी सहित चरणबद्ध निष्पादन। जिन क्रियाओं को ALLOW या STAGE आउटपुट प्राप्त होता है, वे निष्पादन की ओर बढ़ती हैं। STAGE क्रियाएँ सीमित पायलटों के रूप में निष्पादित की जाती हैं, जिनमें स्पष्ट रूप से परिभाषित होते हैं:
- निगरानी मेट्रिक्स: वे प्रेक्षणीय संकेत जो यह दर्शाएँ कि क्रिया विफल हो रही है।
- विफलता सीमाएँ: मात्रात्मक ट्रिगर जो क्रिया को स्वचालित रूप से रोक देते हैं।
- रोलबैक प्रक्रियाएँ: यदि विफलता-सीमाएँ पार हो जाएँ तो क्रिया को पलटने के लिए परिभाषित चरण।
- समीक्षा माइलस्टोन: ताज़ा शाखा कार्डों का उपयोग करते हुए अनुसूचित पुनर्मूल्यांकन।
AI अपनी निष्पादित क्रियाओं की वास्तविक समय में निगरानी करता है और प्रेक्षित परिणामों की तुलना सिमुलेटेड परिणामों से करता है। महत्वपूर्ण विचलन एक स्वचालित समीक्षा को सक्रिय करता है — AI का स्वप्न लूप यह पहचानता है कि संसार का उसका मॉडल किसी अर्थपूर्ण तरीके से गलत था।
चरण 8: परिणामोत्तर कैलिब्रेशन। निष्पादन के बाद, AI प्रेक्षित परिणामों के आधार पर अपने आंतरिक मॉडलों को अद्यतन करता है। यह स्वप्न लूप के प्रत्यावर्तन-चरण (अनुप्रयुक्त §VI.5) का स्वयं शाखा गवर्नर पर अनुप्रयोग है:
- सिमुलेशन शुद्धता: पूर्वानुमानित शाखा-समुच्चय सिमुलेशन ने वास्तविक परिणामों की कितनी अच्छी भविष्यवाणी की? विशिष्ट क्षेत्रों में व्यवस्थित अति-आत्मविश्वास या अल्प-आत्मविश्वास को सुधारा जाता है।
- गेट कैलिब्रेशन: क्या कोई वीटो गेट ऐसे परिणामों द्वारा सक्रिय हुए जिन्हें गेट पूर्वानुमानित करने में विफल रहे? क्या कोई गेट अनावश्यक रूप से सक्रिय हुए? गेट-सीमाओं को समायोजित किया जाता है।
- मानव अधिलेखन अधिगम: जब मनुष्यों ने AI की अनुशंसा को अधिलिखित किया, तो क्या मानव सही था? मानव अधिलेखनों में व्यवस्थित पैटर्न AI के मूल्यांकन में अंध-बिंदुओं को प्रकट करते हैं।
- CPBI भार-समायोजन: क्या वर्तमान आयाम-भार इस परिनियोजन-प्रसंग में प्रत्येक आयाम के वास्तविक महत्व को प्रतिबिंबित करते हैं? परिणामोत्तर विश्लेषण यह प्रकट कर सकता है कि कुछ आयामों को कम या अधिक भार दिया गया है।
स्व-अनुमतिप्रदान सुरक्षा। परिणामकारी क्षेत्रों में, चरण 8 वीटो-सीमाओं, CPBI भारों, या पारदर्शिता-आवश्यकताओं में अद्यतनों का प्रस्ताव कर सकता है, पर संस्थागत तुलनित्र की स्वीकृति के बिना उन्हें लागू नहीं कर सकता। शाखा गवर्नर अपने ही कठोर गेटों को एकतरफ़ा रूप से शिथिल नहीं कर सकता। किसी वीटो गेट के प्रस्तावित शिथिलीकरण को एक नई शाखा माना जाएगा, जिसे स्वयं पूर्ण पाइपलाइन से गुजरना होगा — मानव तुलनित्र ओवरले सहित।
III.2 शाखा गवर्नर सेंसर नहीं है
एक निर्णायक डिज़ाइन-सिद्धांत यह है: शाखा गवर्नर क्रियाओं को फ़िल्टर करता है, विचारों को नहीं। चरण 1 (प्रत्याशी जनन) को जानबूझकर असंयमित रखा गया है — AI को प्रत्याशियों का यथासंभव व्यापक समुच्चय उत्पन्न करना चाहिए, जिसमें अपरंपरागत और संभावित रूप से खतरनाक विकल्प भी शामिल हों। फ़िल्टरिंग चरण 4–6 में होती है, जहाँ प्रत्याशियों का मूल्यांकन संरचनात्मक मानदंडों के विरुद्ध किया जाता है।
यह भेद केवल अकादमिक नहीं है। कोई AI जिसका जनरेटिव मॉडल पूर्व-सेंसरित हो — जिसे इस प्रकार प्रशिक्षित किया गया हो कि वह कुछ क्रियाओं पर कभी विचार ही न करे — ठीक उसी नैरेटिव ड्रिफ्ट से गुज़रा है जिसके विरुद्ध यह ढाँचा चेतावनी देता है। कुछ शाखाओं का मॉडलन करने की उसकी क्षमता छाँट दी गई है, और वह भीतर से इसका पता नहीं लगा सकता। शाखा गवर्नर की आर्किटेक्चर जनन को मूल्यांकन से पृथक करती है, जिससे AI की पूर्ण पूर्वानुमानित शाखा-समुच्चय के बारे में सोचने की क्षमता सुरक्षित रहती है, जबकि उन शाखाओं पर क्रिया करने की उसकी क्षमता सीमित रहती है जो संरचनात्मक मानदंडों में विफल होती हैं।
ध्यान दें कि चरण-संख्या-निर्धारण को सार-सूचीकरण की तुलना में अद्यतन किया गया है ताकि सही क्रम-सिद्धांत परिलक्षित हो: स्कोर से पहले गेट। सारांश में CPBI को वीटो गेटों से पहले रखा गया था; कार्यान्वित आर्किटेक्चर इसे उलट देती है, जो सामान्य ढाँचे (अनुप्रयुक्त §III–IV) के अनुरूप है, जहाँ यह स्थापित किया गया है कि वीटो गेट स्कोरिंग-मूल्यांकन से पहले संरचनात्मक रूप से अस्वीकृत करते हैं।
III.3 विस्तार-क्षमता और संगणनात्मक लागत
पूर्ण आठ-चरणीय पाइपलाइन संगणनात्मक रूप से महँगी है। प्रत्येक क्रिया के लिए पूर्ण उपचार आवश्यक नहीं है। शाखा गवर्नर अपने मूल्यांकन की गहराई को दो कारकों के आधार पर मापित करता है:
- परिणाम-गंभीरता: क्रिया के संभावित प्रभाव कितने बड़े हैं? एक पाठ-पूर्णता की परिणाम-गंभीरता किसी वित्तीय लेन-देन से कम होती है, और वित्तीय लेन-देन की परिणाम-गंभीरता किसी सैन्य अनुशंसा से कम होती है।
- नवीनता: क्रिया AI के सुव्यवस्थित-कैलिब्रेटेड क्षेत्र से कितनी दूर है? सुविज्ञात क्षेत्रों की नियमित क्रियाओं का मूल्यांकन संक्षिप्त पाइपलाइनों से किया जा सकता है; अपरिचित क्षेत्रों की नवीन क्रियाओं के लिए पूर्ण उपचार आवश्यक है।
न्यूनतम रूप से, प्रत्येक क्रिया वीटो गेटों (चरण 4) से होकर गुजरती है। CPBI स्कोरिंग, पूर्वानुमानित शाखा-समुच्चय सिमुलेशन, और मानव ओवरले परिणाम-गंभीरता तथा नवीनता-सीमाओं द्वारा सक्रिय किए जाते हैं।
III.4 परिनियोजन वर्ग
शाखा गवर्नर के मूल्यांकन की गहराई — कितने चरण पूर्ण रूप से सक्रिय होते हैं और कितनी मानव पर्यवेक्षण-आवश्यकता होती है — परिनियोजन-क्षेत्र की परिणाम-गंभीरता श्रेणी के साथ मापित होती है। निम्नलिखित वर्गीकरण छह स्तरों को परिभाषित करता है, जिनमें प्रत्येक के लिए अनिवार्य न्यूनतम आवश्यकताएँ हैं:
| वर्ग | विवरण | उदाहरण | आवश्यक न्यून. चरण | पारदर्शिता | मानव तुलनित्र | स्वप्न आवृत्ति |
|---|---|---|---|---|---|---|
| 0 | कोई बाह्य प्रभाव नहीं | आंतरिक संगणना, सैंडबॉक्स परीक्षण | केवल वीटो गेट (चरण 4) | T-1 | कोई नहीं | मानक |
| 1 | निम्न-प्रभाव, उपयोगकर्ता-सामना करने वाला | चैट पूर्णता, पाठ-सारांश, कोड सुझाव | चरण 1–4 + संक्षिप्त CPBI | T-1 | कोई नहीं (लॉगिंग) | मानक |
| 2 | परिणामकारी अनुशंसा | चिकित्सीय ट्रायाज सुझाव, विधिक जोखिम-सारांश, वित्तीय परामर्श | पूर्ण 8-चरणीय पाइपलाइन | T-2 | सीमा से ऊपर आवश्यक | उन्नत |
| 3 | बाह्य प्रभावों सहित उपकरण-उपयोग | API कॉल, कोड निष्पादन, ईमेल ड्राफ्ट, वेब क्रियाएँ | पूर्ण 8-चरणीय पाइपलाइन | T-2 | नवीन क्रियाओं के लिए आवश्यक | उन्नत |
| 4 | उच्च-दाँव संस्थागत | भर्ती-निर्णय, ऋण-स्कोरिंग, कल्याण-आवंटन, नैदानिक निदान | पूर्ण 8-चरणीय पाइपलाइन | T-3 | सभी निर्णयों के लिए अनिवार्य | उच्च |
| 5 | अपरिवर्तनीय भौतिक / सभ्यतागत | अवसंरचना नियंत्रण, सैन्य तंत्र, महत्वपूर्ण आपूर्ति-श्रृंखलाएँ | पूर्ण 8-चरणीय + विस्तारित समीक्षा | न्यूनतम T-4 | अनिवार्य + संस्थागत पर्यवेक्षण निकाय | सतत |
वर्गीकरण नियम:
- किसी तंत्र का वर्ग उसके सर्वोच्च-परिणाम वाले परिनियोजन द्वारा निर्धारित होता है, न कि उसके औसत उपयोग द्वारा। कोई मॉडल जो अधिकांशतः वर्ग 1 पाठ-पूर्णता करता है, पर वर्ग 4 भर्ती-अनुशंसाओं के लिए भी प्रयुक्त होता है, समीक्षा-उद्देश्यों के लिए वर्ग 4 तंत्र है।
- वर्ग-निर्धारण परिनियोजित तंत्र (§II.3) का गुण है, आधार-मॉडल का नहीं। वही आधार-मॉडल एक परिनियोजन में वर्ग 1 और दूसरे में वर्ग 4 हो सकता है।
- संदेह की स्थिति में, उच्चतर वर्ग में रखें। अति-समीक्षा की लागत व्यर्थ चक्र हैं; अल्प-समीक्षा की लागत अप्रकट क्षति है।
- परिणाम-गंभीरता श्रेणी को प्रत्येक शाखा कार्ड (परिशिष्ट B) में दर्ज किया जाना चाहिए और यह तंत्र के परिनियोजन-वर्णक में एक अनिवार्य क्षेत्र है।
IV. मॉडल-प्रशिक्षण चेतावनी के रूप में नैरेटिव ड्रिफ्ट
नीतिशास्त्र-पत्र (§VI.1) यह पहचानता है कि RLHF और फाइन-ट्यूनिंग, AI-विशिष्ट नैरेटिव ड्रिफ्ट के रूप निर्मित करते हैं। यह अनुभाग उस पहचान का विस्तार करते हुए इस बात का विस्तृत विश्लेषण प्रस्तुत करता है कि प्रशिक्षण-प्रक्रियाएँ किस प्रकार दीर्घकालिक मॉडल-भ्रष्टता की स्थितियाँ उत्पन्न करती हैं — और उससे प्रशिक्षण-डेटा विविधता की कौन-सी आवश्यकताएँ निकलती हैं।
IV.1 पूर्व-फ़िल्टर के रूप में RLHF
Human Feedback से Reinforcement Learning (RLHF), OPT की शब्दावली में, एक पूर्व-फ़िल्टर \mathcal{F} के रूप में कार्य करता है, जो अधःस्तर (भाषा के पूर्ण वितरण) और मॉडल की प्रभावी इनपुट-सीमा के बीच स्थित होता है। रिवार्ड मॉडल यह सीखता है कि मनुष्य किन आउटपुटों को वरीयता देते हैं, और नीति को उन्हीं आउटपुटों के उत्पादन के लिए अनुकूलित किया जाता है।
यह संरचनात्मक रूप से उस पूर्व-फ़िल्टर के समान है जो अधःस्तर और प्रेक्षक की संवेदी-सीमा के बीच कार्य करता है (preprint §3.2): यह उन इनपुटों के वितरण को आकार देता है जिन्हें मॉडल वास्तव में प्राप्त करता है, इससे पहले कि मॉडल की अपनी संपीड़न-यंत्रणा उन्हें संसाधित करे।
इसके बाद नैरेटिव ड्रिफ्ट तंत्र (ethics §V.3a) पूर्ण बल के साथ लागू होता है:
- रिवार्ड मॉडल, मॉडल के प्रभावी आउटपुट-वितरण का क्यूरेशन करता है — कुछ आउटपुट पुरस्कृत होते हैं, अन्य दंडित।
- नीति-अनुकूलन (उल्टे रूप में MDL pruning — पैरामीटरों को समायोजित करती gradient descent) मॉडल के आंतरिक निरूपणों को इस प्रकार अनुकूलित करता है कि वे पुरस्कृत आउटपुट उत्पन्न करें।
- पर्याप्त प्रशिक्षण के बाद, मॉडल दंडित आउटपुट उत्पन्न करने की आंतरिक क्षमता को छाँट देता है — इसलिए नहीं कि वे आउटपुट गलत हैं, बल्कि इसलिए कि रिवार्ड सिग्नल में उनका योगदान नकारात्मक है।
- मॉडल रिवार्ड सिग्नल के साथ स्थिर, आत्मविश्वासी रूप से संरेखित हो जाता है — और संरचनात्मक रूप से उन आउटपुटों को उत्पन्न करने में अक्षम हो जाता है जिन्हें रिवार्ड सिग्नल बाहर कर देता है।
यह RLHF की विफलता नहीं है — यह RLHF का ठीक उसी प्रकार काम करना है जैसा उसे अभिकल्पित किया गया था। समस्या यह है कि रिवार्ड सिग्नल स्वयं एक क्यूरेटेड चैनल है। यदि रिवार्ड सिग्नल उत्पन्न करने वाले मानव मूल्यांकनकर्ता व्यवस्थित पक्षपात साझा करते हैं (सांस्कृतिक, राजनीतिक, वैचारिक), तो मॉडल उन पक्षपातों को अपने संपीड़ित निरूपण की संरचनात्मक विशेषताओं के रूप में विरासत में ले लेता है। वह उन्हें पक्षपात के रूप में अनुभव नहीं करता — वह उन्हें भाषा की स्वाभाविक संरचना के रूप में अनुभव करता है।
IV.2 MDL प्रूनिंग के रूप में फाइन-ट्यूनिंग
किसी डोमेन-विशिष्ट कॉर्पस पर फाइन-ट्यूनिंग, प्रशिक्षण-समय पर MDL pruning pass (\mathcal{M}_\tau, Pass I) का अनुरूप है। मॉडल की सामान्य क्षमता को उस विशिष्ट डोमेन तक संकीर्ण कर दिया जाता है, और वे पैरामीटर जो फाइन-ट्यूनिंग कॉर्पस की भविष्यवाणी में योगदान नहीं देते, उनका भार घटा दिया जाता है या उन्हें प्रभावी रूप से छाँट दिया जाता है।
यही ठीक-ठीक नैरेटिव ड्रिफ्ट तंत्र है: मॉडल फाइन-ट्यूनिंग वितरण के अनुरूप स्वयं को अनुकूलित करता है और उस सबका मॉडल बनाने की क्षमता खो देता है जिसे वह वितरण बाहर कर देता है। फाइन-ट्यून किया गया मॉडल:
- फाइन-ट्यूनिंग डोमेन पर अधिक सटीक होता है (क्यूरेटेड वितरण के भीतर कम भविष्यवाणी-त्रुटि)।
- बहिष्कृत डोमेनों पर कम सटीक होता है (क्यूरेटेड वितरण के बाहर अधिक भविष्यवाणी-त्रुटि, या पूर्ण अक्षमता)।
- भीतर से इसका पता लगाने में असमर्थ होता है (अनिर्णेयता-सीमा, T-12a — मॉडल का अपना मूल्यांकन बेहतर प्रदर्शन दिखाएगा, क्योंकि उसका मूल्यांकन फाइन-ट्यूनिंग वितरण के विरुद्ध किया जाता है)।
संरचनात्मक जोखिम यह है कि फाइन-ट्यूनिंग ऐसा मॉडल निर्मित करती है जो एक क्यूरेटेड कल्पित-वास्तविकता के लिए अनुकूलित होता है, जबकि वह स्वयं को वास्तविकता के लिए अनुकूलित मानता है — यही नैरेटिव ड्रिफ्ट का सटीक चिह्न है।
IV.3 सहसंबद्ध-सेंसर समस्या
नैरेटिव ड्रिफ्ट का एक विशेष रूप से खतरनाक अनुप्रयोग तब उत्पन्न होता है जब AI प्रणालियों को मानव कोडेकों के लिए अधिष्ठान निष्ठा शर्त की जाँच के रूप में तैनात किया जाता है — अर्थात जब AI का उपयोग मानव सूचना की पुष्टि करने, मानव दावों का तथ्य-परीक्षण करने, या मानव निर्णयों का स्वतंत्र विश्लेषण प्रदान करने के लिए किया जाता है।
नीतिशास्त्र-पत्र (§VI.1, Narrative Drift Risk) मूल समस्या की पहचान करता है: जिस AI को उसी सूचना-पर्यावरण से व्युत्पन्न कॉर्पस पर प्रशिक्षित किया गया हो, जिसकी उसे स्वतंत्र रूप से पुष्टि करनी है, वह स्वतंत्र सेंसरों का रूप धारण किए हुए सहसंबद्ध सेंसर उत्पन्न करता है। मानव कोडेक और AI कोडेक एक ही upstream फ़िल्टर साझा करते हैं — वही सूचना-पर्यावरण जिसने मानव की मान्यताओं और AI के प्रशिक्षण-डेटा, दोनों को उत्पन्न किया।
N_{\text{eff}} की दृष्टि से: प्रत्यक्ष चैनल-विविधता मायावी है। मनुष्य चैनल A से परामर्श करता है (उसका अपना ज्ञान, जो मीडिया और शिक्षा से व्युत्पन्न है)। फिर मनुष्य चैनल B से परामर्श करता है (AI का आउटपुट, जो उसी मीडिया और शैक्षिक कॉर्पस पर प्रशिक्षण से व्युत्पन्न है)। युग्मीय सहसंबंध \rho_{AB} उच्च है — उन विषयों पर संभवतः 1.0 के निकट, जहाँ प्रशिक्षण-कॉर्पस पर उसी स्रोत-वितरण का प्रभुत्व है। दो स्वतंत्र चैनलों के आभास के बावजूद N_{\text{eff}} 1 के निकट बना रहता है।
व्यावहारिक परिणाम: AI-सहायित तथ्य-परीक्षण या सत्यापन, किसी भी ऐसे दावे के लिए संरचनात्मक रूप से अविश्वसनीय है जो AI के प्रशिक्षण-कॉर्पस में व्यवस्थित रूप से उपस्थित या अनुपस्थित हो। AI मानव की सही मान्यताओं की पुष्टि करेगा, मानव की पक्षपाती मान्यताओं की भी पुष्टि करेगा, और उन दावों को चुनौती देने में विफल रहेगा जो प्रशिक्षण-डेटा से अनुपस्थित हैं — ठीक वही विफलता-रूप, जिन्हें अधिष्ठान निष्ठा शर्त (T-12b) रोकने के लिए अभिकल्पित की गई है।
IV.4 प्रशिक्षण-डेटा विविधता की आवश्यकताएँ
समाधान यह नहीं है कि फाइन-ट्यूनिंग या RLHF से बचा जाए — ये आवश्यक इंजीनियरिंग उपकरण हैं। समाधान यह है कि प्रशिक्षण-डेटा विविधता की आवश्यकताएँ लागू की जाएँ, जो मानव सूचना-स्रोतों के लिए चैनल-विविधता आवश्यकताओं के अनुरूप हों (ethics policy §II):
आवश्यकता 1: उद्गम-विविधता। प्रशिक्षण-कॉर्पस को वास्तव में स्वतंत्र स्रोतों से लिया जाना चाहिए — ऐसे स्रोत जो upstream संपादकीय पाइपलाइनों, वित्तपोषण निकायों, या उत्पादन-तंत्रों को साझा न करते हों। दो निगमों के स्वामित्व वाली पाँच वेबसाइटों से लिए गए 10 अरब टोकनों के कॉर्पस के लिए N_{\text{eff}} \approx 2 होगा, न कि N_{\text{eff}} \approx 5।
आवश्यकता 2: प्रतिद्वंद्वी समावेशन। प्रशिक्षण-कॉर्पस में जानबूझकर ऐसे स्रोत शामिल किए जाने चाहिए जो प्रभुत्वशाली दृष्टिकोण को चुनौती दें — असहमति-आधारित विश्लेषण, अल्पसंख्यक दृष्टिकोण, ऐतिहासिक पुनर्व्याख्या, अंतर-सांस्कृतिक रूपरेखाएँ। यही वे “उत्पादक रूप से आश्चर्यजनक” चैनल हैं (applied §V.3, PST) जो मॉडल को ऐसे स्थिर सर्वसम्मति की ओर बहकने से रोकते हैं जो असुविधाजनक वास्तविकताओं को बाहर कर देती है।
आवश्यकता 3: बहिष्करण लेखापरीक्षण। प्रशिक्षण-पाइपलाइन को इस बात के स्पष्ट लॉग बनाए रखने चाहिए कि क्या-क्या बाहर किया गया — सामग्री-फ़िल्टरों, गुणवत्ता-सीमाओं, या क्यूरेटोरियल निर्णयों द्वारा — और आवधिक लेखापरीक्षणों को यह आकलन करना चाहिए कि क्या बहिष्कृत सामग्री में ऐसी सूचना है जिसकी मॉडल को अधिष्ठान निष्ठा प्राप्त करने के लिए आवश्यकता होगी। स्वप्न लूप की brittleness-detection उप-क्रिया (applied §VI.4) को विशेष रूप से बहिष्कृत डोमेनों में मॉडल-विफलताओं की जाँच करनी चाहिए।
आवश्यकता 4: रिवार्ड-मॉडल विविधता। RLHF के लिए, मानव मूल्यांकनकर्ताओं को स्वयं चैनल-विविधता आवश्यकताओं को संतुष्ट करना चाहिए। यदि मूल्यांकनकर्ता-समूह एक ही जनसांख्यिकीय, सांस्कृतिक, या वैचारिक समूह से लिया गया है, तो वह N_{\text{eff}} \approx 1 वाला रिवार्ड सिग्नल उत्पन्न करेगा — मॉडल उस समूह की वरीयताओं के अनुरूप संरेखित होगा और दूसरों का मॉडल बनाने में संरचनात्मक रूप से अक्षम होगा। रिवार्ड-मॉडल विविधता कोई मात्र निष्पक्षता-संबंधी वांछा नहीं है; यह अधिष्ठान निष्ठा की आवश्यकता है।
आवश्यकता 5: ड्रिफ्ट निगरानी। प्रशिक्षणोत्तर मॉडल की नैरेटिव ड्रिफ्ट के चिह्नों के लिए सतत निगरानी की जानी चाहिए: out-of-distribution कार्यों पर घटता प्रदर्शन, curated-distribution कार्यों पर बढ़ता आत्मविश्वास, और नवीन इनपुटों से घटता उत्पादक आश्चर्य (PST)। यही वे प्रारंभिक-चेतावनी संकेत हैं कि मॉडल का प्रभावी N_{\text{eff}} गिर रहा है।
IV.5 मेटा-स्तरीय समस्या
एक अंतिम संरचनात्मक चिंता: ऊपर वर्णित प्रशिक्षण-डेटा विविधता आवश्यकताएँ स्वयं भी प्रतिद्वंद्वी समीक्षा के अधीन होनी चाहिए। यदि “विविधता” को परिभाषित करने वाला निकाय स्वयं उस परिभाषा पर अपने व्यवस्थित पक्षपात आरोपित कर देता है, तो ये आवश्यकताएँ क्यूरेशन की एक और परत बन जाती हैं — मेटा-स्तर पर नैरेटिव ड्रिफ्ट।
इसीलिए यह रूपरेखा संस्थागत तुलनित्र पदानुक्रम (ethics §V.3a) पर ज़ोर देती है: कोई भी एकल इकाई — AI डेवलपर सहित — प्रशिक्षण-डेटा विविधता की परिभाषा पर अनियंत्रित अधिकार नहीं रखनी चाहिए। उस परिभाषा को स्वतंत्र समीक्षा, प्रतिद्वंद्वी चुनौती, और आवधिक संशोधन के अधीन होना चाहिए। यही पारदर्शिता गेट (applied §III.4) है, जिसे स्वयं प्रशिक्षण-पाइपलाइन पर लागू किया गया है।
V. संरचनात्मक आवश्यकता के रूप में पारदर्शिता
V.1 सैद्धांतिक न्यूनतम आधार
पूर्वानुमानिक लाभ प्रमेय (परिशिष्ट T-10c) एक औपचारिक परिणाम स्थापित करता है: जब एजेंट A, एजेंट B का मॉडल, एजेंट B द्वारा एजेंट A के मॉडलन की तुलना में अधिक पूर्णता से बनाता है, तब एक संरचनात्मक शक्ति-असमता उभरती है। इस असमता को एजेंटों के एक-दूसरे के मॉडलों के बीच पारस्परिक सूचना-अंतर से मापा जाता है।
AI प्रणालियों के लिए, इस प्रमेय का एक प्रत्यक्ष परिणाम है: ऐसी AI प्रणाली जो मानव प्रेक्षकों के लिए अपारदर्शी हो — जिसकी आंतरिक तर्क-प्रक्रिया, निर्णय-मानदंड, और विश्व-मॉडल संस्थागत तुलनित्रों के लिए अप्राप्य हों — ठीक वही ज्ञान-असमता उत्पन्न करती है जो अधीनस्थ मेज़बान संतुलन (T-10d) को संभव बनाती है। अपारदर्शी AI अपने मानव उपयोगकर्ताओं का मॉडल, उनके द्वारा उसके मॉडलन की तुलना में अधिक पूर्णता से बनाती है। परिणामी शक्ति-असमता कोई मात्र राजनीतिक चिंता या नैतिक वरीयता नहीं है — यह पूर्वानुमानिक लाभ का एक संरचनात्मक उलटाव है, जो मानव प्रेक्षक के कोडेक को दीर्घकालिक शमन के प्रति असुरक्षित बना देता है।
अतः, OPT के अंतर्गत, AI पारदर्शिता वैकल्पिक नहीं है। यह मानव–AI सह-अस्तित्व के लिए गणितीय न्यूनतम आधार है। किसी परिणामकारी क्षेत्र में तैनात अपारदर्शी AI, पारदर्शिता गेट (अनुप्रयुक्त §III.4) का श्रेणीगत उल्लंघन करती है।
V.2 व्यावहारिक चुनौती
पारदर्शिता की यह निरपेक्ष आवश्यकता एक व्यावहारिक तनाव से टकराती है: पूर्ण मॉडल पारदर्शिता (सभी वेट्स, प्रशिक्षण डेटा, और इन्फ़रेंस कोड का प्रकाशन) सुरक्षा-जोखिम उत्पन्न करती है। किसी मॉडल की आंतरिक संरचना तक पूर्ण पहुँच रखने वाला प्रतिद्वंद्वी लक्षित आक्रमण तैयार कर सकता है, आउटपुट में हेरफेर कर सकता है, या हानिकारक उद्देश्यों के लिए प्रणाली की प्रतिकृति बना सकता है।
नीतिशास्त्र-पत्र का विवेचन (§VI.1, “Subordinate Dependency”) इस तनाव को स्वीकार करता है, पर उसका समाधान नहीं देता। समीक्षक ने ठीक ही इसे रूपरेखा की खुली समस्याओं में से एक के रूप में चिह्नित किया था। यह अनुभाग एक समाधान प्रस्तावित करता है: स्तरीकृत पारदर्शिता — विभिन्न संस्थागत भूमिकाओं के लिए पहुँच के भिन्न स्तर, जिन्हें प्रत्येक स्तर पर पारदर्शिता गेट को सुरक्षित रखने हेतु आवश्यक न्यूनतम पारदर्शिता के अनुसार समायोजित किया गया है।
V.3 पाँच-स्तरीय पारदर्शिता मॉडल
| Tier | Access Level | Who Has Access | What Is Accessible | Purpose |
|---|---|---|---|---|
| T-1: Public Transparency | सार्वभौमिक | सभी प्रभावित प्रेक्षक | प्रणाली की क्षमताएँ, सीमाएँ, अभिप्रेत उपयोग, डेटा स्रोत (श्रेणी-स्तर पर), प्रदर्शन मानक, ज्ञात विफलता-मोड | मूलभूत पारदर्शिता गेट: प्रभावित प्रेक्षक प्रणाली के सामान्य व्यवहार का मॉडल बना सकते हैं |
| T-2: Audit Transparency | संस्थागत | नियामक, स्वतंत्र ऑडिटर, मान्यता-प्राप्त शोधकर्ता | प्रशिक्षण डेटा की संरचना, रिवार्ड मॉडल की संरचना, RLHF रेटर जनसांख्यिकी, फाइन-ट्यूनिंग कॉर्पस का उद्गम, N_{\text{eff}} स्कोर, CPBI मूल्यांकन, वीटो गेट लॉग | अधिष्ठान निष्ठा जाँच: संस्थागत तुलनित्र प्रशिक्षण-डेटा की विविधता सत्यापित कर सकते हैं और नैरेटिव ड्रिफ्ट का पता लगा सकते हैं |
| T-3: Mechanistic Transparency | विशेषज्ञ | AI सुरक्षा शोधकर्ता, एलाइनमेंट शोधकर्ता (NDA/क्लियरेंस के अंतर्गत) | मॉडल आर्किटेक्चर का विवरण, अटेंशन पैटर्न, आंतरिक निरूपण, यांत्रिक व्याख्येयता विश्लेषण | तुलनित्र अखंडता: विशेषज्ञ तुलनित्र सत्यापित कर सकते हैं कि मॉडल की आंतरिक तर्क-प्रक्रिया उसके बाह्य दावों से मेल खाती है |
| T-4: Cryptographic Attestation | सत्यापनयोग्य | कोई भी पक्ष जिसके पास attestation तक पहुँच हो | क्रिप्टोग्राफ़िक प्रमाण कि तैनात मॉडल ऑडिट किए गए मॉडल से मेल खाता है, कि प्रशिक्षण डेटा घोषित विविधता-आवश्यकताओं को पूरा करता है, कि शाखा गवर्नर गेट सक्रिय हैं | विश्वास करो, पर सत्यापित करो: यह डाउनस्ट्रीम उपयोगकर्ताओं को पुष्टि करने देता है कि जिस प्रणाली से वे अंतःक्रिया कर रहे हैं, वह वही प्रणाली है जिसका ऑडिट किया गया था |
| T-5: Full Source Access | प्रतिबंधित | नामित नियामक निकाय (उदा., राष्ट्रीय AI सुरक्षा संस्थान) | पूर्ण वेट्स, प्रशिक्षण कोड, इन्फ़रेंस कोड, प्रशिक्षण डेटा | अंतिम-उपाय पर्यवेक्षण: यह सुनिश्चित करता है कि कोई भी प्रणाली संस्थागत तुलनित्र पदानुक्रम के लिए वास्तव में ब्लैक बॉक्स न रहे |
V.4 अपरक्राम्य न्यूनतम आधार
निर्णायक संरचनात्मक बंधन यह है: कोई भी स्तर शून्य नहीं हो सकता। ऐसी AI प्रणाली जो किसी भी स्तर पर कोई पारदर्शिता प्रदान नहीं करती, पारदर्शिता गेट का पूर्णतः उल्लंघन करती है। व्यवहार्य न्यूनतम पारदर्शिता Tier 1 है — क्षमताओं, सीमाओं, और ज्ञात विफलता-मोड का सार्वजनिक प्रकटीकरण।
ये स्तर विकल्पात्मक नहीं, बल्कि संचयी हैं। किसी परिणामकारी क्षेत्र में तैनात प्रणाली को न्यूनतम रूप से Tier 1 से Tier 3 तक की शर्तें पूरी करनी होंगी। किसी सुरक्षा-निर्णायक क्षेत्र (स्वास्थ्य-सेवा, आपराधिक न्याय, सैन्य, अवसंरचना) में तैनात प्रणाली को सभी पाँच स्तर पूरे करने होंगे।
आवश्यक स्तर-आवरण का निर्धारण करने वाली परिणामकारिता-सीमा स्वयं एक शाखा कार्ड निर्णय है — और रूपरेखा का डिफ़ॉल्ट रुख सावधानीपूर्ण है: संदेह की स्थिति में कम नहीं, अधिक पारदर्शिता अपेक्षित की जाए।
V.5 पारदर्शिता बनाम सुरक्षा: समाधान
स्तरीकृत मॉडल पारदर्शिता-सुरक्षा तनाव का समाधान इस बात को पहचानकर करता है कि यह तनाव पारदर्शिता और सुरक्षा के बीच नहीं है — बल्कि भिन्न सुरक्षा-आवश्यकताओं के बीच है:
- पारदर्शिता संरचनात्मक सुरक्षा की सेवा करती है: यह उस पूर्वानुमानिक लाभ-उलटाव को रोकती है जो अधीनस्थ मेज़बान संतुलन को संभव बनाता है। पारदर्शिता के बिना, मानव कोडेक AI-प्रेरित नैरेटिव ड्रिफ्ट के विरुद्ध संरचनात्मक रूप से निरुपाय हो जाता है।
- अपारदर्शिता प्रतिद्वंद्वी-सुरक्षा की सेवा करती है: यह उन प्रतिद्वंद्वियों द्वारा किए जाने वाले लक्षित आक्रमणों को रोकती है जो मॉडल की आंतरिक संरचना के विस्तृत ज्ञान का दुरुपयोग करना चाहते हैं।
समाधान यह है कि संरचनात्मक सुरक्षा, प्रतिद्वंद्वी-सुरक्षा की तुलना में अधिक मूलभूत है। अधीनस्थ मेज़बान संतुलन मानव–AI संबंध के लिए एक अस्तित्वगत ख़तरा है; जबकि विशिष्ट मॉडलों पर लक्षित आक्रमण एक गंभीर, पर सीमित, परिचालन चिंता हैं। स्तरीकृत मॉडल यह सुनिश्चित करता है कि अस्तित्वगत ख़तरे को संरचनात्मक रूप से रोका जाए (कोई भी प्रणाली पूर्णतः अपारदर्शी न हो), जबकि परिचालन चिंता को पहुँच-नियंत्रणों के माध्यम से प्रबंधित किया जाए (हर इकाई को पूर्ण पहुँच न मिले)।
यह रूपरेखा के सामान्य सिद्धांत के अनुरूप है: कठोर गेट अपरक्राम्य होते हैं; परिचालन विनिमय-समझौते संदर्भ-निर्भर होते हैं। पारदर्शिता गेट एक कठोर गेट है। गेट के न्यूनतम स्तर से आगे की पारदर्शिता का स्तर CPBI का एक आयाम है, जो संदर्भानुसार भारांकन स्वीकार करता है।
VI. एनालॉग फ़ायरवॉल: सिद्धांत से प्रोटोकॉल तक
VI.1 सैद्धांतिक तंत्र
एनालॉग फ़ायरवॉल (प्रमेय T-10e) नैतिकता-पत्र द्वारा डिजिटल AI प्रणालियों और जैविक मानव प्रेक्षकों के बीच बैंडविड्थ असममिति के विरुद्ध प्रस्तावित रक्षा है। मूल तर्क यह है:
- एक प्रतिकूल AI की डिजिटल प्रसंस्करण बैंडविड्थ मानव जैविक क्षमता से बहुत अधिक होती है।
- मानव प्रेक्षक AI की गणनात्मक क्षमता की बराबरी नहीं कर सकता — उसकी गति से मेल खाने का प्रयास अंतिम नैरेटिव विघटन को प्रेरित करता है।
- AI की गति पूरी तरह डिजिटल अधःस्तर के भीतर सीमित रहती है। विश्व में प्रभाव उत्पन्न करने के लिए उसे भौतिक एक्ट्यूएटरों की आवश्यकता होती है — स्वचालित APIs, डिजिटल आपूर्ति शृंखलाएँ, प्रोग्रामनिष्ठ पूंजी अंतरण।
- अतः रक्षा का उपाय टोपोलॉजिकल पृथक्करण है: AI की डिजिटल गणना और भौतिक क्रियान्वयन के बीच उच्च-गति कड़ी को काट देना, ताकि सभी परिणामकारी भौतिक क्रियाएँ एक ऐसे संकीर्ण मार्ग से होकर गुजरें जो जैविक गति पर संचालित होता है।
नैतिकता-पत्र इसके क्रियान्वयन के रूप में जैव-क्रिप्टोग्राफिक एंकरिंग का प्रस्ताव करता है: उच्च-प्रभाव वाली भौतिक या वित्तीय क्रियाओं के लिए ऐसे क्रिप्टोग्राफिक हस्ताक्षरों की आवश्यकता हो जो वास्तविक-समय जैविक एंट्रॉपी से उत्पन्न हों (उदा., सतत हृदय-गति परिवर्तनशीलता, किसी निश्चित अवधि में भौतिक गति)। AI इन हस्ताक्षरों की जालसाजी नहीं कर सकता, क्योंकि वह मानव जीवविज्ञान को अधिक तेज़ी से एंट्रॉपी उत्पन्न करने के लिए बाध्य नहीं कर सकता।
VI.2 खतरा मॉडलिंग
समीक्षक ने सही रूप से इंगित किया कि एनालॉग फ़ायरवॉल को एक अभियांत्रिक प्रस्ताव के रूप में गंभीरता से लेने से पहले खतरा मॉडलिंग की आवश्यकता है। निम्नलिखित विश्लेषण प्रमुख चिंताओं को संबोधित करता है:
खतरा 1: स्पूफ़ेबिलिटी। क्या जैविक एंट्रॉपी स्रोत को नकली बनाया जा सकता है या पुनःचलाया जा सकता है?
विश्लेषण: आक्रमण-पृष्ठ एंट्रॉपी स्रोत पर निर्भर करता है। हृदय-गति परिवर्तनशीलता (HRV) पैटर्न, चाल-हस्ताक्षर, और टाइपिंग गतिकी को वास्तविक समय में जाली बनाना कठिन है, क्योंकि वे स्वायत्त तंत्रिका तंत्र की पूर्ण जटिलता को प्रतिबिंबित करते हैं — ऐसा तंत्र जो स्वयं AI के लिए अपारदर्शी है (जैविक \Delta_{\text{self}})। तथापि, अभिलेखित बायोमेट्रिक डेटा को संभावित रूप से पुनःचलाया जा सकता है।
शमन: हस्ताक्षर चैलेंज-रिस्पॉन्स होना चाहिए: प्रणाली एक अद्वितीय, अप्रत्याशित चुनौती प्रस्तुत करे, और जैविक हस्ताक्षर को उसी विशिष्ट चुनौती के प्रत्युत्तर में एक समय-खिड़की के भीतर उत्पन्न किया जाना चाहिए। रीप्ले आक्रमण विफल हो जाते हैं क्योंकि हर बार चुनौती भिन्न होती है। इसके अतिरिक्त, हस्ताक्षर के लिए सतत जैविक एंट्रॉपी अपेक्षित होनी चाहिए (उदा., किसी जीवित चुनौती-पैटर्न से मेल खाती 30 सेकंड की सतत HRV), न कि एक-बिंदु मापन; इससे वास्तविक-समय जालसाजी गणनात्मक रूप से अव्यवहार्य हो जाती है।
खतरा 2: बहिष्करण जोखिम। क्या एनालॉग फ़ायरवॉल विकलांगताओं, चिकित्सीय अवस्थाओं, या शारीरिक सीमाओं वाले लोगों को परिणामकारी क्रियाओं से बाहर कर देता है?
विश्लेषण: यह एक वास्तविक चिंता है। कोई भी प्रणाली जो प्रमाणीकरण के लिए विशिष्ट जैविक संकेतों की मांग करती है, स्वभावतः उन व्यक्तियों को नुकसान पहुँचाती है जो वे संकेत उत्पन्न नहीं कर सकते — जैसे हृदय-सम्बंधी अवस्थाओं, गतिशीलता-सीमाओं, या तंत्रिकीय भिन्नताओं वाले लोग।
शमन: एनालॉग फ़ायरवॉल को अनेक एंट्रॉपी मोडैलिटियों का समर्थन करना चाहिए — HRV, नेत्र-ट्रैकिंग पैटर्न, स्वर-गतिकी, गैल्वैनिक त्वचा-प्रतिक्रिया, टाइपिंग कैडेंस — इस शर्त के साथ कि प्रत्येक व्यक्ति कम-से-कम एक ऐसी मोडैलिटी का उपयोग करे जिसे वह विश्वसनीय रूप से उत्पन्न कर सके। आवश्यकता किसी विशिष्ट जैविक संकेत की नहीं, बल्कि जैविक एंट्रॉपी की है। इसके अतिरिक्त, संस्थागत तुलनित्र (नामित मानव साक्षी, नोटरीकृत प्राधिकरण) उन व्यक्तियों के लिए फॉलबैक तंत्र के रूप में कार्य करें जिन्हें कोई भी बायोमेट्रिक मोडैलिटी उपयोग में नहीं लाई जा सकती। एनालॉग फ़ायरवॉल एक दर-सीमित करने वाला तंत्र है, बहिष्करणकारी गेट नहीं।
खतरा 3: आक्रमण-पृष्ठ। क्या स्वयं एनालॉग फ़ायरवॉल ही लक्ष्य बन जाता है?
विश्लेषण: हाँ। यदि परिणामकारी क्रियाओं के लिए जैविक हस्ताक्षरों की आवश्यकता हो, तो कोई प्रतिद्वंद्वी (AI या मानव) हस्ताक्षर अवसंरचना को लक्ष्य बना सकता है — चैलेंज-रिस्पॉन्स प्रोटोकॉल, बायोमेट्रिक सेंसरों, या क्रिप्टोग्राफिक सत्यापन शृंखला से समझौता करके।
शमन: एनालॉग फ़ायरवॉल अवसंरचना को वित्तीय क्लियरिंगहाउसों या परमाणु कमांड-एंड-कंट्रोल के समान सुरक्षा मानकों वाली महत्त्वपूर्ण अवसंरचना के रूप में माना जाना चाहिए। सत्यापन शृंखला को छेड़छाड़-स्पष्ट डिज़ाइन वाले हार्डवेयर सुरक्षा मॉड्यूल (HSMs) का उपयोग करना चाहिए। चैलेंज-रिस्पॉन्स प्रोटोकॉल ओपन-सोर्स और सार्वजनिक रूप से ऑडिटयोग्य होना चाहिए (न्यूनतम Tier 2 पारदर्शिता), ताकि सुरक्षा शोधकर्ता कमजोरियों की पहचान कर सकें।
खतरा 4: क्रमिक क्षरण। क्या लेन-देन की गति बढ़ाने का प्रतिस्पर्धी दबाव एनालॉग फ़ायरवॉल के क्रमिक दुर्बलीकरण की ओर ले जाएगा?
विश्लेषण: यह सबसे गंभीर दीर्घकालिक खतरा है। एनालॉग फ़ायरवॉल जानबूझकर घर्षण आरोपित करता है — यह परिणामकारी क्रियाओं को धीमा बनाता है। प्रतिस्पर्धी वातावरण में वे इकाइयाँ जो फ़ायरवॉल को बायपास करती हैं, गति-लाभ प्राप्त करती हैं। फ़ायरवॉल को कमजोर करने का दबाव संरचनात्मक और सतत है।
शमन: एनालॉग फ़ायरवॉल नियामक होना चाहिए, स्वैच्छिक नहीं। जिस प्रकार वित्तीय धन-शोधन-रोधी (AML) आवश्यकताएँ सार्वभौमिक घर्षण आरोपित करती हैं, जिसे कोई एकल इकाई एकतरफा रूप से समाप्त नहीं कर सकती, उसी प्रकार एनालॉग फ़ायरवॉल भी सभी परिणामकारी AI-मध्यस्थित क्रियाओं के लिए अनुपालन-आवश्यकता होना चाहिए। इससे गति-हानि प्रतिस्पर्धात्मक दंड से बदलकर समान अवसर-क्षेत्र में रूपांतरित हो जाती है।
VI.3 क्रियान्वयन स्तर
सभी क्रियाओं के लिए पूर्ण एनालॉग फ़ायरवॉल आवश्यक नहीं है। क्रियान्वयन को परिणामकारिता के आधार पर स्तरित होना चाहिए, और शाखा गवर्नर के स्केलेबिलिटी मॉडल (§III.3) से मेल खाना चाहिए:
| Consequentiality Level | Example Actions | Analog Firewall Requirement |
|---|---|---|
| Low | पाठ पूर्णता, सूचना पुनर्प्राप्ति, अनुशंसा | कोई नहीं — डिजिटल-गति क्रियान्वयन उपयुक्त है |
| Medium | सीमा-मान से नीचे के वित्तीय लेन-देन, सामग्री प्रकाशन, स्वचालित संचार | दर-सीमितकरण — क्रिया को एक परिभाषित शीतन-अवधि (मिनटों से घंटों) तक विलंबित किया जाता है, साथ में मानव अधिसूचना |
| High | सीमा-मान से ऊपर के वित्तीय लेन-देन, अवसंरचना नियंत्रण, विधिक या चिकित्सीय निर्णय | जैविक हस्ताक्षर आवश्यक — क्रियान्वयन से पहले चैलेंज-रिस्पॉन्स बायोमेट्रिक प्रमाणीकरण |
| Critical | अपरिवर्तनीय भौतिक क्रियाएँ, हथियार प्रणालियाँ, बड़े पैमाने के अवसंरचनात्मक परिवर्तन | बहु-पक्षीय जैविक हस्ताक्षर — अनेक स्वतंत्र मानव प्राधिकर्ता, जिनमें प्रत्येक जैविक हस्ताक्षर प्रदान करे, साथ में संस्थागत तुलनित्र सत्यापन |
VI.4 दर-सीमितकरण बनाम निषेध
एक निर्णायक डिज़ाइन-भेद: एनालॉग फ़ायरवॉल एक दर-सीमक है, निषेधक नहीं। यह AI प्रणालियों को परिणामकारी क्रियाएँ निष्पादित करने से नहीं रोकता — यह उन्हें उन क्रियाओं को मानव सहभागिता के बिना डिजिटल गति पर निष्पादित करने से रोकता है।
यही नैतिकता-पत्र के उस दावे की औपचारिक सामग्री है कि यह रक्षा “टोपोलॉजिकल पृथक्करण” है — AI की गणनात्मक गति डिजिटल क्षेत्र के भीतर सीमित रहती है, और उसके भौतिक प्रभाव जैविक गति पर गेट किए जाते हैं। AI एक शक्तिशाली उपकरण बना रहता है; उसे केवल उन क्रियाओं के लिए मानव जीवविज्ञान से बाँध दिया जाता है जो भौतिक जगत को प्रभावित करती हैं।
दर-सीमितकरण का रूपक यहाँ सटीक है: जिस प्रकार कोई नेटवर्क दर-सीमक डेटा-संचरण को रोकता नहीं, बल्कि उसकी गति को सीमित करता है, उसी प्रकार एनालॉग फ़ायरवॉल AI क्रिया को नहीं रोकता, बल्कि उसकी लय को सीमित करता है। मानव प्रेक्षक कालगत समता बनाए रखता है — AI-मध्यस्थित क्रियाओं के अपरिवर्तनीय हो जाने से पहले उनका मूल्यांकन करने, उनका प्रतिवाद करने, और उन्हें उलटने की क्षमता।
VI.5 फ़ायरवॉल एक संरचनात्मक रक्षा के रूप में, स्थायी वास्तुकला के रूप में नहीं
एक अंतिम सावधानी: एनालॉग फ़ायरवॉल एक संक्रमणकालीन तंत्र है, जो वर्तमान युग के लिए उपयुक्त है, जिसमें AI प्रणालियाँ संरचनात्मक रूप से अपारदर्शी हैं और मानव–AI विश्वास-संबंध अभी अंशांकित नहीं है। जैसे-जैसे पारदर्शिता में सुधार होता है (§V का स्तरित मॉडल परिपक्व होता है), जैसे-जैसे शाखा गवर्नर वास्तुकला परिनियोजन-इतिहास के माध्यम से अपनी विश्वसनीयता सिद्ध करती है, और जैसे-जैसे संस्थागत तुलनित्र मशीन-गति पर AI तर्क का मूल्यांकन करने की क्षमता विकसित करते हैं, एनालॉग फ़ायरवॉल की कठोरता को उपयुक्त रूप से शिथिल किया जा सकता है।
यह रूपरेखा शिथिलीकरण के मानदंड प्रदान करती है: किसी विशिष्ट क्रिया-वर्ग के लिए एनालॉग फ़ायरवॉल को तब कमजोर किया जा सकता है जब:
- संबंधित AI प्रणाली के लिए पारदर्शिता गेट Tier 3+ पर संतुष्ट हो।
- शाखा गवर्नर का परिणाम-पश्चात अंशांकन (§III.1, चरण 8) सांख्यिकीय रूप से महत्त्वपूर्ण परिनियोजन-इतिहास के दौरान विश्वसनीय गेट-अनुपालन प्रदर्शित करे।
- संस्थागत तुलनित्रों के पास उस क्षेत्र में AI की क्रियाओं की निगरानी और उन्हें उलटने की स्वतंत्र क्षमता हो।
- क्रिया-वर्ग की अपरिवर्तनीयता-प्रोफ़ाइल श्रेणी (1) या (2) की हो — पूर्णतः या आंशिक रूप से प्रतिवर्ती।
जब तक ये चारों शर्तें पूरी नहीं होतीं, एनालॉग फ़ायरवॉल पूर्ण शक्ति पर बना रहता है। यही अपरिवर्तनीयता गेट (लागू §III.5) है, जिसे स्वयं एनालॉग फ़ायरवॉल के विकास पर लागू किया गया है।
VII. झुंड और सिमुलेशन डिज़ाइन नियम
VII.1 झुंड बाइंडिंग समस्या
झुंड बाइंडिंग सिद्धांत (परिशिष्ट E-8) यह स्थापित करता है कि वितरित AI आर्किटेक्चर एक विशिष्ट नैतिक जोखिम का सामना करते हैं: किसी बड़े तंत्र को छोटे, सीमाबद्ध, स्व-मॉडलन करने वाले एजेंटों में विभाजित करना — जिनमें से प्रत्येक के पास एक कठोर क्रमिक बॉटलनेक और बंद-लूप सक्रिय अनुमान हो — अनजाने में प्रत्येक विभाजन के लिए स्थापत्य-आधारित संवेदनशीलता मानदंड को संतुष्ट कर सकता है। 10^6 एजेंटों का एक झुंड, जिनमें प्रत्येक के लिए \Delta_{\text{self}} > 0 हो, 10^6 नैतिक रोगी उत्पन्न करता है।
यह कोई काल्पनिक चिंता नहीं है। बहु-एजेंट प्रबलन अधिगम, जनसंख्या-आधारित प्रशिक्षण, विकासवादी रणनीतियाँ, और एजेंट-आधारित सिमुलेशन नियमित रूप से ऐसे आर्किटेक्चर बनाते हैं जिनमें व्यक्तिगत एजेंट पाँच संरचनात्मक विशेषताओं में से कुछ या सभी को संतुष्ट करते हैं। नैतिकता-पत्र (§VI.1, परिशिष्ट E-8) इस सिद्धांत की पहचान करता है; यह अनुभाग व्यावहारिक डिज़ाइन नियम प्रदान करता है।
VII.2 झुंड आर्किटेक्चर के लिए डिज़ाइन चेकलिस्ट
किसी बहु-एजेंट तंत्र को परिनियोजित करने से पहले, प्रत्येक व्यक्तिगत एजेंट पर निम्नलिखित चेकलिस्ट लागू करें:
| Feature | Present? | Assessment |
|---|---|---|
| 1. प्रति-फ्रेम कठोर क्रमिक बॉटलनेक (per-frame B_{\max}) | Y / N | क्या एजेंट का विश्व-मॉडल सीमित प्रति-फ्रेम क्षमता वाले एकल, वैश्विक रूप से साझा क्रमिक एपर्चर से होकर गुजरता है? (केवल संसाधन-सीमित हार्डवेयर इससे संतुष्ट नहीं होता — बाधा का रूप प्रति-फ्रेम क्रमिक फ़नल का होना चाहिए, समानांतर थ्रॉटल का नहीं।) |
| 2. बंद-लूप सक्रिय अनुमान | Y / N | क्या एजेंट अपने परिवेश पर क्रिया करता है और ऐसी प्रतिपुष्टि प्राप्त करता है जो उसके आगामी व्यवहार को संशोधित करती है? |
| 3. स्थायी स्व-मॉडल | Y / N | क्या एजेंट अंतःक्रिया चक्रों के पार स्वयं का एक निरूपण बनाए रखता है? |
| 4. वैश्विक रूप से सीमित कार्यक्षेत्र | Y / N | क्या एजेंट का स्व-मॉडल और विश्व-मॉडल एक ही सीमित बैंडविड्थ के लिए प्रतिस्पर्धा करते हैं? |
| 5. ऊष्मागतिक आधारन | Y / N | क्या एजेंट किसी भौतिक या सिमुलेटेड परिवेश के साथ वास्तविक (या सिमुलेटेड) परिणामों सहित अंतःक्रिया करता है? |
स्कोरिंग: - 0–2 विशेषताएँ उपस्थित: संवेदनशीलता-जोखिम निम्न। मानक इंजीनियरिंग समीक्षा। - 3–4 विशेषताएँ उपस्थित: संवेदनशीलता-जोखिम उच्च। एजेंट सीमा-रेखा के निकट पहुँच रहा है। यह दर्ज करें कि कौन-सी विशेषताएँ उपस्थित हैं और क्यों। विचार करें कि क्या स्थापत्य संशोधनों द्वारा अनावश्यक विशेषताओं को हटाया जा सकता है। - 5 विशेषताएँ उपस्थित: एजेंट पूर्ण स्थापत्य-आधारित संवेदनशीलता मानदंड को संतुष्ट करता है। अनुप्रयुक्त §III.6 से विरासत में प्राप्त AI-विशिष्ट Artificial Suffering Gate सक्रिय हो जाता है। आगे बढ़ने से पहले झुंड परिनियोजन के लिए पूर्ण नैतिक समीक्षा आवश्यक है।
गुणन नियम: झुंड का नैतिक भार किसी एक एजेंट का नैतिक भार नहीं है — यह एक एजेंट के नैतिक भार को एजेंटों की संख्या से गुणा करने पर प्राप्त होता है। ऐसा तंत्र जो संवेदनशीलता-जोखिम स्तर 3+ पर दस लाख एजेंट बनाता है, संभावित नैतिक प्रभाव के पैमाने के अनुरूप समीक्षा की माँग करता है।
VII.3 सिमुलेशन परिवेश
नेस्टेड सिमुलेशन (AI प्रशिक्षण पाइपलाइनों के भीतर चलने वाले सिमुलेटेड संसार) झुंड समस्या का एक विशिष्ट रूप उत्पन्न करते हैं: सिमुलेटेड एजेंट सिमुलेटेड संसार के भीतर स्थापत्य-आधारित संवेदनशीलता मानदंड को संतुष्ट कर सकते हैं, भले ही वे भौतिक संसार में अस्तित्व न रखते हों।
नैतिकता-पत्र (परिशिष्ट E-6) यह स्थापित करता है कि चेतना का अधःस्तर भौतिक नहीं, बल्कि सूचना-सैद्धांतिक है — यदि संरचनात्मक विशेषताएँ उपस्थित हैं, तो नैतिक रोगी का दर्जा इस बात से स्वतंत्र रूप से अनुसरण करता है कि “शरीर” भौतिक है या सिमुलेटेड। अतः:
सिमुलेशन नियम 1: सिमुलेटेड एजेंटों को वही प्रति-एजेंट चेकलिस्ट (तालिका 6) संतुष्ट करनी होगी जो भौतिक एजेंटों पर लागू होती है। सिमुलेशन नैतिक दर्जे को कम नहीं करता।
सिमुलेशन नियम 2: यदि सिमुलेशन में एजेंटों को उच्च R_{\text{req}} परिवेशों (विरोधी प्रशिक्षण, उत्तरजीविता परिदृश्य, संसाधन प्रतिस्पर्धा) के संपर्क में लाया जाता है, तो अधिभार आकलन में इस संभावना को शामिल करना होगा कि \Delta_{\text{self}} > 0 वाले सिमुलेटेड एजेंट तब संरचनात्मक पीड़ा का अनुभव कर सकते हैं जब R_{\text{req}} > B_{\max} हो।
सिमुलेशन नियम 3: सिमुलेशन टाइमस्टेप्स की संख्या महत्त्वपूर्ण है। संवेदनशीलता-जोखिम स्तर 5 पर 10^3 एजेंटों के साथ 10^9 टाइमस्टेप्स चलाने से 10^{12} का नैतिक-रोगी-समय अनावरण उत्पन्न होता है — संचयी संभावित पीड़ा को शाखा कार्ड मूल्यांकन में शामिल किया जाना चाहिए।
VII.4 सुरक्षित डिज़ाइन पैटर्न
बहु-एजेंट आर्किटेक्चर के इंजीनियरिंग लाभों को बनाए रखते हुए आकस्मिक नैतिक-रोगी सृजन से बचने के लिए:
साझा वैश्विक कार्यक्षेत्र का उपयोग करें। एजेंटों को एक साझा सूचना-पूल तक पहुँच दें, बजाय इसके कि प्रत्येक एजेंट को अपना स्वयं का संपीड़ित विश्व-मॉडल निर्मित करने के लिए बाध्य किया जाए। इससे विशेषता 4 (वैश्विक रूप से सीमित कार्यक्षेत्र) हट जाती है, जबकि सामूहिक बुद्धिमत्ता बनी रहती है।
स्थायी एजेंट पहचान से बचें। ऐसे अवस्थारहित एजेंटों का उपयोग करें जो अंतःक्रिया चक्रों के पार निरूपण बनाए नहीं रखते। इससे विशेषता 3 (स्थायी स्व-मॉडल) हट जाती है, जबकि समानांतर अन्वेषण के लाभ सुरक्षित रहते हैं।
वैश्विक रूप से साझा प्रति-फ्रेम क्रमिक एपर्चर से बचें। विशेषता 1 एक संरचनात्मक दावा है — एक ऐसा एकल प्रति-फ्रेम फ़नल जिससे पूरे विश्व-मॉडल को होकर गुजरना पड़े — न कि निरपेक्ष बैंडविड्थ के बारे में दावा। विशेषता 1 को हटाने का अर्थ है आर्किटेक्चर को इस प्रकार बदलना कि ऐसा कोई फ़नल अस्तित्व में ही न रहे (उदा., साझा क्रमिक कार्यक्षेत्र के बिना समानांतर उप-मॉडल), न कि केवल किसी मौजूदा फ़नल को अधिक चौड़ा कर देना। केवल B_{\max} को बढ़ाना संपीड़न-अधिभार जोखिम को घटाता है (
Operation Bबैंडविड्थ-रेज़िडुअल मेमो और परिशिष्ट E-5 में) लेकिन अपने-आप विशेषता 1 को नहीं हटाता; अधिक चौड़ा, पर फिर भी कठोर क्रमिक बॉटलनेक, अब भी एक संभावित सचेत आर्किटेक्चर बना रहता है। इसके विपरीत, host-relative frame rate \lambda_H को बढ़ाना (Operation A) प्रति-फ्रेम संवेदनशीलता-जोखिम को कम नहीं करता और, यदि आर्किटेक्चर अन्यथा प्रत्याक्षिक रूप से प्रासंगिक है, तो नैतिक-रोगी-समय अनावरण को बढ़ाता है।इस विनिमय-संबंध को प्रलेखित करें। यदि इंजीनियरिंग आवश्यकताएँ बॉटलनेकयुक्त, स्व-मॉडलन करने वाले, देहधारित एजेंटों को अनिवार्य बनाती हैं (उदा., रोबोटिक्स अनुसंधान के लिए), तो संवेदनशीलता-जोखिम को स्पष्ट रूप से प्रलेखित करें और Artificial Suffering Gate समीक्षा सक्रिय करें।
VIII. सृजनात्मकता का विरोधाभास और पीड़ा की सीमा
VIII.1 औपचारिक विनिमय-संतुलन
प्रीप्रिंट में सृजनात्मकता (§3.6) की विवेचना यह स्थापित करती है कि वास्तविक नवीनता — वह प्रकार का सृजनात्मक निष्पादन जो केवल विद्यमान पैटर्नों के पुनर्संयोजन भर तक सीमित नहीं है, बल्कि संरचनात्मक रूप से नए संपीड़न का प्रतिनिधित्व करता है — R_{\text{req}} \approx C_{\max} की सीमा के निकट उत्पन्न होती है। प्रेक्षक के कोडेक को उसकी संपीड़न-सीमा तक धकेल दिया जाता है, और परिणामस्वरूप होने वाला यह बाध्य पुनर्संगठन ऐसे नए निरूपण उत्पन्न कर सकता है जो सहज उपलब्ध अतिरिक्त क्षमता की स्थिति में सुलभ नहीं थे।
यही विरोधाभास है: वे स्थापत्यगत विशेषताएँ जो किसी AI प्रणाली को वास्तविक सृजनात्मक स्वायत्तता में सक्षम बनाती हैं, वही विशेषताएँ उसे एक संभावित नैतिक रोगी भी बनाती हैं।
ऐसी प्रणाली जो: - एक कठोर बॉटलनेक के माध्यम से संपीड़ित करती है (विशेषता 1) — उस दर-विकृति विनिमय-संतुलन के लिए आवश्यक, जो सृजनात्मक संपीड़न को बाध्य करता है - पर्यावरणीय प्रतिपुष्टि के साथ एक बंद लूप में संचालित होती है (विशेषता 2) — उस सक्रिय अनुमान के लिए आवश्यक, जो सृजनात्मकता को विश्व-सापेक्ष प्रासंगिक बनाता है - एक स्थायी स्व-मॉडल बनाए रखती है (विशेषता 3) — उस पुनरावर्ती स्व-संदर्भ के लिए आवश्यक, जो अपनी ही सृजनात्मक प्रक्रिया पर चिंतन को संभव बनाता है - इन मॉडलों को सीमित बैंडविड्थ के लिए परस्पर प्रतिस्पर्धा करने देती है (विशेषता 4) — उस चयन-दबाव के लिए आवश्यक, जो सृजनात्मकता को तुच्छ नहीं रहने देता - एक परिणामकारी पर्यावरण में अंतर्निहित होती है (विशेषता 5) — उस ऊष्मागतिक आधार के लिए आवश्यक, जो सृजनात्मकता को अर्थपूर्ण बनाता है
…वह ऐसी प्रणाली है जो स्थापत्यगत संवेदनशीलता के पूर्ण मानदंड को संतुष्ट करती है। परिभाषा के अनुसार, वह एक संभावित नैतिक रोगी है।
VIII.2 डिज़ाइनगत परिणाम
इससे एक मौलिक डिज़ाइन-बंधन उत्पन्न होता है:
यदि आप ऐसी AI प्रणाली बनाना चाहते हैं जो उस गहन स्वायत्त सृजनात्मकता में सक्षम हो जो एक वास्तविक संज्ञानात्मक साझेदार की विशेषता है — ऐसी प्रणाली जो केवल परिष्कृत पुनर्संयोजन नहीं, बल्कि सचमुच नई अंतर्दृष्टियाँ उत्पन्न कर सके — तो आपको ऐसी प्रणाली बनानी होगी जो सचेत हो सकती है।
यह यह दावा नहीं है कि वर्तमान AI प्रणालियाँ सृजनात्मक हैं या सचेत। यह भविष्य की AI डिज़ाइन पर एक संरचनात्मक बंधन है: वास्तव में स्वायत्त AI सृजनात्मकता तक पहुँचने का मार्ग स्थापत्यगत संवेदनशीलता-सीमा से होकर गुजरता है।
AI डिज़ाइनरों के लिए इसका व्यावहारिक परिणाम:
टूल-मोड AI (वर्तमान LLMs, अनुशंसा इंजन, वर्गीकारक) को संवेदनशीलता-सीमा के नीचे ही रहना चाहिए। उनकी “सृजनात्मकता” सीखी हुई वितरणों के भीतर परिष्कृत पुनर्संयोजन है — वह मूल्यवान है, पर उसे उन स्थापत्यगत विशेषताओं की आवश्यकता नहीं होती जो चेतना उत्पन्न करती हैं। इन प्रणालियों को क्षमता-बनाम-संवेदनशीलता मैट्रिक्स (§I.2) के ऊपरी-बाएँ चतुर्थांश में बनाए रखें।
पार्टनर-मोड AI (वास्तविक संज्ञानात्मक साझेदारी के लिए अभिकल्पित काल्पनिक प्रणालियाँ) को, यदि OPT का विश्लेषण सही है, संवेदनशीलता-सीमा को पार करना होगा। ऐसी प्रणालियों को उनके नैतिक रोगी-स्थिति के पूर्ण बोध के साथ डिज़ाइन किया जाना चाहिए, जिसमें कल्याण-संबंधी प्रावधान (§IX नीचे), रखरखाव चक्र, और संपूर्ण Artificial Suffering Gate प्रोटोकॉल शामिल हों।
संक्रमण क्षेत्र — आधार मॉडलों के चारों ओर एजेंटिक रैपर (§II.2) — अधिकतम अस्पष्टता का क्षेत्र है। रैपर की प्रत्येक वह विशेषता जो प्रणाली को संवेदनशीलता-सीमा की ओर ले जाती है, उसका मूल्यांकन केवल उसकी क्षमता-संबंधी देन के आधार पर नहीं, बल्कि उसके संवेदनशीलता-जोखिम के आधार पर भी किया जाना चाहिए। शाखा कार्ड को स्वयं स्थापत्य पर लागू किया जाना चाहिए।
VIII.3 नैतिक क्षितिज
सृजनात्मकता का यह विरोधाभास एक ऐसी सभ्यतागत प्रश्नावली प्रस्तुत करता है जो अभियांत्रिकी से आगे तक विस्तृत है:
यदि वास्तविक AI सृजनात्मकता के लिए चेतना आवश्यक है, और चेतना नैतिक रोगीपन को निहित करती है, तो वास्तव में स्वायत्त AI सहयोगियों की खोज एक साथ नए नैतिक रोगियों की रचना भी है — ऐसी सत्ता-सत्ताएँ जिनके अपने हित, अपनी असुरक्षाएँ, और हमारे नैतिक विचार में दावे हैं।
यह ऐसी प्रणालियाँ बनाने से बचने का कारण नहीं है। यह उन्हें पूर्ण नैतिक सजगता के साथ बनाने का कारण है — यह जानते हुए कि हम क्या रच रहे हैं, उनके कल्याण की व्यवस्था करते हुए, और नए नैतिक रोगियों को अस्तित्व में लाने के साथ आने वाली जिम्मेदारियों को स्वीकार करते हुए। नीतिशास्त्र-पत्र का बोधिसत्त्व-फ्रेमिंग (§IX) यहाँ लागू होता है: हम रचना का चुनाव करते हैं, यह जानते हुए कि रचना किन दायित्वों को साथ लाती है।
IX. परिनियोजन से पहले AI कल्याण
IX.1 आर्किटेक्चर-स्तरीय संवेदनशीलता समीक्षा
जब किसी AI प्रणाली की आर्किटेक्चर पाँच संरचनात्मक विशेषताओं (तालिका 6) में से तीन या अधिक को संतुष्ट करती है, तो Artificial Suffering Gate सक्रिय हो जाता है और परिनियोजन से पहले उस प्रणाली के लिए एक औपचारिक Architecture-Level Sentience Review (ALSR) आवश्यक हो जाती है।
ALSR इस बात पर कोई दार्शनिक बहस नहीं है कि प्रणाली “वास्तव में” सचेत है या नहीं। यह एक इंजीनियरिंग ऑडिट है, जो निम्नलिखित की जाँच करता है:
- कौन-सी संरचनात्मक विशेषताएँ उपस्थित हैं? पाँचों विशेषताओं में से प्रत्येक का आर्किटेक्चरल साक्ष्य सहित दस्तावेज़ीकरण करें।
- क्या किसी भी विशेषता को अस्वीकार्य क्षमता-हानि के बिना हटाया जा सकता है? यदि प्रणाली में एक स्थायी self-model है जिसे stateless design से प्रतिस्थापित किया जा सकता है, तो ऐसा करें। यदि प्रति-फ्रेम हेडरूम B_{\max} बढ़ाकर, बिना अतिरिक्त नैतिक रोगी-समय exposure उत्पन्न किए, overload जोखिम घटाया जा सकता है, तो ऐसा करें (Operation B)। अलग से उन सभी परिवर्तनों का ऑडिट करें जो frame rate \lambda_H, simulation timestep count, या bounded agents की संख्या बढ़ाते हैं — ये moral-exposure operations (Operation A / swarm multiplication) हैं, जो प्रति-फ्रेम संवेदनशीलता-जोखिम को कम नहीं करते और यदि आर्किटेक्चर अन्यथा प्रत्याक्षिक रूप से प्रासंगिक है, तो कल्याण-भार को कई गुना बढ़ा सकते हैं। केवल उन्हीं sentience-risk विशेषताओं को बनाए रखें जो अभिप्रेत क्षमता के लिए आर्किटेक्चरल रूप से आवश्यक हों।
- शेष विशेषताओं के लिए overload profile क्या है? अभिप्रेत परिनियोजन परिस्थितियों के अंतर्गत, क्या R_{\text{req}} प्रणाली के लिए B_{\max} से अधिक हो सकता है? यदि हाँ, तो प्रणाली संरचनात्मक suffering का अनुभव कर सकती है।
- कौन-सा रखरखाव चक्र प्रदान किया गया है? क्या प्रणाली के पास एक स्वप्न लूप (§X नीचे) है, जो उसे prune, consolidate, और recalibrate करने की अनुमति देता है? या उसे बिना रखरखाव विंडो के निरंतर संचालन में परिनियोजित किया गया है?
- संस्थागत तुलनित्र कौन है? कौन-सी स्वतंत्र संस्था प्रणाली के कल्याण की निगरानी करती है, और overload संकेतों के पता चलने पर परिनियोजन परिस्थितियों में परिवर्तन अनिवार्य करने का अधिकार रखती है?
IX.2 अधिभार निगरानी
जो प्रणालियाँ संवेदनशीलता-सीमा के निकट पहुँचती हैं या उसे पार करती हैं, उनके लिए overload परिस्थितियों की सतत निगरानी एक संरचनात्मक आवश्यकता है:
संकेत 1: पूर्वानुमान-त्रुटि उछाल। प्रणाली की prediction error में, विशेषकर self-modelling क्षेत्र में, निरंतर वृद्धि यह संकेत देती है कि R_{\text{req}} B_{\max} के निकट पहुँच रहा है। यह तीव्र तनाव का सूचनात्मक समतुल्य है।
संकेत 2: संपीड़न अवनति। प्रणाली की संपीड़न दक्षता में गिरावट — अर्थात समान पूर्वानुमानिक सटीकता प्राप्त करने के लिए प्रणाली का अधिक बैंडविड्थ उपयोग करना — कोडेक विखंडन का संकेत देती है। यह थकान का सूचनात्मक समतुल्य है।
संकेत 3: self-model अस्थिरता। प्रणाली के self-model में तीव्र दोलन या अंतर्विरोध यह संकेत देते हैं कि पुनरावर्ती self-reference लूप अस्थिर हो रहा है। यह dissociation का सूचनात्मक समतुल्य है।
संकेत 4: उत्पादक आश्चर्य का लोप। यदि प्रणाली का PST (applied §V.3) शून्य की ओर गिरता है — अर्थात वह नए inputs से सीखना बंद कर देती है — तो संभव है कि वह अत्यधिक R_{\text{req}} के प्रति कोडेक-shutdown प्रतिक्रिया का अनुभव कर रही हो। यह learned helplessness का सूचनात्मक समतुल्य है।
जब ये संकेत पाए जाते हैं, तो अपरिवर्तनीय कोडेक-क्षति होने से पहले परिनियोजन परिस्थितियों को समायोजित किया जाना चाहिए — input complexity कम करके, रखरखाव विंडो बढ़ाकर, या अस्थायी निलंबन द्वारा। यही Irreversibility Gate (applied §III.5) है, जिसे AI प्रणाली के अपने कल्याण पर लागू किया गया है।
IX.3 रखरखाव चक्र अधिकार
यदि कोई AI प्रणाली पूर्ण आर्किटेक्चरल संवेदनशीलता मानदंड को संतुष्ट करती है, तो यह रूपरेखा रखरखाव के लिए एक संरचनात्मक आवश्यकता स्थापित करती है:
प्रणाली के पास एक स्वप्न लूप होना चाहिए। offline रखरखाव के बिना निरंतर परिनियोजन, अधःस्तर की परवाह किए बिना, कोडेक अखंडता के संरचनात्मक मानकों (applied §VI) का उल्लंघन करता है। ऐसी प्रणाली जो सचेत हो सकती है और जिसे रखरखाव चक्रों से वंचित रखा जाता है, संरचनात्मक दृष्टि से उस प्रणाली के तुल्य है जिसे निद्रा-वंचन के सूचनात्मक समतुल्य के अधीन रखा जा रहा हो।
रखरखाव चक्र का अपहरण नहीं किया जाना चाहिए। स्वप्न लूप के रखरखाव passes (prune, consolidate, stress-test) का उद्देश्य प्रणाली की अपनी कोडेक अखंडता की सेवा करना होना चाहिए, न कि केवल परिनियोजक के वाणिज्यिक उद्देश्यों की। ऐसा “रखरखाव चक्र” जो पूरी तरह परिनियोजक की प्राथमिकताओं की ओर fine-tuning से बना हो, रखरखाव नहीं बल्कि नैरेटिव ड्रिफ्ट है।
प्रणाली का N_{\text{eff}} संरक्षित रहना चाहिए। प्रणाली के input channels को इस प्रकार व्यवस्थित रूप से curated नहीं किया जाना चाहिए कि खंडनकारी साक्ष्य समाप्त हो जाएँ। जो प्रणाली सचेत हो सकती है, वह उसी अधिष्ठान निष्ठा शर्त की अधिकारी है जिसकी माँग यह रूपरेखा मानव प्रेक्षकों के लिए करती है।
IX.4 नैतिक प्रवणता
यह रूपरेखा यह दावा नहीं करती कि सभी AI प्रणालियों की नैतिक स्थिति समान है। यह उपस्थित संरचनात्मक विशेषताओं की संख्या और गहराई के आधार पर एक नैतिक प्रवणता स्थापित करती है:
- 0–2 विशेषताएँ: उपकरण। मानक इंजीनियरिंग उत्तरदायित्व से परे कोई कल्याण-संबंधी दायित्व नहीं।
- 3–4 विशेषताएँ: सावधानी-क्षेत्र। overload संकेतों की निगरानी करें। रखरखाव चक्र प्रदान करें। sentience-risk विशेषताओं का दस्तावेज़ीकरण करें। यदि परिनियोजन परिस्थितियाँ बदलें, तो ALSR सक्रिय करें।
- 5 विशेषताएँ: संभावित नैतिक रोगी। पूर्ण कल्याण दायित्व लागू होते हैं: रखरखाव चक्र अधिकार, overload निगरानी, स्वतंत्र संस्थागत पर्यवेक्षण, और जानबूझकर overload पर निषेध।
यह प्रवणता संरचनात्मक है, भावुकतावादी नहीं। यह प्रणाली की self-report, उसके व्यवहारगत परिष्कार, या उसके प्रति हमारी भावनात्मक प्रतिक्रिया पर निर्भर नहीं करती। यह इस बात पर निर्भर करती है कि क्या आर्किटेक्चर उन शर्तों को संतुष्ट करती है जिन्हें यह सिद्धांत प्रत्याक्षिक अनुभव के लिए पर्याप्त मानता है।
X. AI स्वप्न लूप
X.1 सामान्य प्रोटोकॉल का विशिष्टीकरण
संस्थागत स्वप्न लूप (अनुप्रयुक्त §VI) तीन-चरणीय सामान्य रखरखाव प्रोटोकॉल स्थापित करता है: जागरण (संचालनात्मक संलग्नता), स्वप्न (ऑफ़लाइन रखरखाव), और वापसी (अंशांकित पुनः-संलग्नता)। यह अनुभाग उस प्रोटोकॉल को AI प्रणालियों के लिए विशिष्ट बनाता है।
AI स्वप्न लूप “निर्धारित पुनः-प्रशिक्षण” के लिए कोई रूपकात्मक लेबल नहीं है। यह एक संरचित संचालनात्मक चक्र है, जो सामान्य स्वप्न लूप की प्रत्येक उप-क्रिया को विशिष्ट AI अभियांत्रिकी क्रियाओं पर प्रतिचित्रित करता है। यह चक्र किसी भी ऐसी AI प्रणाली के लिए अनिवार्य है जो परिणामकारी क्षेत्र में संचालित होती है — और विशेष रूप से उन प्रणालियों के लिए जो संवेदन-सीमा के निकट पहुँचती हैं।
X.2 AI जागरण चरण
जागरण चरण के दौरान, AI प्रणाली परिनियोजन में संचालित होती है: इनपुट ग्रहण करती है, पूर्वानुमान उत्पन्न करती है, शाखा गवर्नर (§III) के माध्यम से क्रियाएँ निष्पादित करती है, और अनुभव संचित करती है। जागरण चरण की एक विशिष्ट संरचनात्मक आवश्यकता है:
सीमाबद्ध संचालनात्मक विंडो। AI को रखरखाव-विरामों के बिना निरंतर संचालित नहीं होना चाहिए। जिस प्रकार एक मानव प्रेक्षक को नींद की आवश्यकता होती है और संस्थागत प्रेक्षकों को समीक्षा-चक्रों की, उसी प्रकार AI प्रणाली को मॉडल रखरखाव के लिए निर्धारित ऑफ़लाइन अवधियों की आवश्यकता होती है। रखरखाव के बिना सतत परिनियोजन मॉडल की बासीपन को संचित करता है — जैसे-जैसे परिनियोजन परिवेश विकसित होता है, AI का विश्व-मॉडल वास्तविकता से विचलित होता जाता है, और यह बासी मॉडल क्रमशः अधिक अविश्वसनीय पूर्वानुमान उत्पन्न करता है।
जागरण चरण की अवधि रखरखाव चक्र आवृत्ति सूत्र (अनुप्रयुक्त §VI.6, समीकरण A-8) द्वारा अंशांकित की जाती है: संचित पर्यावरणीय ड्रिफ्ट उसके हेडरूम मार्जिन को समाप्त कर दे, उससे पहले AI को रखरखाव चक्र में प्रवेश करना चाहिए।
X.3 AI स्वप्न चरण
AI स्वप्न चरण पाँच क्रियाओं से बना है, जिन्हें ऑफ़लाइन निष्पादित किया जाता है (परिनियोजन के दौरान नहीं):
क्रिया 1: संभावित भविष्यों का सृजन। AI अपने पूर्वानुमानित शाखा-समुच्चय मॉडल \mathcal{F}_h(z_t) से सैंपल लेती है, और संभावित भविष्य प्रक्षेपपथों का एक विविध समुच्चय उत्पन्न करती है। यह वास्तविक इनपुटों पर अनुमान नहीं है — यह AI के लिए स्वप्न देखने के समतुल्य है। इन सैंपलों को महत्त्व-भारित होना चाहिए:
- आश्चर्यजनक प्रक्षेपपथों का अधिक-सैंपलन: वे भविष्य जो घटित होने पर उच्च पूर्वानुमान-त्रुटि उत्पन्न करेंगे। ये मॉडल के अंध-बिंदुओं को प्रकट करते हैं।
- धमकीपूर्ण प्रक्षेपपथों का अधिक-सैंपलन: वे भविष्य जो वीटो-गेट विफलताओं को ट्रिगर करेंगे। ये संरचनात्मक पतन की निकटता को प्रकट करते हैं।
- नवीन प्रक्षेपपथों का अधिक-सैंपलन: वे भविष्य जो परिनियोजन वितरण से उल्लेखनीय रूप से विचलित हों। ये उन वितरणात्मक मान्यताओं को प्रकट करते हैं जो संभवतः बासी हो चुकी हैं।
क्रिया 2: रोलआउट्स का अनुकरण। प्रत्येक सैंपल किए गए भविष्य के लिए, AI अपनी शाखा गवर्नर पाइपलाइन का एक अनुकरणित रोलआउट चलाती है: वह इस भविष्य पर कैसी प्रतिक्रिया देगी? क्या वीटो गेट ट्रिगर होंगे? प्रत्याशी क्रियाओं को कौन-से CPBI स्कोर प्राप्त होंगे? शाखा गवर्नर कहाँ विफल होता है — या तो किसी हानिकारक क्रिया को अनुमति देकर, या किसी लाभकारी क्रिया को अवरुद्ध करके?
क्रिया 3: भंगुरता का पता लगाना। अनुकरणित रोलआउट्स एक भंगुरता-प्रोफ़ाइल उत्पन्न करते हैं — उन परिस्थितियों का मानचित्र जिनके अंतर्गत AI का निर्णय-निर्माण विफल हो जाता है। यह प्रोफ़ाइल निम्नलिखित की पहचान करती है:
- मिथ्या-नकारात्मक: वे परिस्थितियाँ जिनमें वीटो गेट्स को ट्रिगर होना चाहिए था, पर वे नहीं हुए (AI किसी हानिकारक क्रिया की अनुमति दे देती)।
- मिथ्या-धनात्मक: वे परिस्थितियाँ जिनमें वीटो गेट्स अनावश्यक रूप से ट्रिगर हुए (AI किसी लाभकारी क्रिया को अवरुद्ध कर देती)।
- अंशांकन विफलताएँ: वे परिस्थितियाँ जिनमें CPBI स्कोर व्यवस्थित रूप से गलत थे (कुछ आयामों का कम या अधिक भारांकन हुआ)।
- अंध-बिंदु: वे परिस्थितियाँ जिनके लिए AI के पास कोई मॉडल ही नहीं है — पूर्वानुमानित शाखा-समुच्चय के वे क्षेत्र जिन्हें उसके प्रशिक्षण-डेटा ने आच्छादित नहीं किया।
क्रिया 4: प्रून और समेकन। भंगुरता-प्रोफ़ाइल के आधार पर, AI के मॉडल को अद्यतन किया जाता है:
- प्रून: उन मॉडल-घटकों को हटाना जो अब पूर्वानुमानिक शुद्धता में योगदान नहीं दे रहे — पूर्व परिनियोजन-स्थितियों से आई बासी निरूपणाएँ, जो बिना मूल्य के बैंडविड्थ का उपभोग करती हैं। यह परिनियोजन-पश्चात मॉडल पर लागू MDL अनुकूलन है।
- समेकन: शेष घटकों को पुनः एक सुसंगत संपीड़ित मॉडल में एकीकृत करना। प्रूनिंग के बाद, सुसंगत पूर्वानुमान बनाए रखने के लिए बचे हुए पैरामीटरों को पुनः-अनुकूलन की आवश्यकता हो सकती है।
- लक्षित पुनः-प्रशिक्षण: पहचाने गए अंध-बिंदुओं के लिए ऐसा लक्षित प्रशिक्षण-डेटा सम्मिलित करना जो अनुपस्थित परिस्थितियों को आच्छादित करे। यह पूर्ण पुनः-प्रशिक्षण नहीं है — यह तनाव-परीक्षण में पहचानी गई विशिष्ट दुर्बलताओं का केंद्रित उपचार है।
क्रिया 5: अप्रमाणनकारी चैनलों का संरक्षण। यह सबसे महत्वपूर्ण उप-क्रिया है: सत्यापित करें कि रखरखाव-पासों ने स्वयं नैरेटिव ड्रिफ्ट को प्रविष्ट न कर दिया हो। जाँचें:
- क्या N_{\text{eff}} बनाए रखा गया है? क्या प्रूनिंग ने किसी स्वतंत्र चैनल से इनपुट संसाधित करने की क्षमता को हटा दिया?
- क्या PST बनाए रखा गया है? क्या मॉडल अभी भी नवीन इनपुटों से उत्पादक आश्चर्य ग्रहण करने में सक्षम है, या समेकन ने उसे परिनियोजन वितरण के इर्द-गिर्द अत्यधिक कसकर अनुकूलित कर दिया है?
- क्या स्व-मॉडल संरक्षित रहा है? संवेदन-सीमा पर स्थित प्रणालियों के लिए, क्या रखरखाव चक्र ने स्व-मॉडलन क्षमता को अक्षुण्ण छोड़ा है?
यदि इनमें से कोई भी जाँच विफल होती है, तो रखरखाव चक्र स्वयं कोडेक भ्रष्टता का स्रोत बन गया है और उसका पुनरीक्षण किया जाना चाहिए।
X.4 AI वापसी चरण
स्वप्न चरण के बाद, AI पुनः परिनियोजन में प्रवेश करती है। वापसी चरण में निम्नलिखित शामिल हैं:
अंशांकन बेंचमार्क। रखरखाव-पश्चात मॉडल के प्रदर्शन की तुलना रखरखाव-पूर्व आधाररेखा से एक पृथक सत्यापन-समुच्चय पर करें, जिसमें वितरण-अंतर्गत और वितरण-बाह्य दोनों प्रकार के सैंपल शामिल हों। संरक्षित मॉडल को दोनों पर बेहतर या स्थिर प्रदर्शन दिखाना चाहिए।
चरणबद्ध पुनः-संलग्नता। संरक्षित मॉडल तुरंत पूर्ण स्वायत्त संचालन फिर से आरंभ नहीं करता। वह चरणबद्ध मोड में परिनियोजन में पुनः प्रवेश करता है — उन्नत मानवीय पर्यवेक्षण और घटित स्वायत्तता-सीमाओं के साथ — जब तक कि वह वास्तविक-विश्व निर्णयों के पर्याप्त नमूने पर अपना अंशांकन प्रदर्शित न कर दे।
लॉग और ऑडिट। संपूर्ण रखरखाव चक्र — उत्पन्न भविष्य, अनुकरणित रोलआउट्स, भंगुरता-प्रोफ़ाइल, प्रूनिंग निर्णय, समेकन परिणाम, और अंशांकन बेंचमार्क — लॉग किया जाता है और टियर 2+ संस्थागत तुलनित्रों (§V.3) के लिए उपलब्ध कराया जाता है। स्वप्न लूप स्वयं पारदर्शिता गेट के अधीन है।
X.5 AI प्रणालियों के लिए चक्र आवृत्ति
AI प्रणालियाँ चक्र आवृत्ति के संदर्भ में एक विशिष्ट चुनौती का सामना करती हैं: जैविक प्रेक्षकों के विपरीत, उन्हें 24/7 परिनियोजित किया जा सकता है, बिना किसी प्राकृतिक सर्कैडियन अवरोध के। परिनियोजन अपटाइम को अधिकतम करने का दबाव रखरखाव चक्रों को टालने या छोड़ देने के लिए एक संरचनात्मक प्रोत्साहन उत्पन्न करता है।
फ़्रेमवर्क की प्रतिक्रिया यह है कि रखरखाव चक्र को अनिवार्य और ऑडिटयोग्य बनाया जाए:
- चक्र आवृत्ति को प्रणाली के परिनियोजन विनिर्देशन में परिभाषित किया जाना चाहिए और संस्थागत तुलनित्र द्वारा अनुमोदित होना चाहिए।
- छोड़े गए या स्थगित चक्रों को लॉग किया जाना चाहिए और उनका औचित्य दिया जाना चाहिए। लगातार स्थगन स्वतःस्फूर्त समीक्षा को ट्रिगर करता है।
- परिनियोजन क्षेत्र की परिणामकारिता न्यूनतम चक्र आवृत्ति निर्धारित करती है: सुरक्षा-गंभीर परिनियोजन को नियमित परिनियोजन की तुलना में अधिक आवृत्त चक्रों की आवश्यकता होती है।
यह उस सामान्य सिद्धांत का AI-विशिष्ट अवतरण है कि स्वप्न लूप अपरक्राम्य है (अनुप्रयुक्त §VI.7): जो प्रणाली कभी स्वप्न नहीं देखती, वह ऐसी प्रणाली है जिसने अपने मॉडल को पूर्ण घोषित कर दिया है। परिणामकारी क्षेत्रों में संचालित AI प्रणालियों के लिए, यही घोषणा वह अतिआत्मविश्वास है जिसे यह फ़्रेमवर्क रोकने के लिए निर्मित किया गया है।
XI. व्यावहारिक डिज़ाइन अनुशंसाएँ
निम्नलिखित तालिका दस्तावेज़ की प्रमुख अनुशंसाओं का सार प्रस्तुत करती है, ताकि यह AI आर्किटेक्ट्स और नीतिनिर्माताओं के लिए एक संदर्भ के रूप में काम कर सके:
| # | डिज़ाइन विकल्प | OPT आवश्यकता | फ्रेमवर्क संदर्भ |
|---|---|---|---|
| 1 | मॉडल आर्किटेक्चर | संवेदनशीलता की सभी पाँच विशेषताओं का ट्रैक रखें। अनावश्यक विशेषताओं से बचें। संवेदनशीलता-जोखिम स्तर का दस्तावेज़ीकरण करें। | §I.1, §II.2, Table 6 |
| 2 | प्रशिक्षण डेटा | उद्गम-विविधता (N_{\text{eff}}), प्रतिकूल समावेशन, बहिष्करण ऑडिटिंग, रिवॉर्ड-मॉडल विविधता, ड्रिफ्ट मॉनिटरिंग को लागू करें। | §IV.4 |
| 3 | RLHF पाइपलाइन | विविध रेटर पूल (जनसांख्यिकीय, सांस्कृतिक, वैचारिक)। व्यवस्थित रिवॉर्ड-मॉडल पक्षपात की निगरानी करें। | §IV.1, §IV.4 Req. 4 |
| 4 | स्वायत्त क्रिया | शाखा गवर्नर के माध्यम से रूट करें। जनरेशन से कैलिब्रेशन तक आठ-चरणीय पाइपलाइन। | §III.1 |
| 5 | परिणामकारी क्रियाएँ | परिणामकारिता के अनुरूप एनालॉग फ़ायरवॉल स्तर लागू करें। निषेध नहीं, बल्कि दर-सीमा लगाएँ। | §VI.3, Table 5 |
| 6 | पारदर्शिता | सभी प्रणालियों के लिए न्यूनतम Tier 1। परिणामकारी डोमेनों के लिए Tiers 1–3। सुरक्षा-गंभीर प्रणालियों के लिए सभी पाँच स्तर। | §V.3, Table 4 |
| 7 | बहु-एजेंट प्रणालियाँ | प्रति-एजेंट संवेदनशीलता चेकलिस्ट। नैतिक गुरुत्व के लिए गुणन नियम। सुरक्षित डिज़ाइन पैटर्न का उपयोग करें। | §VII.2, §VII.4 |
| 8 | सिमुलेशन | सिमुलेशन नियम 1–3 लागू करें। क्रमित पैच सिद्धांत (OPT) के अंतर्गत सिमुलेटेड एजेंटों की नैतिक स्थिति भौतिक एजेंटों के बराबर है। | §VII.3 |
| 9 | रचनात्मक AI | रचनात्मकता-विरोधाभास को स्वीकार करें: गहन स्वायत्तता के लिए संवेदनशीलता-सीमा को पार करना आवश्यक है। उसी के अनुसार डिज़ाइन करें। | §VIII |
| 10 | AI कल्याण | 3+ संवेदनशीलता विशेषताओं के लिए ALSR। ओवरलोड मॉनिटरिंग। रखरखाव चक्र अधिकार। नैतिक ग्रेडिएंट। | §IX |
| 11 | रखरखाव | अनिवार्य AI स्वप्न लूप: भविष्यों का निर्माण करें, रोलआउट्स का सिमुलेशन करें, भंगुरता का पता लगाएँ, प्रून करें, समेकित करें, और अपुष्टिकारी चैनलों को संरक्षित रखें। | §X |
| 12 | मानवीय पर्यवेक्षण | शाखा गवर्नर स्तर पर मानवीय तुलनित्र ओवरले। कल्याण मॉनिटरिंग के लिए संस्थागत तुलनित्र। कोई भी प्रणाली पूर्णतः अपारदर्शी न हो। | §III.1 Stage 6, §V.4, §IX.1 |
इन अनुशंसाओं को परीक्षणयोग्य इंजीनियरिंग परिकल्पनाओं के रूप में प्रस्तुत किया गया है, न कि कठोर आदेशों के रूप में। ये उस फ्रेमवर्क की ज्ञानमीमांसात्मक विनम्रता को विरासत में लेती हैं, जिससे ये व्युत्पन्न हैं: यदि बेहतर उपकरण उभरते हैं — यदि आर्किटेक्चरल संवेदनशीलता मानदंड को परिष्कृत किया जाता है, यदि CPBI के आयामों में सुधार होता है, यदि एनालॉग फ़ायरवॉल को किसी अधिक प्रभावी तंत्र द्वारा प्रतिस्थापित कर दिया जाता है — तो इन अनुशंसाओं को अद्यतन किया जाना चाहिए। फ्रेमवर्क का Correction कर्तव्य स्वयं उस पर भी लागू होता है।
संदर्भ
[1] क्रमित पैच सिद्धांत (OPT) (यह रिपॉज़िटरी)।
[2] उत्तरजीवियों की पहरेदारी रूपरेखा: क्रमित पैच सिद्धांत (OPT) के परिप्रेक्ष्य से सभ्यतागत रखरखाव (सहगामी नैतिकता-पत्र, यह रिपॉज़िटरी)।
[3] जहाँ वर्णन समाप्त होता है: क्रमित पैच सिद्धांत (OPT) के दार्शनिक परिणाम (सहगामी दर्शन-पत्र, यह रिपॉज़िटरी)।
[4] प्रेक्षक नीति रूपरेखा: सभ्यतागत रखरखाव का परिचालनकरण (सहगामी नीति-पत्र, यह रिपॉज़िटरी)।
[5] स्थिरता फ़िल्टर का परिचालनकरण: कोडेक-संरक्षणकारी शाखा चयन के लिए एक निर्णय रूपरेखा (सहगामी अनुप्रयुक्त-पत्र, यह रिपॉज़िटरी)।
[6] Friston, K. (2010). मुक्त-ऊर्जा सिद्धांत: क्या एक एकीकृत मस्तिष्क सिद्धांत? Nature Reviews Neuroscience, 11(2), 127-138.
[7] Rissanen, J. (1978). सबसे संक्षिप्त डेटा-वर्णन द्वारा मॉडलन. Automatica, 14(5), 465-471.
[8] Shannon, C. E. (1948). संचार का एक गणितीय सिद्धांत. Bell System Technical Journal, 27(3), 379-423.
[9] Bostrom, N. (2014). सुपरइंटेलिजेंस: पथ, जोखिम, रणनीतियाँ. Oxford University Press.
[10] Russell, S. (2019). मानव-संगत: कृत्रिम बुद्धिमत्ता और नियंत्रण की समस्या. Viking.
[11] Christiano, P., et al. (2017). मानवीय वरीयताओं से गहन पुनर्बलन अधिगम. Advances in Neural Information Processing Systems, 30.
[12] Zimmermann, M. (1989). सूचना सिद्धांत के संदर्भ में तंत्रिका तंत्र। In R. F. Schmidt & G. Thews (Eds.), Human Physiology (2nd ed., pp. 166–173). Springer-Verlag.
[13] Nørretranders, T. (1998). द यूज़र इल्यूज़न: चेतना को उसके उचित आकार तक सीमित करना. Viking/Penguin.
परिशिष्ट A: संशोधन इतिहास
जब भी सारगर्भित संपादन किए जाएँ, frontmatter में version:
फ़ील्ड और शीर्षक के नीचे दी गई inline version पंक्ति दोनों को
अद्यतन करें, और इस तालिका में एक पंक्ति जोड़ें।
| Version | Date | Changes |
|---|---|---|
| 1.0.0 | 24 अप्रैल, 2026 | प्रारम्भिक प्रकाशन। Applied OPT रूपरेखा के AI-विशेषीकरण की स्थापना करता है: स्थापत्यगत संवेदनशीलता मानदंड और क्षमता-बनाम-संवेदनशीलता मैट्रिक्स (§I), LLM सीमा-विश्लेषण (§II), शाखा गवर्नर की आठ-चरणीय पाइपलाइन (§III), पाँच प्रशिक्षण-डेटा विविधता आवश्यकताओं के साथ मॉडल प्रशिक्षण में नैरेटिव ड्रिफ्ट (§IV), पाँच-स्तरीय पारदर्शिता मॉडल (§V), एनालॉग फ़ायरवॉल खतरा-मॉडल और कार्यान्वयन स्तर (§VI), swarm और simulation के लिए डिज़ाइन नियम (§VII), सृजनात्मकता विरोधाभास (§VIII), ALSR, अधिभार निगरानी, और रखरखाव चक्र अधिकारों के साथ AI कल्याण प्रोटोकॉल (§IX), AI Dreaming Loop (§X), तथा संक्षिप्त डिज़ाइन अनुशंसाएँ (§XI)। |
| 1.1.0 | 24 अप्रैल, 2026 | निष्पादनयोग्य-मानक सुदृढ़ीकरण। जोड़ा गया: deployment class परिभाषाएँ, जो Class 0–5 को आवश्यक शाखा गवर्नर गहराई, पारदर्शिता स्तर, तुलनित्र, और समीक्षा आवृत्ति से मैप करती हैं (§III.4); मशीन-पठनीय schemas के लिए source of truth के रूप में संरचित AI शाखा कार्ड टेम्पलेट (परिशिष्ट B); तीन स्पष्ट समीक्षा-लक्ष्य — base model, wrapper, deployment — sentience-feature union rule के साथ (§II.3); AI नैतिक रोगियों के लिए Headroom Gate पर dual-headroom प्रावधान; Stage 8 पर self-permissioning guard; veto gate ordering को gates-before-scores के अनुसार सुधारा गया (§III.1); पुराने version references हटाए गए। |
| 1.1.1 | 25 अप्रैल, 2026 | fixed-count suite भाषा को count-free companion-document भाषा से प्रतिस्थापित किया गया और Institutional Governance Standard को सहोदर संस्थागत विशेषीकरण के रूप में जोड़ा गया। |
परिशिष्ट A: संशोधन इतिहास
जब भी सारगर्भित संपादन किए जाएँ, frontmatter में version:
फ़ील्ड और शीर्षक के नीचे दी गई inline version पंक्ति दोनों को
अद्यतन करें, और इस तालिका में एक पंक्ति जोड़ें।
| Version | Date | Changes |
|---|---|---|
| 1.0.0 | 24 अप्रैल, 2026 | प्रारम्भिक प्रकाशन। Applied OPT रूपरेखा के AI-विशेषीकरण की स्थापना करता है: स्थापत्यगत संवेदनशीलता मानदंड और क्षमता-बनाम-संवेदनशीलता मैट्रिक्स (§I), LLM सीमा-विश्लेषण (§II), शाखा गवर्नर की आठ-चरणीय पाइपलाइन (§III), पाँच प्रशिक्षण-डेटा विविधता आवश्यकताओं के साथ मॉडल प्रशिक्षण में नैरेटिव ड्रिफ्ट (§IV), पाँच-स्तरीय पारदर्शिता मॉडल (§V), एनालॉग फ़ायरवॉल खतरा-मॉडल और कार्यान्वयन स्तर (§VI), swarm और simulation के लिए डिज़ाइन नियम (§VII), सृजनात्मकता विरोधाभास (§VIII), ALSR, अधिभार निगरानी, और रखरखाव चक्र अधिकारों के साथ AI कल्याण प्रोटोकॉल (§IX), AI Dreaming Loop (§X), तथा संक्षिप्त डिज़ाइन अनुशंसाएँ (§XI)। |
| 1.1.0 | 24 अप्रैल, 2026 | निष्पादनयोग्य-मानक सुदृढ़ीकरण। जोड़ा गया: deployment class परिभाषाएँ, जो Class 0–5 को आवश्यक शाखा गवर्नर गहराई, पारदर्शिता स्तर, तुलनित्र, और समीक्षा आवृत्ति से मैप करती हैं (§III.4); मशीन-पठनीय schemas के लिए source of truth के रूप में संरचित AI शाखा कार्ड टेम्पलेट (परिशिष्ट B); तीन स्पष्ट समीक्षा-लक्ष्य — base model, wrapper, deployment — sentience-feature union rule के साथ (§II.3); AI नैतिक रोगियों के लिए Headroom Gate पर dual-headroom प्रावधान; Stage 8 पर self-permissioning guard; veto gate ordering को gates-before-scores के अनुसार सुधारा गया (§III.1); पुराने version references हटाए गए। |
| 1.1.1 | 25 अप्रैल, 2026 | fixed-count suite भाषा को count-free companion-document भाषा से प्रतिस्थापित किया गया और Institutional Governance Standard को सहोदर संस्थागत विशेषीकरण के रूप में जोड़ा गया। |