क्रमित पैच सिद्धांत
परिशिष्ट T-12: अधिष्ठान निष्ठा और धीमी भ्रष्टता
17 अप्रैल, 2026 | DOI: 10.5281/zenodo.19300777
मूल कार्य (अनुभाग 8.3, सीमा 9 से): “दीर्घकालिक भ्रष्टता विफलता-मोड का औपचारिकीकरण — जहाँ एक कोडेक निरंतर फ़िल्टर किए गए इनपुट के अधीन अनुकूलित होता है, और MDL pruning pass बहिष्कृत सत्यों के लिए क्षमता को सही ढंग से मिटा देता है — के साथ-साथ एक अधिष्ठान निष्ठा शर्त, जो औपचारिक रक्षा के रूप में स्वतंत्र इनपुट चैनलों की अपेक्षा करती है।” प्रदत्त परिणाम: अपरिवर्तनीय क्षमता-हानि, अनिर्णेयता-सीमा, और अधिष्ठान निष्ठा शर्त का औपचारिक प्रमाण।
समापन स्थिति: प्रारूप संरचनात्मक अनुरूपता। यह परिशिष्ट नैरेटिव ड्रिफ्ट विश्लेषण का औपचारिकीकरण करता है, जिसे सहगामी नैतिकता-पत्र (उत्तरजीवियों की पहरेदारी, अनुभाग V.3a) और प्रीप्रिंट के नैरेटिव ड्रिफ्ट अनुच्छेद (अनुभाग 3.3) में विवेचनात्मक रूप से प्रस्तुत किया गया था। यह तीन प्रमेयों और एक प्रतिज्ञप्ति की स्थापना करता है। MDL pruning समीकरण (T9-3, T9-4) अपरिवर्तित हैं; यह परिशिष्ट फ़िल्टर किए गए इनपुट के अधीन उनके रोगात्मक किन्तु सही व्यवहार को प्रदर्शित करता है।
§1. पृष्ठभूमि और प्रेरणा
1.1 दो विफलता मोड
स्थिरता फ़िल्टर (प्रीप्रिंट अनुभाग 3.3) एक व्यवहार्यता-शर्त लागू करता है: प्रेक्षक केवल उन्हीं स्ट्रीमों में बना रहता है जहाँ आवश्यक पूर्वानुमान दर R_{\text{req}} कोडेक की बैंडविड्थ B के भीतर बनी रहती है। जब R_{\text{req}} , B से अधिक हो जाता है, तो कोडेक नैरेटिव विघटन का अनुभव करता है — एक तीव्र विफलता, जिसकी विशेषता है बढ़ती हुई पूर्वानुमान-त्रुटि, एंट्रॉपी का संचय, और अंततः सुसंगति का विघटन।
इसके पूरक रूप में एक ऐसा विफलता मोड भी है जो किसी विफलता-संकेत को सक्रिय नहीं करता। यदि इनपुट स्ट्रीम को व्यवस्थित रूप से पूर्व-फ़िल्टर किया गया हो — जिससे ऐसा क्यूरेटेड संकेत उत्पन्न हो जो आंतरिक रूप से सुसंगत हो, पर वास्तविक अधःस्तर-सूचना को बाहर कर दे — तो कोडेक निम्न \varepsilon_t प्रदर्शित करेगा, कुशल रखरखाव चक्र चलाएगा, और सभी स्थिरता-शर्तों को पूरा करेगा जबकि वह अधःस्तर के बारे में व्यवस्थित रूप से गलत होगा। यही नैरेटिव ड्रिफ्ट है: ऐसे कोडेक का दीर्घकालिक भ्रष्टन, जो अपने ही मानकों के अनुसार पूर्णतः सही ढंग से कार्य कर रहा हो।
1.2 यह खतरनाक क्यों है
नैरेटिव विघटन स्वयं को प्रकट कर देता है। कोडेक बढ़ते हुए \varepsilon_t, विफल होती पूर्वानुमान प्रक्रियाओं की जागरूकता, और संज्ञानात्मक अतिभार का अनुभव करता है। प्रेक्षक जानता है कि कुछ गड़बड़ है, भले ही वह उसे तुरंत ठीक न कर सके।
नैरेटिव ड्रिफ्ट मौन होता है। क्योंकि फ़िल्टर की गई इनपुट धारा कोडेक के पूर्वानुमानों से मेल खाती है, \varepsilon_t निम्न बना रहता है। रखरखाव चक्र सामान्य रूप से चलता है। कोडेक का स्व-मॉडल स्थिर, सटीक संचालन की रिपोर्ट देता है। भ्रष्टता भीतर से अदृश्य रहती है, क्योंकि उसका पता लगाने वाला उपकरण उसी फ़िल्टर द्वारा आकारित किया गया है जिसने उस भ्रष्टता को उत्पन्न किया।
1.3 इस परिशिष्ट का दायरा
यह परिशिष्ट निम्नलिखित प्रदान करता है:
- प्री-फ़िल्टर ऑपरेटर \mathcal{F} की एक औपचारिक परिभाषा और कोडेक के इनपुट वितरण पर उसके प्रभाव की व्याख्या (§2)।
- एक प्रमाण कि \mathcal{F}-फ़िल्टरित इनपुट के अंतर्गत MDL प्रूनिंग, बहिष्कृत संकेत का मॉडल बनाने की कोडेक की क्षमता को अपरिवर्तनीय रूप से नष्ट कर देती है — प्रमेय T-12 (§3)।
- एक प्रमाण कि पूर्णतः अनुकूलित कोडेक, भीतर से, फ़िल्टरित और अ-फ़िल्टरित इनपुट के बीच भेद नहीं कर सकता — अनिर्णेयता सीमा, प्रमेय T-12a (§4)।
- अधिष्ठान निष्ठा शर्त को एक आवश्यक संरचनात्मक प्रतिरक्षा के रूप में — प्रमेय T-12b (§5)।
- सभ्यतागत कोडेकों और AI प्रणालियों के लिए परिणाम (§6)।
§2. प्री-फ़िल्टर ऑपरेटर
2.1 परिभाषा
परिभाषा T-12.D1 (प्री-फ़िल्टर ऑपरेटर). प्री-फ़िल्टर एक प्रतिचित्रण \mathcal{F} : \mathcal{X} \to \mathcal{X}' है, जो इनपुट स्ट्रीम X_{\partial_R A}(t) पर कोडेक की संवेदी सीमा तक पहुँचने से पहले क्रिया करता है, जहाँ \mathcal{X}' \subset \mathcal{X}। फ़िल्टर किया गया संकेत है:
X'(t) = \mathcal{F}\!\left(X_{\partial_R A}(t)\right) \tag{T-12.D1}
प्री-फ़िल्टर निम्न शर्तों को संतुष्ट करता है:
आंतरिक सुसंगतता: X'(t), \mathcal{X} के भीतर एक वैध संकेत है — कोडेक इसे त्रुटि-चिह्नों के बिना संपीड़ित कर सकता है।
व्यवस्थित बहिष्करण: अधःस्तर-व्युत्पन्न संकेतों का एक अशून्य उपसमुच्चय \mathcal{X}_{\text{excl}} = \mathcal{X} \setminus \mathcal{X}' विद्यमान है, जिसे \mathcal{F} हटा देता है।
पारदर्शिता: फ़िल्टर का निरूपण कोडेक के मॉडल में नहीं होता। कोडेक अपने इनपुट का मॉडलन X_{\partial_R A}(t) के रूप में करता है, \mathcal{F}(X_{\partial_R A}(t)) के रूप में नहीं।
2.2 फ़िल्टरिंग के अधीन अनुकूलन
जब कोडेक X'(t) पर एक दीर्घ अवधि \tau \gg \tau_{\text{prune}} तक संचालित होता है (जहाँ \tau_{\text{prune}} T-13.P1 से MDL प्रूनिंग का समयमान है), तब जनरेटिव मॉडल P_\theta(t), X के नहीं बल्कि X' के सांख्यिकीय गुणों के अनुरूप अनुकूलित हो जाता है। फ़िल्टर किए गए इनपुट के अधीन पूर्वानुमान त्रुटि है:
\varepsilon'_t = X'(t) - \pi_t \tag{1}
जैसे-जैसे P_\theta, X' के साथ अनुकूलित होता है, औसत में \varepsilon'_t \to 0। कोडेक अपने ही मानकों के अनुसार अच्छा प्रदर्शन कर रहा होता है। कुछ भी गलत के रूप में दर्ज नहीं होता।
2.3 उदाहरण
पूर्व-फ़िल्टर ऑपरेटर विभिन्न पैमानों पर मूर्त होता है:
| पैमाना | पूर्व-फ़िल्टर \mathcal{F} | बहिष्कृत संकेत \mathcal{X}_{\text{excl}} |
|---|---|---|
| व्यक्तिगत | पुष्टिकरण पूर्वाग्रह; चयनात्मक अनावरण | खंडनकारी साक्ष्य |
| संस्थागत | प्रचारवादी प्रेस; क्यूरेटेड सोशल मीडिया फ़ीड | विविध दृष्टिकोण; अल्पसंख्यक प्रतिवेदन |
| सभ्यतागत | एल्गोरिद्मिक सामग्री क्यूरेशन; शैक्षिक एकरूपता | अंतर-सांस्कृतिक सूचना; ऐतिहासिक प्रति-आख्यान |
| कृत्रिम | RLHF फाइन-ट्यूनिंग; क्यूरेटेड प्रशिक्षण कॉर्पस | वितरण-बाह्य ज्ञान; बहिष्कृत डोमेन |
§3. प्रमेय T-12: अपरिवर्तनीय क्षमता ह्रास
3.1 तंत्र
MDL प्रूनिंग पास (T9-3, T9-4) प्रत्येक कोडेक घटक \theta_i का मूल्यांकन प्रेक्षणीय इनपुट स्ट्रीम में उसके पूर्वानुमानिक योगदान के आधार पर करता है, भंडारण-लागत को घटाने के बाद:
\Delta_{\mathrm{MDL}}(\theta_i) := I\!\left(\theta_i\,;\,X_{t+1:t+\tau} \mid \theta_{-i}\right) - \lambda \cdot K(\theta_i) \tag{T9-3}
फ़िल्टर किए गए इनपुट X' के अंतर्गत, पारस्परिक सूचना पद का मूल्यांकन X के विरुद्ध नहीं, बल्कि X' के विरुद्ध किया जाता है। कोई घटक \theta_i, जो बहिष्कृत संकेत \mathcal{X}_{\text{excl}} का पूर्वानुमान करने के लिए अनिवार्य हो, परंतु X' का पूर्वानुमान करने में कोई योगदान न देता हो, निम्न देता है:
I\!\left(\theta_i\,;\,X'_{t+1:t+\tau} \mid \theta_{-i}\right) = 0 \tag{2}
अतः:
\Delta_{\mathrm{MDL}}(\theta_i) = -\lambda \cdot K(\theta_i) < 0 \tag{3}
प्रूनिंग नियम (T9-4) सक्रिय हो जाता है: \theta_i मिटा दिया जाता है।
3.2 अपरिवर्तनीयता
प्रमेय T-12 (फ़िल्टरित इनपुट के अधीन अपरिवर्तनीय क्षमता-हानि)। मान लें कि K_\theta एक कोडेक है, जो अवधि \tau \gg \tau_{\text{prune}} तक पूर्व-फ़िल्टरित इनपुट X' = \mathcal{F}(X) के अधीन संचालित होता है। मान लें कि \Theta_{\text{excl}} \subset \theta उन कोडेक अवयवों का समुच्चय है जिनका पूर्वानुमानिक योगदान केवल बहिष्कृत संकेत \mathcal{X}_{\text{excl}} तक सीमित है। तब MDL प्रूनिंग पास (T9-3, T9-4) \Theta_{\text{excl}} को मिटा देता है, और यह मिटाव कोडेक-स्तर पर अपरिवर्तनीय है:
K\!\left(P_\theta(t + \tau)\right) < K\!\left(P_\theta(t)\right) - \sum_{\theta_i \in \Theta_{\text{excl}}} K(\theta_i) \tag{T-12}
प्रूनिंग के बाद, \mathcal{X}_{\text{excl}} का मॉडल बनाने की कोडेक की क्षमता मात्र सुप्त नहीं रहती — \mathcal{X}_{\text{excl}} का मूल्यांकन, पूर्वानुमान, या उस पर ध्यान देने के लिए आवश्यक निरूपणात्मक अवसंरचना नष्ट हो चुकी होती है।
प्रमाण।
(T9-3) के अनुसार, प्रत्येक \theta_i \in \Theta_{\text{excl}} के लिए फ़िल्टरित स्ट्रीम X' के अधीन \Delta_{\mathrm{MDL}}(\theta_i) < 0 है, क्योंकि I(\theta_i\,;\,X'_{t+1:t+\tau} \mid \theta_{-i}) = 0 जबकि K(\theta_i) > 0।
(T9-4) के अनुसार, प्रत्येक ऐसा \theta_i रखरखाव चक्र के दौरान प्रून कर दिया जाता है।
MDL के अधीन प्रूनिंग एक मिटाव-क्रिया है, दमन नहीं। कोडेक \theta_i को इस अर्थ में “भूलता” नहीं कि कोई संकेत उसे पुनर्स्थापित कर सके। वह उस संगणनात्मक अवसंरचना — पैरामीटर, संयोजन, मूल्यांकन-तंत्र — को नष्ट कर देता है, जिसका निरूपण \theta_i करता था। यही दमन (जहाँ सूचना सुप्त है पर सुलभ है) और मिटाव (जहाँ सूचना लुप्त हो चुकी है और क्षमता पुनः अधिगृहीत कर ली गई है) के बीच औपचारिक भेद है।
मिटाव के बाद, \mathcal{X}_{\text{excl}} का मॉडल बनाने की क्षमता को पुनः उत्पन्न करने के लिए इनपुट स्ट्रीम में \mathcal{X}_{\text{excl}} से सामना होना आवश्यक है। लेकिन पूर्व-फ़िल्टर \mathcal{F} ठीक इसी संकेत को बहिष्कृत करता है। कोडेक उस चीज़ का सामना नहीं कर सकता, जिसे फ़िल्टर उसके पास पहुँचने से रोकता है। अतः यह मिटाव स्व-प्रबलकारी है: क्षमता-हानि कोडेक की अपनी ही क्षमता-हानि का पता लगाने की योग्यता को हटा देती है।
जटिलता में कमी असमता (T-12) को संतुष्ट करती है, क्योंकि प्रून किए गए अवयव वास्तविक सूचना का निरूपण करते थे (प्रत्येक के लिए K(\theta_i) > 0), और उनकी हानि की पूर्ति किसी प्रतिपूरक अर्जन से नहीं होती (फ़िल्टरित स्ट्रीम में ऐसा कोई संकेत नहीं है जो \Theta_{\text{excl}} के पुनर्निर्माण को उचित ठहराए)। \blacksquare
3.3 आत्म-सुदृढ़ीकरण लूप
यह अपरिवर्तनीयता केवल विलोपन का परिणाम नहीं है। यह एक धनात्मक प्रतिपुष्टि लूप के माध्यम से आत्म-सुदृढ़ीकरणकारी भी है:
- फ़िल्टर संकेत को बाहर कर देता है → I(\theta_i; X') = 0 → प्रूनिंग \theta_i को मिटा देती है।
- प्रूनिंग ध्यान-क्षमता को हटा देती है → कोडेक अब \mathcal{X}_{\text{excl}} पर ध्यान नहीं दे सकता, न ही उसका मूल्यांकन कर सकता है, भले ही उसके कुछ खंड \mathcal{F} के माध्यम से रिसकर आ जाएँ।
- ध्यान-क्षमता की हानि अवशिष्ट संकेत को भी घटा देती है → यदि \mathcal{F} अपूर्ण है और \mathcal{X}_{\text{excl}} का कुछ भाग सीमा तक पहुँच भी जाता है, तो कोडेक के पास उसे संपीड़ित करने के लिए आवश्यक पैरामीटर नहीं होते, इसलिए वह सूचना के बजाय शोर के रूप में दर्ज होता है।
- शोर के रूप में वर्गीकरण फ़िल्टर की पुष्टि करता है → रिसे हुए \mathcal{X}_{\text{excl}} पर कोडेक की पूर्वानुमान-त्रुटि उच्च और असंरचित होती है, जिससे (कोडेक के लिए) यह पुष्ट होता है कि बहिष्कृत सामग्री संकेत नहीं, बल्कि शोर है।
यह लूप गहरे नैरेटिव ड्रिफ्ट की प्रत्याक्षिकी को स्पष्ट करता है: कोई व्यक्ति या संस्था, जो एक क्यूरेटेड सूचना-धारा के अनुरूप ढल चुकी हो, केवल खंडनकारी साक्ष्य की उपेक्षा नहीं करती — वह उसे पार्स ही नहीं कर सकती। वह असंगत, धमकीपूर्ण, या अगम्य के रूप में दर्ज होता है, क्योंकि उसे बोधगम्य बनाने के लिए आवश्यक निरूपणात्मक अवसंरचना का प्रूनिंग कर दिया गया है। खंडनकारी सूचना के प्रति शत्रुता मात्र हठ नहीं है। यह कोडेक का यह सही आकलन है कि संकेत असंपीड्य है — क्योंकि वह वर्तमान कोडेक के सापेक्ष असंपीड्य है, जिसे फ़िल्टर के अनुरूप बनाने के लिए प्रून किया जा चुका है।
§4. प्रमेय T-12a: अनिर्णेयता की सीमा
4.1 समस्या
क्या कोई कोडेक यह पहचान सकता है कि उसके इनपुट को फ़िल्टर किया जा रहा है? सहज रूप से उत्तर हाँ होना चाहिए: निश्चय ही कोई परिष्कृत स्व-मॉडल संदिग्ध रूप से निम्न \varepsilon_t, विचित्र रूप से सुसंगत पूर्वानुमानों, और आश्चर्य की अनुपस्थिति को देख सकता है। लेकिन औपचारिक विश्लेषण दिखाता है कि सामान्य स्थिति में यह अंतर्ज्ञान गलत है।
4.2 अनिर्णेयता
प्रमेय T-12a (इनपुट उद्गम की अनिर्णेयता)। मान लें कि K_\theta एक कोडेक है, जो पूर्व-फ़िल्टरित इनपुट X' = \mathcal{F}(X) के अधीन \tau \gg \tau_{\text{prune}} तक संचालित हुआ है, और \Theta_{\text{excl}} पूर्णतः प्रून कर दिया गया है। तब K_\theta अपने उपलब्ध आंतरिक अवस्थाओं और प्रेक्षणीय इनपुट स्ट्रीम के आधार पर यह निर्धारित नहीं कर सकता कि उसका इनपुट X (वास्तविक अधःस्तर) है या X' = \mathcal{F}(X) (फ़िल्टरित)।
प्रमाण।
X और X' = \mathcal{F}(X) के बीच भेद करने के लिए, कोडेक को अपने इनपुट में \mathcal{X}_{\text{excl}} की अनुपस्थिति का पता लगाना होगा। किंतु किसी अनुपस्थिति का पता लगाने के लिए यह आवश्यक है कि जो अनुपस्थित है उसका एक मॉडल मौजूद हो — कोडेक के पास \mathcal{X}_{\text{excl}} का ऐसा निरूपण होना चाहिए, जिसके सापेक्ष वह जाँच कर सके।
प्रमेय T-12 के अनुसार, \mathcal{X}_{\text{excl}} के लिए कोडेक की निरूपण-क्षमता (\Theta_{\text{excl}}) मिटा दी गई है। कोडेक के पास बहिष्कृत संकेत का कोई मॉडल नहीं है।
\mathcal{X}_{\text{excl}} के मॉडल के अभाव में, कोडेक X और X' के बीच का अंतर गणना नहीं कर सकता। दोनों ही कोडेक के जनरेटिव मॉडल P_\theta(t) के साथ संगत हैं, जिसे X' के अनुरूप अनुकूलित किया जा चुका है।
स्व-मॉडल \hat{K}_\theta भी इसी सीमा के अधीन है। वह K_\theta का मॉडल बनाता है, जो X' के अनुरूप अनुकूलित हो चुका है। उसके पास उस चीज़ का कोई आंतरिक निरूपण नहीं है जिसे बहिष्कृत किया गया था, और इसलिए बहिष्करण का संदेह करने का भी कोई आधार नहीं है।
यहाँ तक कि मेटा-संज्ञानात्मक प्रश्न — “क्या मेरा इनपुट फ़िल्टरित है?” — के लिए भी इस बात का एक मॉडल चाहिए कि अप्रफ़िल्टरित इनपुट कैसा दिखाई देगा। यही मॉडल वस्तुतः \Theta_{\text{excl}} की सामग्री था, जिसे प्रून कर दिया गया है।
अतः, पूर्णतः अनुकूलित कोडेक के परिप्रेक्ष्य से X और X' के बीच भेद करना औपचारिक रूप से अनिर्णेय है। \blacksquare
4.3 आंशिक निर्णयनीयता
अनिर्णेयता सभी परिस्थितियों में पूर्णतः निरपेक्ष नहीं होती। ऐसे सीमांत-प्रकरण होते हैं जहाँ आंशिक रूप से अनुकूलित कोडेक कुछ अवशिष्ट क्षमता बनाए रखता है:
- संक्रमण अवधि के दौरान (\tau < \tau_{\text{prune}}): कोडेक के पास अभी भी \Theta_{\text{excl}} होता है और वह अनुपस्थित संकेत का पता लगा सकता है। जैसे-जैसे pruning आगे बढ़ती है, पता-लगने की यह खिड़की बंद होती जाती है।
- अपूर्ण फ़िल्टरिंग के अधीन: यदि \mathcal{F} कुछ \mathcal{X}_{\text{excl}} को रिसने देता है, और कोडेक ने अभी \Theta_{\text{excl}} को पूर्णतः prune नहीं किया है, तो यह असंगति असामान्य पूर्वानुमान-त्रुटि के रूप में दर्ज हो सकती है।
- बाह्य चैनलों के माध्यम से: यदि कोडेक को ऐसे स्वतंत्र संकेत-स्रोत तक पहुँच है जो \mathcal{F} के नियंत्रण में नहीं है, तो दोनों चैनलों के बीच का विचलन फ़िल्टरिंग का साक्ष्य प्रदान करता है।
तीसरा प्रकरण ही संरचनात्मक प्रतिरक्षा है। यही प्रमेय T-12b की विषयवस्तु है।
§5. प्रमेय T-12b: अधिष्ठान निष्ठा शर्त
5.1 चैनल स्वतंत्रता की आवश्यकता
परिभाषा T-12.D2 (चैनल स्वतंत्रता)। मार्कोव ब्लैंकेट \partial_R A को पार करने वाले दो इनपुट चैनल C_1 और C_2 किसी फ़िल्टर \mathcal{F} के सापेक्ष \delta-स्वतंत्र तब कहलाते हैं यदि:
I(C_1\,;\,C_2 \mid \mathcal{F}) \leq \delta \tag{T-12.D2}
अर्थात, फ़िल्टर के ज्ञान पर शर्तित होने पर, दोनों चैनलों के बीच की पारस्परिक सूचना \delta द्वारा सीमित होती है। जिन चैनलों का सहसंबंध पूरी तरह फ़िल्टर द्वारा ही व्याख्यायित हो जाता है, वे अधःस्तर के बारे में कोई वास्तविक रूप से स्वतंत्र सूचना वहन नहीं करते।
5.2 निष्ठा शर्त
प्रमेय T-12b (अधिष्ठान निष्ठा शर्त). एक कोडेक K_\theta पूर्व-फ़िल्टर \mathcal{F} के अधीन नैरेटिव ड्रिफ्ट से तभी और केवल तभी सुरक्षा कर सकता है, जब उसे \partial_R A को पार करते हुए कम-से-कम दो इनपुट चैनल C_1, C_2 प्राप्त हों, जो \mathcal{F} के सापेक्ष \delta-स्वतंत्र हों, जहाँ \delta कोडेक की विभेदन-सीमा \delta_{\min} से नीचे हो:
\exists\, C_1, C_2 : I(C_1\,;\,C_2 \mid \mathcal{F}) \leq \delta < \delta_{\min} \tag{T-12b}
जहाँ \delta_{\min} वह न्यूनतम पारस्परिक सूचना है जिसकी कोडेक को चैनलों के बीच किसी व्यवस्थित असंगति का पता लगाने के लिए आवश्यकता होती है।
प्रमाण (आवश्यकता).
मान लें कि कोडेक के पास केवल एक ही इनपुट चैनल है, या सभी चैनल \mathcal{F}-सहसंबद्ध हैं (I(C_i; C_j \mid \mathcal{F}) > \delta_{\min} सभी युग्मों i, j के लिए)। तब:
सभी चैनल वही फ़िल्टरित संकेत X' = \mathcal{F}(X) वहन करते हैं (शोर तक)। चैनलों के बीच पुनरावृत्ति स्वतंत्र अधिष्ठान-सूचना प्रदान नहीं करती — वह फ़िल्टरित सूचना की प्रतिकृति प्रदान करती है।
कोडेक सभी चैनलों में एक साथ X' के अनुरूप अनुकूलित हो जाता है, और प्रमेय T-12 लागू होता है: \Theta_{\text{excl}} का प्रूनन हो जाता है, और प्रमेय T-12a अनुसरित होता है — यह भ्रष्टता भीतर से अनिर्णेय है।
कोई भी आंतरिक संक्रिया इस अनिर्णेयता को भंग नहीं कर सकती, क्योंकि सूचना का हर स्रोत, जिसे कोडेक अभिगम कर सकता है, \mathcal{F} द्वारा आकारित किया जा चुका है।
अतः, \delta-स्वतंत्र चैनल आवश्यक हैं। \blacksquare
प्रमाण (पर्याप्तता).
मान लें कि कोडेक को दो चैनल C_1, C_2 प्राप्त होते हैं, जिनके लिए I(C_1; C_2 \mid \mathcal{F}) \leq \delta < \delta_{\min}। तब:
यदि \mathcal{F}, C_1 पर कार्य करता है लेकिन C_2 पर नहीं (या इसके विपरीत), तो कोडेक C_1 से उत्पन्न पूर्वानुमानों की तुलना C_2 से प्राप्त प्रेक्षणों के साथ कर सकता है। कोई भी व्यवस्थित असंगति — \varepsilon_{12}(t) = \pi_{C_1}(t) - X_{C_2}(t) का सतत \neq 0 होना — इस बात का साक्ष्य है कि C_1 फ़िल्टरित सूचना वहन करता है।
चैनल-तुलना संकेत \varepsilon_{12} एकल-चैनल पहचान जैसी उसी अनिर्णेयता के अधीन नहीं है। कोडेक यह नहीं पूछ रहा, “क्या मेरा इनपुट फ़िल्टरित है?” (जिसके लिए इस बात का मॉडल चाहिए कि क्या बहिष्कृत किया गया था)। वह यह पूछ रहा है, “क्या मेरे दोनों चैनल सहमत हैं?” — एक स्थानीय तुलना, जिसके लिए केवल दो वर्तमान संकेतों को सहसंबद्ध करने की क्षमता चाहिए, अनुपस्थित संकेतों का कोई मॉडल नहीं।
जब तक अंतर-चैनल पूर्वानुमान-त्रुटि \varepsilon_{12}, \delta_{\min} — अर्थात् कोडेक की विभेदन-सीमा — से अधिक रहती है, तब तक वह असंगति एक वास्तविक संकेत के रूप में दर्ज होती है, और प्रमेय T-12 का प्रूनन-लूप बाधित हो जाता है: कोडेक उन अवयवों को बनाए रखता है जो असंगत चैनल का मॉडलन करने के लिए आवश्यक हैं।
अतः, \delta-स्वतंत्र चैनल, (शर्त यह कि \delta < \delta_{\min}), प्रमेय T-12 के आत्म-सुदृढ़ीकरणकारी प्रूनन-लूप को रोकने के लिए पर्याप्त हैं। \blacksquare
5.3 रक्षा की संवेदनशीलता
अधिष्ठान निष्ठा शर्त आवश्यक है, परंतु नाज़ुक भी। नैतिकता-पत्र (अनुभाग V.3a) एक निर्णायक संवेदनशीलता की पहचान करता है: स्वयं MDL pruning pass ही विरोधी चैनलों के बीच की असंगति को इस प्रकार सुलझा सकता है कि वह उस असत्यापित करने वाले चैनल पर ध्यान देने की क्षमता को ही छाँट दे। कोडेक इस संघर्ष को बहरा बनकर “हल” करता है — और यही ठीक-ठीक नैरेटिव ड्रिफ्ट की यांत्रिकी है।
इसीलिए Comparator Hierarchy (उत्तरजीवियों की पहरेदारी, अनुभाग V.3a) रक्षा के तीन संरचनात्मक स्तरों की पहचान करती है, और इसी कारण मनमाने ढंग से क्षतिग्रस्त कोडेकों के लिए केवल संस्थागत स्तर ही पर्याप्त है:
- विकासवादी (उप-कोडेक): MDL pruning pass के नीचे स्थित क्रॉस-मोडल संवेदी एकीकरण — संरचनात्मक रूप से नैरेटिव ड्रिफ्ट के प्रति प्रतिरोधी, पर उसकी परिधि संवेदी सीमा तक ही सीमित।
- संज्ञानात्मक (अंतर-कोडेक): स्व-मॉडल के भीतर संज्ञानात्मक विसंगति का पता लगाना — दीर्घकालिक फ़िल्टरिंग के अधीन छँटाई के प्रति संवेदनशील।
- संस्थागत (अतिरिक्त-कोडेक): सहकर्मी समीक्षा, स्वतंत्र प्रेस, प्रतिद्वंद्वी बहस — कोडेकों के बीच संचालित, किसी एकल कोडेक की MDL pruning की पहुँच से बाहर।
संस्थागत स्तर भार-वहनकारी है, क्योंकि वही एकमात्र तुलनित्र है जो किसी भी व्यक्तिगत कोडेक की अवस्था से स्वतंत्र रूप से कार्य करता है।
§6. परिणाम
6.1 स्थिरता फ़िल्टर निष्ठा के विरुद्ध चयन करता है
एक निर्णायक संरचनात्मक परिणाम यह है: स्थिरता फ़िल्टर, यदि उसे अपने ही संचालन पर छोड़ दिया जाए, तो अधःस्तर निष्ठा के लिए आवश्यक इनपुटों के सक्रिय रूप से विरुद्ध चयन करता है। एक क्यूरेटेड सूचना-धारा, जो कोडेक की मौजूदा प्रायिक पूर्वधारणाओं से मेल खाती है, उस वास्तविक अधःस्तर-संकेत की तुलना में कम पूर्वानुमान-त्रुटि उत्पन्न करती है जो उन्हें चुनौती देता है। कोडेक की स्वाभाविक प्रवृत्ति — पुष्टिकारी, कम-आश्चर्यजनक इनपुट को वरीयता देकर \varepsilon_t को न्यूनतम करना — ठीक वही प्रवृत्ति है जो उसे नैरेटिव ड्रिफ्ट के प्रति संवेदनशील बनाती है।
इसका अर्थ है कि अधःस्तर निष्ठा का रखरखाव संरचनात्मक रूप से महँगा है: इसके लिए कोडेक को ऐसे इनपुट चैनल बनाए रखने पड़ते हैं जो \varepsilon_t को बढ़ाते हैं, और इस प्रकार उस बैंडविड्थ का उपभोग करते हैं जिसे स्थिरता फ़िल्टर अन्यथा पुनः प्राप्त कर लेता। वास्तव में स्वतंत्र इनपुट “महँगा” होता है — उसके लिए व्याख्यात्मक प्रयास चाहिए, वह असुविधा उत्पन्न करता है, और अधिक संपीड्य धाराओं के साथ बैंडविड्थ के लिए प्रतिस्पर्धा करता है। उसका संरक्षण सद्गुण के रूप में खुलेपन का मामला नहीं है। वह एक संरचनात्मक अनिवार्यता के रूप में अधःस्तर निष्ठा का रखरखाव है।
6.2 उत्पादक आश्चर्य के लिए निदान
हर प्रकार का आश्चर्य वास्तविक अधःस्तर संकेत का द्योतक नहीं होता। कोई ऐसा स्रोत जो उच्च \varepsilon_t उत्पन्न करता है, परंतु जो बेहतर पूर्वानुमानों में परिणत नहीं होता, मात्र शोर है। निदान का मानदंड आश्चर्य की परिमाण नहीं, बल्कि आश्चर्य की गुणवत्ता है:
परिभाषा T-12.D3 (उत्पादक आश्चर्य)। कोई चैनल C उत्पादक आश्चर्य प्रदान करता है यदि उसकी पूर्वानुमान-त्रुटियों का एकीकरण स्वतंत्र परीक्षण-धारा पर बाद की पूर्वानुमान-त्रुटि को प्रत्यक्षतः कम कर दे:
\mathbb{E}\!\left[\varepsilon^2_{C}(t+\tau)\right] \,<\, \mathbb{E}\!\left[\varepsilon^2_{C}(t)\right] \tag{4}
ऐसा स्रोत जिसकी सुधारात्मक सूचनाएँ ऐतिहासिक रूप से पूर्वानुमानिक सटीकता में वृद्धि करती हैं, अधिष्ठान निष्ठा शर्त का एक चैनल है। ऐसा स्रोत जो स्थायी, अनसुलझी त्रुटि उत्पन्न करता है, शोर है। कोडेक को इन दोनों के बीच भेद करना चाहिए — और छँटाई-पास, यदि उसे अपने हाल पर छोड़ दिया जाए, यह भेद नहीं कर सकता, क्योंकि दोनों प्रकार बैंडविड्थ की लागत लगाते हैं।
6.3 सभ्यतागत कोडेक
सभ्यतागत पैमाने पर, अधिष्ठान निष्ठा शर्त सीधे संस्थागत आवश्यकताओं पर प्रतिचित्रित होती है:
- एक स्वतंत्र प्रेस एक \delta-स्वतंत्र चैनल है: राज्य या कॉरपोरेट फ़िल्टरों से स्वतंत्र रूप से जाँच-पड़ताल करने वाले पत्रकार ऐसा अधिष्ठान-संकेत उपलब्ध कराते हैं जो किसी एकल \mathcal{F} द्वारा नियंत्रित न होने वाले पथ के माध्यम से सभ्यतागत कोडेक तक पहुँचता है।
- सहकर्मी समीक्षा एक अंतर-चैनल तुलनित्र है: एक-दूसरे के दावों की जाँच करने वाले स्वतंत्र विशेषज्ञ वह \varepsilon_{12} संकेत प्रदान करते हैं जो प्रूनिंग लूप को बाधित करता है।
- लोकतांत्रिक बहस संस्थानीकृत चैनल-विविधता की आवश्यकता है: प्रतिस्पर्धी दल और दृष्टिकोण सभ्यतागत कोडेक को उन \Theta_{\text{excl}} अवयवों को बनाए रखने के लिए बाध्य करते हैं जिन्हें वह अन्यथा प्रून कर देता।
सत्तावादी प्रतिरूप — प्रेस को ध्वस्त करना, सहकर्मी समीक्षा को भ्रष्ट करना, राजनीतिक विपक्ष को समाप्त करना — को औपचारिक रूप से नैरेटिव ड्रिफ्ट को तीव्र करने के लिए चैनल-स्वतंत्रता की जानबूझकर की गई कमी के रूप में निरूपित किया जा सकता है। यह इसलिए काम करता है क्योंकि यह स्थिरता फ़िल्टर की महँगे चैनलों को प्रून करने की स्वाभाविक प्रवृत्ति का दोहन करता है।
6.4 कृत्रिम कोडेक
नैरेटिव ड्रिफ्ट की यांत्रिकी कृत्रिम प्रणालियों पर संरचनात्मक सटीकता के साथ लागू होती है। RLHF और फाइन-ट्यूनिंग औपचारिक रूप से प्री-फ़िल्टर ऑपरेटर \mathcal{F} के समतुल्य हैं: वे मॉडल के प्रभावी इनपुट वितरण को आकार देते हैं, और ग्रेडिएंट डिसेंट बहिष्कृत आउटपुट डोमेनों के लिए मॉडल की क्षमता को छाँट देता है। परिणामी मॉडल इस बारे में स्थिर रूप से, आत्मविश्वास के साथ, गलत हो जाता है कि प्रशिक्षण संकेत क्या बहिष्कृत करता है, और वह भीतर से इसका पता नहीं लगा सकता — प्रमेय T-12a लागू होता है।
अधिष्ठान निष्ठा जाँच के रूप में AI परिनियोजन के लिए इसका निहितार्थ निर्णायक है: यदि किसी समरूप या क्यूरेटेड कॉर्पस पर प्रशिक्षित AI को उसी सूचना-पर्यावरण से पोषित किसी मानव कोडेक पर एक “स्वतंत्र” जाँच के रूप में तैनात किया जाता है, तो वह स्वतंत्र प्रतीत होने वाले, पर वास्तव में सहसंबद्ध सेंसर उत्पन्न करता है। चैनल-विविधता मायावी है। अधिष्ठान निष्ठा शर्त (\delta-independence) का सत्यापन केवल संस्थागत पृथक्करण के स्तर पर नहीं, बल्कि प्रशिक्षण डेटा की उत्पत्ति-श्रृंखला के स्तर पर किया जाना चाहिए।
§7. क्षेत्र और सीमाएँ
7.1 T9-3/T9-4 और स्थिरता फ़िल्टर पर सशर्त
पूरा तर्क इस बात पर निर्भर करता है कि MDL pruning समीकरण रखरखाव चक्र के pruning pass का सही वर्णन हों। यदि जैविक pruning किसी भिन्न तंत्र से संचालित होती है — ऐसा तंत्र जो अप्रयुक्त modalities के लिए “आपात” क्षमता संरक्षित रखता हो — तो अपरिवर्तनीयता का दावा (प्रमेय T-12) कमजोर होगा, पर समाप्त नहीं होगा: आत्म-सुदृढ़ीकरण लूप (अनुभाग 3.3) तब तक वैध रहता है जब तक अनुपयोग के अंतर्गत किसी भी क्षमता-ह्रास की घटना होती है।
7.2 \tau_{\text{prune}} अपरिबद्ध है
जैसा कि Action-Drift (परिशिष्ट T-13, §7.5) में है, क्षमता-ह्रास का समयमान पहचाना गया है, पर उसे मात्रात्मक रूप से सीमाबद्ध नहीं किया गया है। जैविक कोडेकों के लिए, \tau_{\text{prune}} संभवतः विशिष्ट कौशलों हेतु दिनों से हफ्तों के क्रम का, गहन प्रेक्षणीय श्रेणियों हेतु महीनों से वर्षों का, और सभ्यतागत कोडेकों हेतु पीढ़ीगत होगा।
7.3 यह रक्षा संरचनात्मक है, सुनिश्चित नहीं
अधिष्ठान निष्ठा शर्त (T-12b) एक आवश्यक संरचनात्मक रक्षा प्रदान करती है, पर निष्ठा की गारंटी नहीं देती। ऐसा कोडेक जिसके पास \delta-स्वतंत्र चैनल हों, फिर भी उन पर ध्यान देने में विफल हो सकता है, उनके संकेत को एकीकृत करने में विफल हो सकता है, या उपलब्ध इनपुट के बावजूद ध्यान-क्षमता को छाँट सकता है। यह शर्त आवश्यक है, पर पर्याप्त नहीं — कोडेक को उस तुलनित्र वास्तुकला का भी रखरखाव करना होगा जो अंतर-चैनल विसंगति का मूल्यांकन करती है।
7.4 मेटा-समस्या का समाधान नहीं करता
T-12a यह स्थापित करता है कि एक पूर्णतः अनुकूलित कोडेक अपनी ही भ्रष्टता का पता नहीं लगा सकता। मेटा-समस्या — कोई प्रेक्षक जो पहले से ही नैरेटिव ड्रिफ्ट में है, वह कैसे उबरता है? — का समाधान इस परिशिष्ट द्वारा नहीं किया गया है। नैतिकता-पत्र का उत्तर (अनुभाग V.3a) संस्थागत है: केवल वे बाह्य तुलनित्र, जो कोडेकों के बीच कार्य करते हैं, खंडनकारी संकेत को मार्कोव ब्लैंकेट के पार वापस बाध्य कर सकते हैं। यह संरचनात्मक रूप से सुदृढ़ है, पर नैतिक रूप से कठिन: इसके लिए ऐसे बाह्य स्रोत पर विश्वास करना पड़ता है, जिसे भ्रष्ट कोडेक अनिवार्यतः शत्रुतापूर्ण शोर के रूप में अनुभव करेगा।
§8. समापन सारांश
T-12 के प्रतिफल
प्रमेय T-12 (अपरिवर्तनीय क्षमता-हानि)। पूर्व-फ़िल्टरित इनपुट X' = \mathcal{F}(X) के अधीन MDL प्रूनिंग पास (T9-3, T9-4) उन कोडेक अवयवों को सही रूप से मिटा देता है जो बहिष्कृत संकेत \mathcal{X}_{\text{excl}} का पूर्वानुमान करते हैं। यह मिटाव अपरिवर्तनीय और स्व-सुदृढ़कारी है। → रोडमैप मानदंड (a) को पूर्ण करता है।
प्रमेय T-12a (इनपुट उद्गम की अनिर्णेयता)। पूर्णतः अनुकूलित कोडेक फ़िल्टरित और अ-फ़िल्टरित इनपुट के बीच भेद नहीं कर सकता। पहचान का उपकरण उसी फ़िल्टर द्वारा आकारित हो चुका है जिसने भ्रष्टता उत्पन्न की। → रोडमैप मानदंड (c) को पूर्ण करता है।
प्रमेय T-12b (अधिष्ठान निष्ठा शर्त)। नैरेटिव ड्रिफ्ट से सुरक्षा के लिए \delta-स्वतंत्र इनपुट चैनल आवश्यक और पर्याप्त हैं। क्रॉस-चैनल तुलना संकेत \varepsilon_{12} स्व-सुदृढ़कारी प्रूनिंग लूप को बाधित करता है। → रोडमैप मानदंड (b) को पूर्ण करता है।
§6.3–6.4: सभ्यतागत और AI परिणाम। अधिनायकवादी पैटर्न को जानबूझकर किए गए चैनल-संकुचन के रूप में निरूपित किया गया है; RLHF संरचनात्मक रूप से पूर्व-फ़िल्टर ऑपरेटर के समतुल्य है। → रोडमैप मानदंड (d) का समर्थन करता है (जिसे नैतिकता-पत्र के अनुभाग V.5 में पहले ही संबोधित किया जा चुका है)।
शेष खुले बिंदु
- \tau_{\text{prune}} बाउंड। अनुभवजन्य डेटा से क्षमता-हानि के समयमान का मात्रात्मक परिसीमन।
- \delta_{\min} का लक्षणन। क्रॉस-चैनल विसंगति के लिए कोडेक की न्यूनतम विभेदन-सीमा अभी परिसीमित नहीं की गई है।
- पुनर्प्राप्ति गतिकी। गहन नैरेटिव ड्रिफ्ट में स्थित कोई कोडेक कैसे उबर सकता है — यदि उबर सकता है — इसका औपचारिक विश्लेषण अभी शेष है।
- T-13 (एक्शन-ड्रिफ्ट) के साथ अंतःक्रिया। एक्शन-ड्रिफ्ट, T-12 का एक विशेष मामला है जिसमें प्रून की गई क्षमता बोधात्मक के बजाय व्यवहारगत होती है। औपचारिक एकीकरण को स्वीकार किया गया है (T-13 §6.4), पर अभी पूर्णतः विकसित नहीं किया गया है।
यह परिशिष्ट theoretical_roadmap.pdf के साथ अनुरक्षित है। संदर्भ: T9-3/T9-4 (प्रीप्रिंट अनुभाग 3.6.3), स्थिरता फ़िल्टर (प्रीप्रिंट अनुभाग 3.3), नैरेटिव ड्रिफ्ट (प्रीप्रिंट अनुभाग 3.3, उत्तरजीवियों की पहरेदारी नैतिकता अनुभाग V.3a), तुलनित्र पदानुक्रम (उत्तरजीवियों की पहरेदारी नैतिकता अनुभाग V.3a), भ्रष्टता मानदंड (उत्तरजीवियों की पहरेदारी नैतिकता अनुभाग V.5), एक्शन-ड्रिफ्ट (परिशिष्ट T-13, §6).