OPT परिशिष्ट E-11: दर-विकृति जीवनचक्र का संगणकीय अनुकरण

Anders Jarevåg

April 2026

परिशिष्ट E-11: रेट-डिस्टॉर्शन जीवनचक्र का संगणकीय सिमुलेशन

यह परिशिष्ट क्रमित पैच सिद्धांत (OPT) के कोडेक जीवनचक्र के in-silico मॉडलन का दस्तावेज़ प्रस्तुत करता है। क्योंकि अंतर्निहित सार्वभौमिक अधःस्तर (सोलोमोनॉफ़ सार्वभौमिक अर्धमाप) संरचनात्मक रूप से अगणनीय है, इसलिए OPT रूपरेखा के भीतर सिमुलेशन केवल कोडेक जीवनचक्र के मॉडलन तक सीमित रहते हैं: सीमा-गेटिंग पैरामीटर C_{\max}, सक्रिय अनुमान गतिकी, त्रि-चरणीय रखरखाव चक्र \mathcal{M}_\tau, तथा एंट्रॉपिक तनाव के अधीन नैरेटिव विघटन।

दो भिन्न सिमुलेशन प्रतिमान स्थापित किए गए हैं: सादृश्यात्मक डीप लर्निंग (toy_model.py) और कठोर गणितीय रेट-डिस्टॉर्शन मॉडलन (opt_simulator.py)।

1. अनुरूपात्मक सिमुलेशन: गहरे वैरिएशनल बॉटलनेक्स

प्रारंभिक सिमुलेशन प्रतिमान (toy_model.py) एक शाब्दिक संरचनात्मक अनुरूपता के माध्यम से कोडेक फ्रैक्चर की मूल प्रतिज्ञप्ति का प्रमाणीकरण करता है।

अधःस्तर: असतत पूर्णांकों के साथ साकार की गई एक 1D आवर्ती लैटिस। ऊष्मागतिकीय शोर की आधाररेखा के विरुद्ध स्थायी संरचनात्मक विशेषताएँ आरोपित की जाती हैं, जो प्रेक्षणीय “क्रमित पैच” के रूप में कार्य करती हैं।

आर्किटेक्चर: प्रेक्षक को एक गहरे न्यूरल नेटवर्क (TensorFlow) पर निर्मित वैरिएशनल इन्फॉर्मेशन बॉटलनेक (VIB) के रूप में मॉडल किया गया है। यह नेटवर्क एक स्थानिक इतिहास वेक्टर X_{t-k \dots t} का अवलोकन करता है और उसे एक ऐसे बॉटलनेक में संपीड़ित करने के लिए अग्रगामी ग्रेडिएंट डिसेंट करता है, जो अग्रगामी कालिक शाखा-समुच्चय X_{t+1 \dots t+h} का पूर्वानुमान कर सके।

पतन की यांत्रिकी: C_{\max} (दर) और D_{\min} (स्वीकार्य विकृति) की बाध्यताएँ लैग्रांजियन \beta गुणक को मॉड्यूलेट करने वाले एक PID नियंत्रक के माध्यम से गतिशील रूप से लागू की जाती हैं। अत्यधिक अधःस्तर एंट्रॉपी के अधीन (उदाहरणार्थ, जब अत्यधिक अस्थिर शोर स्थायी पैटर्नों पर हावी हो), नेटवर्क बैंडविड्थ के बदले पूर्वानुमानिक विभेदन का वास्तविक त्याग करता है। जब आवश्यक एल्गोरिद्मिक जटिलता R_{\text{req}} अधिकतम \beta ट्यूनिंग के बावजूद C_{\max} से आगे निकल जाती है, तब नेटवर्क औपचारिक रूप से एक एल्गोरिद्मिक सिंगुलैरिटी से टकराता है और ध्वस्त हो जाता है, जिससे OPT की यह भविष्यवाणी पुष्ट होती है कि उच्च-एंट्रॉपी शोर का आरोपण चेतना का “विस्तार” नहीं करता, बल्कि पूर्वानुमानिक सुसंगति को नष्ट कर देता है।

2. गणितीय औपचारिकता: कठोर Rate-Distortion मॉडलन

यद्यपि neural VIB कोडेक फ्रैक्चर की दृश्य पुष्टि प्रदान करता है, मशीन लर्निंग स्थापत्य का अतिरिक्त बोझ प्रेक्षक को नियंत्रित करने वाले शुद्ध सूचना-सैद्धांतिक संबंधों को धुंधला कर देता है। दूसरा प्रतिमान (opt_simulator.py) संरचनात्मक ज्यामिति को हटाकर केवल सिद्धांत के अपने स्केलरों का उपयोग करते हुए बॉटलनेक गतिकी का कठोर मॉडलन करता है।

2.1 वास्तुकला

सिम्युलेटर तीन संरचनात्मक स्तरों को अलग करता है, जो क्रमित पैच सिद्धांत (OPT) की औपचारिकता का प्रतिबिंब हैं:

Component	OPT Concept	Implementation
`PhenomenalStateTensor`	K(P_\theta(t))	स्थायी कोडेक जटिलता C_{\text{state}}, जो C_{\text{ceil}} (runability ceiling) और C_{\text{floor}} (न्यूनतम व्यवहार्य कोडेक) द्वारा सीमित है
`StabilityFilter`	C_{\max} aperture	केवल पूर्वानुमान त्रुटि \varepsilon_t को bottleneck से होकर गुजरने देता है; जब \varepsilon_t > C_{\max} \cdot \Delta t हो, तो विखंडित हो जाता है
`ActiveInferenceCodec`	जनरेटिव मॉडल K_\theta	कोडेक की गहराई से व्युत्पन्न अंतर्जात पूर्वानुमेयता; पर्यावरणीय स्थिरता बाह्यजन्य विक्षोभ के रूप में
`MaintenanceCycle`	\mathcal{M}_\tau	तीन-चरणीय ऑफ़लाइन जटिलता-प्रबंधन (pruning, consolidation, पूर्वानुमानित शाखा-समुच्चय sampling)

मुख्य डिज़ाइन सिद्धांत यह है कि पूर्वानुमेयता अंतर्जात है: पर्यावरण का पूर्वानुमान करने की कोडेक की क्षमता किसी hardcoded parameter के रूप में नहीं दी गई है, बल्कि C_{\text{state}} से एक power-law संबंध \text{error} \propto C_{\text{state}}^{-0.6} के माध्यम से व्युत्पन्न होती है। इसका अर्थ यह है कि fracture cascades और recovery trajectories प्रणाली पर बाहर से मैन्युअली आरोपित नहीं किए जाते, बल्कि उसकी अपनी गतिकी से उभरते हैं।

2.2 पूर्वानुमान त्रुटि चैनल

पूर्वानुमानिक दर-विकृति सिद्धांत के अंतर्गत, C_{\max} एपर्चर से जो पार होता है वह पूर्वानुमान त्रुटि है — अर्थात केवल वह अवशेष जो जनरेटिव मॉडल के पूर्वानुमान को घटाने के बाद बचता है:

\varepsilon_t = S_{\text{raw}} \cdot (1 - \text{predictability})

जहाँ S_{\text{raw}} = 10^9 \cdot \Delta t बिट प्रति अद्यतन-विंडो है। आधाररेखा पर (C_{\text{state}} \approx 10^{14}, स्टेशनैरिटी = 1.0), इससे \varepsilon_t \approx 0.16 बिट/स्टेप प्राप्त होता है — जो C_{\max} \cdot \Delta t = 0.5 बिट/स्टेप की क्षमता-सीमा से आराम से नीचे है।

जब पर्यावरणीय स्टेशनैरिटी घटती है (उदाहरणार्थ, केटामीन शॉक, स्टेशनैरिटी \to 0.1), तब प्रभावी पूर्वानुमान त्रुटि 1/\text{stationarity} के गुणक से प्रवर्धित हो जाती है, जिससे \varepsilon_t क्षमता-सीमा के ऊपर चला जाता है और विखंडन को ट्रिगर करता है।

2.3 त्रि-पास रखरखाव चक्र (\mathcal{M}_\tau)

रखरखाव चक्र प्रीप्रिंट के §3.6 में निर्दिष्ट तीन ऑफ़लाइन पासों को कार्यान्वित करता है:

Pass	Operation	Rate	OPT Mapping
I. Pruning	निम्न-मूल्य पैरामीटरों का MDL-आधारित निष्कासन	C_{\text{state}} का 4%	\Delta_{\text{MDL}} < 0 विलोपन
II. Consolidation	हाल ही में अर्जित पैटर्नों का पुनःसंपीड़न	C_{\text{state}} का 3%	MDL विकृति-बजट संपीड़न
III. Forward-Fan	प्रतिकूल आत्म-परीक्षण (REM स्वप्नन का प्रॉक्सी)	C_{\text{state}} का +1%	शत्रुतापूर्ण भविष्यों के विरुद्ध पूर्वानुमानित शाखा-समुच्चय सैम्पलिंग

प्रति रखरखाव रन शुद्ध क्षय: C_{\text{state}} का \sim 6\%। रखरखाव स्थिरता पर गेटेड है — यह केवल तब सक्रिय होता है जब कोडेक विखंडित न हो, जो OPT की इस भविष्यवाणी के अनुरूप है कि \mathcal{M}_\tau निम्न-सेंसरियम अवस्थाओं के दौरान चलता है (आदर्श उदाहरण: नींद)।

अधिगम-संचय दर को इस प्रकार कैलिब्रेट किया गया है कि 100 अंतर-रखरखाव चरणों में त्रुटि-एकीकरण से होने वाला लाभ लगभग 6% रखरखाव-क्षय के बराबर हो, जिससे आधार-स्तर पर गतिशील संतुलन उत्पन्न होता है।

2.4 फ्रैक्चर गतिकी

नैरेटिव विघटन को एक कठोर न्यूनतम-सीमा के साथ सौम्य गुणात्मक अवनयन के रूप में मॉडल किया गया है:

C_{\text{state}}(t+1) = \max\bigl(C_{\text{state}}(t) \cdot 0.9999,\; C_{\text{floor}}\bigr)

400 सतत फ्रैक्चर चरणों (20-सेकंड के आघात) में, यह संयुक्त होकर 0.9999^{400} \approx 0.961 बनता है — लगभग 4% हानि। यह क्रमिक प्रत्याक्षिक रिक्तीकरण का मॉडल है (जैसा कि एनेस्थीसिया टाइट्रेशन, Protocol E-9 में), न कि सर्वनाशी सर्व-या-कुछ-भी-नहीं प्रकार के पतन का।

2.5 सिमुलेशन परिणाम

सिम्युलेटर \Delta t = 50\text{ms} रेज़ोल्यूशन पर 2000 चक्र चलाता है (सिम्युलेट किए गए प्रेक्षक-समय के 100 सेकंड)। एक एंट्रॉपी शॉक (stationarity \to 0.1) को t=40\text{s} से t=60\text{s} तक लागू किया जाता है।

Phase	Duration	Fractures	C_{\text{state}} Trajectory	Behaviour
Baseline	t = 0 \to 40\text{s}	0 / 800 (0%)	9.41 \times 10^{13} \to 9.18 \times 10^{13}	गतिशील आरी-दाँत संतुलन; शून्य फ्रैक्चर
Shock	t = 40 \to 60\text{s}	400 / 400 (100%)	9.18 \times 10^{13} \to 8.82 \times 10^{13}	सतत फ्रैक्चर; क्रमिक \sim 4\% अवनति
Recovery	t = 60 \to 100\text{s}	0 / 800 (0%)	8.30 \times 10^{13} \to 8.39 \times 10^{13}	फ्रैक्चर तुरंत रुक जाते हैं; कोडेक का धीमा पुनर्निर्माण

ये तीन चरण OPT की मूल भविष्यवाणी को प्रदर्शित करते हैं: एक सीमाबद्ध प्रेक्षक स्थिर होमियोस्टैसिस बनाए रख सकता है, एंट्रॉपिक शॉक के अधीन नियंत्रित ढंग से अवनत हो सकता है, और जब पर्यावरणीय stationarity पुनर्स्थापित हो जाती है तब पुनर्प्राप्ति कर सकता है — बशर्ते शॉक C_{\text{state}} को C_{\text{floor}} से नीचे न धकेले।

2.6 प्रमुख अवलोकन

आधारभूत आरी-दाँत पैटर्न: रखरखाव चक्रों के बीच, C_{\text{state}} त्रुटि-एकीकरण के माध्यम से संचित होता है (\sim +5\% प्रति 100-स्टेप विंडो), और फिर \mathcal{M}_\tau सक्रिय होने पर तीव्रता से गिरता है (\sim -6\%)। यह दोलन निद्रा-जागरण चक्र का संगणनात्मक हस्ताक्षर है — C_{\text{ceil}} तक पहुँचने से बचने के लिए तंत्र को समय-समय पर प्रून करना अनिवार्य है।
आघात की शुरुआत तात्क्षणिक होती है: जब स्थिरता 0.1 तक गिरती है, हर चक्र तुरंत विखंडित हो जाता है। यहाँ कोई क्रमिक संक्रमण नहीं है — पूर्वानुमान त्रुटि \sim 0.16 से उछलकर \sim 1.6 बिट/स्टेप तक पहुँच जाती है, जो 0.5 बिट क्षमता से तीन गुना अधिक है।
पुनर्प्राप्ति असममित है: आघात के बाद C_{\text{state}} 40 सेकंड में \sim +1\% की दर से बढ़ता है, जबकि 20-सेकंड के आघात के दौरान \sim -4\% की हानि होती है। पुनर्प्राप्ति, अवनति की तुलना में धीमी है। यह असममिति क्रमित पैच सिद्धांत (OPT) की एक संरचनात्मक भविष्यवाणी है: किसी जनरेटिव मॉडल का पुनर्निर्माण करना, उसे क्षतिग्रस्त करने की तुलना में अधिक कठिन है।
रखरखाव-विखंडन गेट महत्त्वपूर्ण है: यदि सक्रिय विखंडन के दौरान रखरखाव चलता है (जैसा कि सिम्युलेटर के प्रारंभिक संस्करणों में था), तो तंत्र एक धनात्मक प्रतिपुष्टि लूप में प्रवेश कर जाता है और C_{\text{floor}} तक ध्वस्त हो जाता है। यह गेटिंग नियम मात्र सुविधा नहीं है — कोडेक की व्यवहार्यता के लिए यह संरचनात्मक रूप से आवश्यक है।

3. भविष्य सिमुलेशन पथ

थैलामोकॉर्टिकल क्लॉक्स (E-12): \Delta t अद्यतनों को 20–40\text{Hz} थैलेमिक गेटिंग चक्रों के अनुरूप हार्डकोड करना, ताकि कॉर्टिकल समेकित सूचना (\Phi) मापनों के विरुद्ध मिलीसेकंड-रिज़ॉल्यूशन वाली परीक्षणयोग्य भविष्यवाणियाँ उत्पन्न की जा सकें।
फ्री एनर्जी POMDP एकीकरण: अमूर्त पूर्वानुमेयता स्केलर को एक विविक्त सक्रिय अनुमान अवस्था-स्थान मॉडल (उदा., pymdp) से प्रतिस्थापित करना, जिससे ऊष्मागतिक थर्मोस्टैट्स और प्रत्याक्षिक K_{\text{threshold}} (P-5) के बीच विभाजन करने वाली सटीक सीमाओं का मानचित्रण संभव हो।
बहु-प्रेक्षक विस्तार: साझा अधःस्तर क्षेत्रों के साथ परस्पर क्रिया करने वाले अनेक कोडेकों का सिमुलेशन करना, ताकि परिशिष्ट E-6 की स्वॉर्म बाइंडिंग भविष्यवाणियों की जाँच की जा सके — क्या वितरित एजेंट केवल तभी प्रत्याक्षिक बाइंडिंग प्राप्त करते हैं जब उन्हें एक वैश्विक C_{\max} अपर्चर से होकर बाध्य किया जाए।
अनुभवजन्य अंशांकन: सिमुलेटर की फ्रैक्चर-रिकवरी प्रक्षेपवक्र को न्यूरोइमेजिंग समय-श्रृंखला डेटा (उदा., प्रोपोफोल या केटामीन के अंतर्गत लेम्पेल-ज़िव जटिलता) के विरुद्ध फिट करना, ताकि यह निर्धारित किया जा सके कि 0.9999 क्षय नियतांक और C_{\text{state}}^{-0.6} पूर्वानुमेयता वक्र प्रेक्षित प्रत्याक्षिक गतिकी से मेल खाते हैं या नहीं।