क्रमित पैच सिद्धांत

परिशिष्ट T-4: MDL / पार्सिमनी तुलना

Anders Jarevåg

v2.0.0 — April 2, 2026 | DOI: 10.5281/zenodo.19300777

मूल कार्य T-4: MDL / मितव्ययिता तुलना समस्या: वर्तमान प्रीप्रिंट यह दावा करता है कि भौतिक नियमों को स्थूल-स्तरीय संपीड़न एल्गोरिद्म के रूप में मानकर वह मानक भौतिकी की तुलना में अधिक मितव्ययी है, लेकिन यह कोई औपचारिक MDL तुलना प्रस्तुत नहीं करता। प्रदत्त परिणाम: स्पष्ट कोडिंग अभिसमयों के अंतर्गत OPT बनाम मानक भौतिकी मॉडल-वर्गों का तुलनात्मक MDL विश्लेषण।

समापन स्थिति: CLOSED (टिपिकलिटी और IC नॉर्मलाइज़ेशन की शर्त पर)। यह परिशिष्ट T-4 द्वारा अपेक्षित औपचारिक MDL मूल्यांकन प्रस्तुत करता है। तीन मानक मॉडल-वर्ग स्पष्ट कोडिंग अभिसमयों के साथ नियत किए गए हैं। चार प्रमेय और एक अनुमान स्थापित किए गए हैं: (T-4a) OPT के चयनकर्ता नियम की वर्णन-लंबाई \mathcal{O}(1) है; (T-4b) सोलोमोनॉफ़ प्रभुत्व OPT के log-loss को ऊपर से सीमाबद्ध करता है; (अनुमान T-4c) OPT के संरचनात्मक लाभ का अनुमानित स्रोत प्रारंभिक-शर्त संपीड़न है; (T-4d) OPT प्रत्येक संगणनीय मानक के ऊपर मॉडल-जटिलता में स्थायी नियत-बिट लाभ प्राप्त करता है; (T-4e) सीमित-T लाभ को सशर्त रूप से परिमाणित किया गया है। यह समापन तीन भार-वहन करने वाली शर्तों पर आधारित है: प्रेक्षक-धारा की टिपिकलिटी, सोलोमोनॉफ़ नॉर्मलाइज़ेशन दंड \log(1/\xi(\mathcal{O})) का अवशोषण, और K(\text{IC} \mid \text{SP}) > K_0 की स्थिति।

§1. MDL कोडिंग परंपराओं का निर्धारण

स्पष्ट, स्थिर कोडिंग परंपराओं के बिना MDL तुलनाएँ निरर्थक हैं। प्रीप्रिंट का §5.1 इस आवश्यकता का उल्लेख करता है, पर उसे स्थगित कर देता है। यहाँ हम Rissanen (1978) [12] और Li & Vitányi (2008) [27] की द्वि-भागीय MDL रूपरेखा का अनुसरण करते हुए इन परंपराओं को निर्धारित करते हैं।

1.1 द्वि-भागीय कोड लंबाई

परिकल्पना-वर्ग \mathcal{M} और प्रेक्षण अनुक्रम y_{1:T} \in \{0,1\}^* के लिए, द्वि-भागीय MDL कोड लंबाई है:

L_T(\mathcal{M}) = K(\mathcal{M}) + L(y_{1:T} \mid \mathcal{M}) \tag{preprint §5.1, Eq. 13}

जहाँ K(\mathcal{M}) परिकल्पना की प्रीफ़िक्स कोल्मोगोरोव जटिलता है — अर्थात एक नियत सार्वभौमिक ट्यूरिंग मशीन (UTM) पर उस सबसे छोटे self-delimiting प्रोग्राम की लंबाई, जो \mathcal{M} का पूर्ण वर्णन आउटपुट करता है — और L(y_{1:T} \mid \mathcal{M}) \mathcal{M} के सर्वोत्तम पूर्वानुमानिक मॉडल के अधीन डेटा की ऋणात्मक लॉग-प्रायिकता है:

L(y_{1:T} \mid \mathcal{M}) = -\log_2 P_\mathcal{M}(y_{1:T})

नियतात्मक सिद्धांतों के लिए (जहाँ नियम + IC प्रेक्षणों को अद्वितीय रूप से निर्धारित करते हैं), यदि y सिद्धांत के साथ संगत है तो L(y_{1:T} \mid \mathcal{M}) = 0 होता है, और अन्यथा L = \infty। सभी लघुगणक आधार 2 के हैं; सभी कोड लंबाइयाँ बिट्स में हैं।

1.2 सार्वभौमिक मशीन

हम पूरे पाठ में एक ही इष्टतम UTM \mathcal{U} नियत करते हैं। सभी कोल्मोगोरोव जटिलताएँ \mathcal{U} के सापेक्ष हैं; UTM के किसी भिन्न चयन के अंतर्गत परिणाम अधिकतम \mathcal{O}(1) बिट तक बदलते हैं। सोलोमोनॉफ़ सार्वभौमिक अर्धमाप \xi को \mathcal{U} के सापेक्ष परिभाषित किया गया है (प्रीप्रिंट समीकरण 1)। इससे आगे की सभी तुलनाओं के लिए परंपरा निश्चित हो जाती है।

1.3 y_{1:T} का परास

हम मॉडलों की तुलना उस क्षेत्र पर करते हैं जिसकी भविष्यवाणी करने के लिए प्रत्येक को बनाया गया था: प्रेक्षक की चेतन धारा y_{1:T} = z_{0:T} (संपीड़ित latent अवस्थाओं का अनुक्रम, T सेकंड में प्रति सेकंड C_{\max} बिट)। मानक भौतिकी का मूल्यांकन उसी क्षेत्र पर किया जाता है, उसकी भविष्यवाणियों को coarse-graining के माध्यम से प्रेक्षक-संगत धारा तक घटाकर। दोनों सिद्धांतों से ठीक उन्हीं अवलोकनों का हिसाब देने को कहा जाता है।


§2. बेंचमार्क मॉडल वर्ग

तीन बेंचमार्क वर्ग निश्चित किए गए हैं। प्रत्येक को हमारी UTM परंपरा के अंतर्गत एक स्पष्ट K(\mathcal{M}) अनुमान सौंपा गया है। सटीक संख्यात्मक मान परिमाण-क्रम के अनुमान हैं; §§3–7 के संरचनात्मक परिणाम केवल क्रम पर निर्भर करते हैं, सटीक मानों पर नहीं।

2.1 \mathcal{M}_1 — मानक मॉडल + सामान्य सापेक्षता

वर्तमान में उपलब्ध सबसे अधिक पूर्वानुमानिक रूप से सटीक भौतिक सिद्धांत। इसके वर्णन के लिए तीन अवयव आवश्यक हैं:

K(\mathcal{M}_1) = K_{\text{struct}} + K_{\text{param}} \approx 1750 \text{ bits}

K(\text{IC} \mid \mathcal{M}_1) \approx 300 \text{ bits (inflationary)}

2.2 \mathcal{M}_2 — सामान्य पुनर्सामान्यीकरणीय QFT

\leq 4 स्पेसटाइम आयामों में सभी पुनर्सामान्यीकरणीय क्वांटम क्षेत्र सिद्धांतों का वर्ग। इस वर्ग में \mathcal{M}_1 एक सदस्य के रूप में सम्मिलित है। क्योंकि गेज समूह और कण-सामग्री का भी विनिर्देशन आवश्यक है:

K(\mathcal{M}_2) \gg K(\mathcal{M}_1) \gg 1750 \text{ bits}

\mathcal{M}_2 को OPT के इस दावे के प्रतिपक्षी उदाहरण के रूप में शामिल किया गया है कि नियमों की गणना-सूची नहीं बनाई जाती, बल्कि उनका चयन होता है। यद्यपि \mathcal{M}_2 के साथ MDL तुलना किसी भी सीमित उप-वर्ग (जिसमें \mathcal{M}_1 भी शामिल है) द्वारा तुच्छ रूप से जीत ली जाती है, क्योंकि K(\mathcal{M}_2) अबद्ध है, फिर भी इसका समावेशन औपचारिक रूप से यह प्रदर्शित करने के लिए है कि पैरामीटर-चयन की समस्या का पैमाना अनंत है, जिसे स्थिरता फ़िल्टर स्वाभाविक रूप से संकुचित कर देता है।

2.3 \mathcal{M}_3 — बोल्ट्ज़मान ब्रेन / ऊष्मीय उतार-चढ़ाव

अधिकतम रूप से सरल प्रारंभिक शर्तों के साथ मानक भौतिकी: प्लैंक पैमाने पर एक ऊष्मीय (अधिकतम-एंट्रॉपी) अवस्था। नियम \mathcal{M}_1 के समान हैं; प्रारंभिक शर्तें तुच्छ रूप से सरल हैं:

K(\mathcal{M}_3) \approx K(\mathcal{M}_1) \approx 1750 \text{ bits}, \qquad K(\text{IC} \mid \mathcal{M}_3) \approx 10 \text{ bits}

हालाँकि, \mathcal{M}_3 के अंतर्गत एक क्रमबद्ध सचेत धारा y_{1:T} के अवलोकन की log-likelihood खगोलीय रूप से छोटी है: L(y_{1:T} \mid \mathcal{M}_3) \approx K(y_{1:T}) \gg T \cdot C_{\max}. अतः \mathcal{M}_3 में IC लागत नगण्य है, लेकिन likelihood लागत विनाशकारी है, और इसे यह दिखाने के लिए शामिल किया गया है कि OPT का MDL लाभ उसी युक्ति से प्राप्त नहीं होता।


§3. OPT की कोड लंबाई — प्रमेय T-4a

OPT के लिए MDL कोड लंबाई का विघटन इस प्रकार होता है:

L_T(\text{OPT}) = K(\xi, \text{Filter}) + L(y_{1:T} \mid \xi, \text{Filter}) = K_0 + \left(-\log \xi^{\text{Filter}}(y_{1:T})\right)

जहाँ \xi^{\text{Filter}} सोलोमोनॉफ़ सार्वभौमिक अर्धमाप \xi है, जिसे प्रेक्षक-संगत वर्ग \mathcal{O} (वे स्ट्रीम जो R_{\text{req}} \leq B_{\max} को संतुष्ट करती हैं) पर शर्तित किया गया है, और K_0 = K(\xi, \text{Filter}) चयनक नियम की वर्णन-लंबाई है।

प्रमेय T-4a (मेटा-नियम जटिलता सीमा)। K(\xi, \text{Filter}) = K_0 = \mathcal{O}(1) बिट्स। विशेषतः:

K_0 \leq K(\mathcal{U}) + K(C_{\max}) + K(\Delta t) + c

जहाँ K(\mathcal{U}) UTM की जटिलता है, K(C_{\max}) = \mathcal{O}(\log C_{\max}) बिट्स प्रायोगिक परिशुद्धता तक बैंडविड्थ की अधिकतम सीमा को एन्कोड करता है, K(\Delta t) = \mathcal{O}(\log \Delta t) अद्यतन विंडो को एन्कोड करता है, और c एक छोटा सार्वभौमिक नियतांक है।

प्रमाण। सोलोमोनॉफ़ सार्वभौमिक अर्धमाप \xi नियत UTM \mathcal{U} द्वारा अद्वितीय रूप से निर्धारित होता है, अतः K(\xi \mid \mathcal{U}) = \mathcal{O}(1)। स्थिरता फ़िल्टर के लिए दो पैरामीटर आवश्यक हैं: C_{\max} और \Delta t, जिनमें से प्रत्येक को \sim 4 सार्थक अंकों तक मापा जाता है, अतः K(C_{\max}, \Delta t) \leq 2 \times (4 \times \log_2 10) \approx 26 बिट्स। शर्त R_{\text{req}} \leq B_{\max} नियत संकेतन में एकल असमता है: \sim 10 बिट्स। कुल: K_0 \leq K(\mathcal{U}) + 36 बिट्स।

K(\mathcal{U}) को निष्पक्ष रूप से समाहित करने के लिए, हमें एक “ज्ञानमीमांसात्मक रूप से तटस्थ” UTM मानना होगा — अर्थात ऐसी संदर्भ मशीन, जिसके अंतर्निहित निर्देश-समुच्चय में किसी भौतिक सिद्धांत को प्राथमिकता के साथ एन्कोड न किया गया हो (अर्थात एक मूलभूत combinator या Brainfuck-समतुल्य ज्यामिति, जो भौतिकी के प्रति पूर्णतः अज्ञेय हो)। ऐसी निष्पक्ष मशीन के अंतर्गत, K(\xi, \text{Filter}) \approx 36 बिट्स बनाए रखते हुए K(\mathcal{M}_1) \approx 1750 बिट्स का मानकीकरण करना वैध है। हम विशेष रूप से स्वीकार करते हैं कि यदि UTM बदला जाता है, तो इससे निरपेक्ष बिट-गणना \mathcal{O}(1) नियतांक-स्केलिंग के प्रति संवेदनशील हो जाती है; अर्थात 36 बनाम 1750 की गणना स्वभावतः सापेक्ष है। यहाँ संरचनात्मक रूप से ईमानदार गणितीय कथन रैंक-क्रम (K_0 \ll K(\mathcal{M}_1)) है, जो सटीक संख्यात्मक नियतांक से स्वतंत्र एक सुदृढ़ संरचनात्मक लाभ का प्रतिपादन करता है। \blacksquare

तुलना: साझा UTM ओवरहेड को छोड़कर, K_0 \approx 36 बिट्स बनाम K(\mathcal{M}_1) \approx 1750 बिट्स। OPT का चयनक नियम Standard Model के वर्णन की तुलना में K(\mathcal{M}_1) - K_0 \approx 1714 बिट्स छोटा है। यही वह संरचनात्मक मितव्ययिता-लाभ है जिसका दावा प्रीप्रिंट के §5 में किया गया है — अब एक स्पष्ट बिट-गणना के साथ।


§4. सोलोमोनॉफ़ प्रभुत्व सीमा — प्रमेय T-4b

प्रमेय T-4b (सोलोमोनॉफ़ प्रभुत्व सीमा)। किसी भी संगणनीय भौतिकी माप \nu (जिसमें \mathcal{M}_1, \mathcal{M}_2, \mathcal{M}_3 शामिल हैं) के लिए, जहाँ K(\nu) < \infty, तथा किसी भी डेटा स्ट्रीम y_{1:T} के लिए:

L_T(\text{OPT}) \leq L_T(\nu) + K'_0

जहाँ K'_0 = K_0 + \log(1/\xi(\mathcal{O}))। यह आधार नियम-जटिलता के साथ-साथ उस आवश्यक एल्गोरिथ्मिक सामान्यीकरण दंड को निरूपित करता है, जो सार्वभौमिक माप को प्रेक्षक वर्ग \mathcal{O} पर शर्तित करने से उत्पन्न होता है।

प्रमाण। सोलोमोनॉफ़ माप की परिभाषा (प्रीप्रिंट समीकरण 1) से, जहाँ w_\nu \asymp 2^{-K(\nu)}:

\xi(y_{1:T}) \geq w_\nu \cdot \nu(y_{1:T}) \geq 2^{-K(\nu)} \cdot \nu(y_{1:T})

ऋणात्मक लघुगणक लेने पर:

-\log \xi(y_{1:T}) \leq -\log \nu(y_{1:T}) + K(\nu)

जब हम सार्वभौमिक माप \xi से प्रतिबंधित फ़िल्टर \xi^{\text{Filter}} की ओर संक्रमण करते हैं, तब हमें सामान्यीकरण लागत चुकानी पड़ती है: -\log \xi^{\text{Filter}}(y) = -\log \xi(y) + \log(1/\xi(\mathcal{O}))। इसे L_T(\text{OPT}) में प्रतिस्थापित करने पर:

L_T(\text{OPT}) = K_0 - \log \xi^{\text{Filter}}(y_{1:T}) \leq K_0 + \log(1/\xi(\mathcal{O})) + K(\nu) - \log \nu(y_{1:T}) = K'_0 + L_T(\nu) \qquad \blacksquare

महत्वपूर्ण सावधानी। प्रमेय T-4b यह नहीं दिखाता कि OPT, SP से बेहतर प्रदर्शन करता है। यह दिखाता है कि OPT किसी भी बेंचमार्क की तुलना में K'_0 बिट्स से अधिक खराब नहीं हो सकता। आगे हम \log(1/\xi(\mathcal{O})) को K_0 में समाहित कर लेते हैं, यह मानते हुए कि प्रेक्षक अनुक्रमों का वर्ग संरचनात्मक UTM नियतांकों के सापेक्ष स्वच्छ रूप से सीमाबद्ध है; फिर भी, इस सामान्यीकरण-अंतर को एक औपचारिक दुर्बलता के रूप में नोट किया जाना चाहिए।


§5. प्रारंभिक शर्तों का संपीड़न — प्रमेय T-4c

OPT के MDL लाभ का संरचनात्मक स्रोत प्रारंभिक शर्तों का संपीड़न है। मानक भौतिकी में, नियम और प्रारंभिक शर्तें पृथक वस्तुएँ हैं, जिन दोनों का वर्णन किया जाना आवश्यक है। OPT में, प्रारंभिक शर्तें पूर्ववितरण में अवशोषित हो जाती हैं: सोलोमोनॉफ़ माप पहले से ही सबसे सरल प्रेक्षक-संगत धाराओं को सर्वोच्च भार देता है, जिससे पृथक IC विनिर्देशन अनावश्यक हो जाता है।

5.1 IC अतिरेक तर्क

मानक भौतिकी (\mathcal{M}_1) के अंतर्गत, एक नियतात्मक सिद्धांत के लिए पूर्ण MDL कोड है:

L_T(\text{SP}) = K_{\text{laws}} + K(\text{IC} \mid \text{laws}) + 0 \qquad \text{[deterministic: } -\log P = 0 \text{ if consistent]}

IC पद K(\text{IC} \mid \text{laws}) नियमों को दिया हुआ मानकर विशिष्ट प्रारंभिक शर्तों की वर्णन-लंबाई है — यह स्वयं नियमों से व्युत्पन्न नहीं किया जा सकता। यही सूक्ष्म-सामंजस्यन (fine-tuning) का केंद्र है।

OPT के अंतर्गत, द्वि-भागीय कोड है:

L_T(\text{OPT}) = K_0 + \left(-\log \xi^{\text{Filter}}(y_{1:T})\right)

पद -\log \xi^{\text{Filter}}(y_{1:T}) मेटा-नियम को दिया हुआ मानकर विशिष्ट स्ट्रीम को एन्कोड करता है। सोलोमोनॉफ़ सार्वभौमिक अर्धमाप पूर्वप्रायिकता पहले से ही भौतिकी का एक सार्वभौमिक मॉडल समाहित करती है: -\log \xi(y) \approx K(y). OPT एन्कोडिंग को IC के लिए अलग से कभी भुगतान नहीं करना पड़ता।

अनुमान T-4c (IC संपीड़न ह्यूरिस्टिक सीमा)। IC संपीड़न लाभ को परिभाषित करें:

\Delta_{\text{IC}} = K(\text{IC} \mid \text{SP laws}) - K(\text{IC} \mid \text{OPT})

हम निम्नलिखित ह्यूरिस्टिक सीमा का प्रतिपादन करते हैं:

\boxed{L_T(\text{OPT}) \leq L_T(\text{SP}) - \Delta_{\text{IC}} + K_0 + \mathcal{O}(1)}

जहाँ K(\text{IC} \mid \text{OPT}) := K(\text{IC} \mid \xi, \text{Filter}, \text{codec}) OPT के पूर्ण मॉडल को दिया हुआ मानकर प्रारंभिक शर्तों की अवशिष्ट वर्णन-लंबाई है। \Delta_{\text{IC}} \geq 0, और समानता तभी होगी जब स्थिरता फ़िल्टर IC का कोई अतिरिक्त संपीड़न न दे, उससे अधिक जो नियम पहले से देते हैं।

तर्क। SP के पूर्ण द्वि-भागीय कोड से शुरू करते हुए और सोलोमोनॉफ़ प्रभुत्व लागू करते हुए (सामान्यीकरण नियतांकों को \mathcal{O}(1) UTM सीमाबद्ध पद में समाहित करते हुए):

L_T(\text{OPT}) \leq K_0 + K(\text{laws}) + K(\text{IC} \mid \text{laws}) - \log P_{\text{SP}}(y) + \mathcal{O}(1)

पुनर्व्यवस्थित करने पर और L_T(\text{SP}) = K_{\text{laws}} + K(\text{IC} \mid \text{laws}) (नियतात्मक सिद्धांत) प्रतिस्थापित करने पर:

L_T(\text{OPT}) \leq L_T(\text{SP}) + K_0 + \mathcal{O}(1)

OPT के भीतर, -\log \xi^{\text{Filter}}(y_{1:T}) को IC को अलग-अलग एन्कोड करने की आवश्यकता नहीं है: फ़िल्टर सोलोमोनॉफ़ पूर्वप्रायिकता से चयन करता है, जो लंबाई-भारनों के माध्यम से IC को अंतर्निहित रूप से संपीड़ित करती है। AIT की उपयोज्यता-सबऐडिटिविटी यह सुनिश्चित करती है कि K(\text{IC} \mid x, f(x)) \leq K(\text{IC} \mid x) + \mathcal{O}(1). यदि हम यह प्रतिपादित करें कि OPT का चयन-नियम केवल कच्चे नियमों की घोषणा करने की तुलना में अधिक कसकर बँधी हुई वर्णनात्मक स्ट्रिंग के रूप में सीमाबद्ध होता है (जो इस रूपरेखा का मूल दाँव है, कोई गणितीय व्युत्पन्न-प्रमाण नहीं), तब एन्कोड किया गया अवशिष्ट K(\text{IC} \mid \text{OPT}), K(\text{IC} \mid \text{laws}) से महत्वपूर्ण रूप से अधिक नहीं हो सकता। इससे ह्यूरिस्टिक रूप से \Delta_{\text{IC}} \geq 0 प्राप्त होता है।

प्रतिस्थापन द्वारा: L_T(\text{OPT}) \leq L_T(\text{SP}) - \Delta_{\text{IC}} + K_0 + \mathcal{O}(1). \blacksquare

टिप्पणी। हम यह परिकल्पना करते हैं कि मानवकेन्द्रीय संपीड़न K(\text{IC} \mid \text{OPT}) \approx 0 उस सीमा में कार्य करता है जहाँ स्थिरता फ़िल्टर अत्यधिक प्रतिबंधकारी हो, और गणितीय रूप से अद्वितीय रूप से प्रेक्षक-संगत अवस्थाओं पर मानचित्रित करता हो। यह एक प्रेरित भौतिक प्रतिपादन है, न कि एल्गोरिथ्मिक रूप से सिद्ध अद्वितीयता-सीमा।

§6. स्थिर-बिट मॉडल जटिलता लाभ — प्रमेय T-4d

प्रमेय T-4d (स्थायी स्थिर-बिट MDL लाभ — टिपिकलिटी की शर्त पर)। प्रत्येक नियत, गैर-तुच्छ संगणनीय भौतिकी मॉडल \nu के लिए, जहाँ K_0 < K(\nu) < \infty, क्रमित पैच सिद्धांत (OPT) का सूत्रीकरण विशेष रूप से किसी भी ऐसे y_{1:T} \in \mathcal{O} के लिए एक नियत, स्थायी मॉडल-जटिलता लाभ प्राप्त करता है जो साथ ही \nu-टिपिकल भी हो। जैसे-जैसे अनुक्रम की लंबाई T \to \infty होती है, कुल कोड-लंबाई का अंतर संरचनात्मक रूप से आबद्ध रहता है:

L_T(\text{OPT}) - L_T(\nu) \to K_0 - K(\nu)

प्रमाण। T-4b से, L_T(\text{OPT}) \leq K'_0 - \log \xi^{\text{Filter}}(y_{1:T})। किसी भी संगणनीय \nu के लिए, सोलोमोनॉफ़ का प्रमेय यह सुनिश्चित करता है कि \xi ठीक उन्हीं अनुक्रमों पर \nu की ओर अभिसरित होता है जो \nu-टिपिकल हों: मापन की दृष्टि से, \nu-लगभग-सभी y_{1:\infty}। यहाँ एक गहरा औपचारिक तनाव ध्यान देने योग्य है: स्थिरता फ़िल्टर उन स्ट्रीमों को पृथक करता है जो कठोर अर्थ में निम्न-एंट्रॉपी और संरचित के रूप में मूल्यांकित होती हैं, और इस प्रकार उन्हें मानक, अबाधित, अधिकतम-एंट्रॉपी \nu-माप स्ट्रीमों की तुलना में संरचनात्मक रूप से अटिपिकल निरूपित करता है। जब तक फ़िल्टरित प्रेक्षक वर्ग \mathcal{O} और \nu-टिपिकल वर्ग के बीच कोई प्रदर्शनीय, गैर-तुच्छ गणितीय अतिव्यापन न हो, तब तक सोलोमोनॉफ़ अभिसरण-सीमा का स्वाभाविक उपयोग नहीं किया जा सकता। परिणामतः, यह प्रमेय सशर्त रूप से तभी और केवल तभी लागू होता है जब विशिष्ट फ़िल्टरित प्रेक्षक स्ट्रीम, विशिष्ट बेंचमार्क नियमों के अधीन, \nu-टिपिकल बनी रहे (ऐसी सैद्धांतिक रूप से अनुरूप प्रतिच्छेदी स्ट्रीमों के समुच्चय को औपचारिक रूप से अभी भी अनिर्दिष्ट छोड़ते हुए):

-\frac{1}{T} \log \xi(y_{1:T}) \to H(\nu) \quad \text{as } T \to \infty

जहाँ H(\nu), \nu की एंट्रॉपी दर है। इसी प्रकार, -\frac{1}{T} \log \nu(y_{1:T}) \to H(\nu)। आसिम्प्टोटिक रूप से, प्रति-बिट log-loss log-likelihood पद अभिसरित होकर समान हो जाते हैं, जिसका अर्थ है कि कुल कोड-लंबाई में शेष लाभ शुद्ध रूप से मॉडल-वर्णन-लंबाई तक सीमित रह जाता है:

\left[L_T(\text{OPT}) - L_T(\nu)\right] \to K_0 - K(\nu) < 0 \qquad \text{[since } K_0 \approx 36 \text{ vs } K(\nu) \sim 1750 \text{]}

टिप्पणी: जबकि कुल कोड-लंबाई इस स्थायी नियत-बिट लाभ को बनाए रखती है, प्रति-बिट लाभ (\frac{K_0 - K(\nu)}{T}) सक्रिय रूप से शून्य की ओर सिकुड़ता है। यह डेटा-संचय के माध्यम से आसिम्प्टोटिक रूप से निरंतर बढ़ते लाभ का निरूपण नहीं करता, बल्कि एक स्थायी, कठोर संरचनात्मक ऑफ़सेट को दर्शाता है। \blacksquare

\mathcal{M}_1 के लिए संख्यात्मक अनुमान: K(\mathcal{M}_1) - K_0 \approx 1714 बिट। पर्याप्त \nu-टिपिकल प्रेक्षण-विंडो पर log-loss likelihoods के अभिसरित हो जाने के बाद, OPT लगभग 1714 बिट की स्थायी गणितीय कुल एन्कोडिंग-श्रेष्ठता बनाए रखता है।


§7. सीमित-T सशर्त लाभ — प्रमेय T-4e

सीमित लंबाई की स्ट्रीमों के लिए, MDL तुलना में T-4c का IC संपीड़न-लाभ K_0 ओवरहेड से अधिक होना आवश्यक है।

प्रमेय T-4e (सीमित-T सशर्त MDL लाभ)। क्रमित पैच सिद्धांत (OPT) को \mathcal{M}_1 पर एक कठोर सीमित-T MDL लाभ प्राप्त होता है — अर्थात्, L_T(\text{OPT}) < L_T(\mathcal{M}_1) — तभी और केवल तभी जब निम्नलिखित शर्त सत्य हो:

\boxed{K(\text{IC} \mid \text{SP laws}) > K_0 + \log\left(\frac{1}{\xi(\mathcal{O})}\right) + \left[-\log \xi^{\text{Filter}}(y_{1:T}) - \left(-\log P_{\text{SP}}(y_{1:T})\right)\right]}

RHS में दिया गया ब्रैकेट विशिष्ट स्ट्रीम y_{1:T} पर SP की तुलना में OPT की लॉग-लाइकलीहुड कमी है। यह शर्त तब पूरी होती है जब IC का वर्णन-लागत मेटा-नियम के संयुक्त ओवरहेड और इस स्ट्रीम पर OPT की पूर्वानुमान-कमी से अधिक हो।

प्रमाण। दो-भागीय कोड-लंबाइयों का प्रत्यक्ष रूपांतरण:

L_T(\text{OPT}) < L_T(\text{SP}) \iff \quad K_0 + \log\left(\frac{1}{\xi(\mathcal{O})}\right) - \log \xi^{\text{Filter}}(y) < K_{\text{laws}} + K(\text{IC} \mid \text{laws}) - \log P_{\text{SP}}(y) \iff \quad K(\text{IC} \mid \text{laws}) - K_0 > \log\left(\frac{1}{\xi(\mathcal{O})}\right) + \left[-\log \xi^{\text{Filter}}(y) - \left(-\log P_{\text{SP}}(y)\right)\right] + \left[K_{\text{laws}} - K_{\text{laws}}\right]

पुनर्व्यवस्थित करने पर (K_{\text{laws}} दोनों पक्षों पर निरस्त हो जाता है) कथित शर्त सीधे प्राप्त हो जाती है। \blacksquare

7.1 मानक ब्रह्मांड-विज्ञान के लिए शर्त का मूल्यांकन

इन्फ्लेशनरी एन्कोडिंग के अंतर्गत (SP के लिए सबसे अनुकूल स्थिति):

अतः शर्त घटकर K(\text{IC} \mid \text{SP laws}) > K_0 रह जाती है, अर्थात् 300 > 36। यह एक पर्याप्त संरचनात्मक अंतर से सत्य है। यह शर्त केवल तभी विफल होती है जब IC की लागत \sim 36 बिट्स से कम हो — अर्थात् यदि हमारे ब्रह्मांड की विशिष्ट IC, केवल SP laws से संरचनात्मक रूप से व्युत्पन्न की जा सके और 36 से कम अवशिष्ट बिट्स छोड़े। वर्तमान में कोई भी ब्रह्मांडीय मॉडल यह उपलब्धि नहीं प्राप्त करता।


§8. तुलनात्मक MDL सारणी

मॉडल K(\mathcal{M}) (बिट्स) K(\text{IC}\mid\mathcal{M}) (बिट्स) -\log P(y\mid\mathcal{M}) L_T कुल MDL रैंक
\mathcal{M}_1 — SM + GR \sim 1750 \sim 300 (इन्फ्लेशनरी) \sim 0 (नियतात्मक) \sim 2050 2रा (इन्फ्लेशनरी)
\mathcal{M}_3 — बोल्ट्ज़मान \sim 1750 \sim 10 \gg 0 (दुर्लभ स्ट्रीम) \gg 1760 अंतिम (विनाशकारी संभाव्यता)
\mathcal{M}_{\text{OPT}} — OPT \sim 36 \sim 0 (अत्यधिक प्रतिबंधित फ़िल्टर के माध्यम से सशर्त) \sim 0^* (नियतात्मक कोडेक सन्निकटन) \sim 36 (सशर्त) 1ला (सशर्त)

^* §9.2 की स्पष्ट कोडेक-पहचान के अंतर्गत, OPT का सक्रिय डेटा पद -\log P_{K_\theta}(y) = -\log P_\text{SP}(y) = 0 तक घट जाता है, जब K_\theta की पहचान SP कोडेक के साथ कर दी जाती है।

§9. तुलना की सीमाएँ

9.1 K(y \mid \text{Filter}) संगणनीय नहीं है

OPT कोड लंबाई K_0 + K(y \mid \text{Filter}) = K_0 - \log \xi^{\text{Filter}}(y) में एक ऐसा पद शामिल है जो ट्यूरिंग-अर्थ में संगणनीय नहीं है (हॉल्टिंग समस्या \xi की सटीक गणना को रोकती है)। व्यवहार में, OPT की भविष्यवाणियों का सन्निकटन एक सीमित कोडेक K_\theta द्वारा किया जाना चाहिए — और यही मानक भौतिकी का तरीका है। इसका अर्थ है कि पूर्वानुमानिक उद्देश्यों के लिए OPT उपलब्ध सर्वोत्तम संगणनीय कोडेक तक सिमट जाता है। अतः SP की तुलना में OPT का MDL-लाभ नवीन भविष्यवाणियाँ करने में किसी संचालनात्मक लाभ के बजाय एक संरचनात्मक लाभ है (चयनकर्ता नियम के वर्णन में)।

यह कोई दोष नहीं है — बल्कि यही प्रीप्रिंट के दावे की सही औपचारिक सामग्री है: “OPT व्याख्यात्मक भार के एक हिस्से को नियम-सूचीकरण से नियम-चयन की ओर स्थानांतरित करता है।” यह स्थानांतरण वास्तविक है और औपचारिक रूप से परिमाणित है (\approx 1700 बिट्स चयनकर्ता नियम के लिए बनाम \mathcal{M}_1), लेकिन यह उस पूर्वानुमानिक सामग्री से अधिक कोई नई सामग्री उत्पन्न नहीं करता जो कोडेक पहले से ही प्रदान करता है।

9.2 कोडेक पहचान समस्या

OPT कोडेक K_\theta वह विशिष्ट संगणनीय माप है जिसे स्थिरता फ़िल्टर चुनता है। T-4 यह निर्धारित नहीं करता कि यह कौन-सा माप है — उस पहचान के लिए T-5 (स्थिरांकों की पुनर्प्राप्ति) और पूर्ण भौतिक एकीकरण कार्यक्रम की आवश्यकता होती है। जब तक K_\theta को स्पष्ट रूप से SM + GR के साथ अभिज्ञात नहीं किया जाता, तब तक MDL तुलना इसी अभिज्ञान पर सशर्त रहती है। औपचारिक सीमा L_T(\text{OPT}) \leq L_T(\text{SP}) + K_0 यह सुनिश्चित करती है कि OPT, SP से बदतर नहीं हो सकता, लेकिन यह यह सुनिश्चित नहीं करती कि सीमित समय में वह उससे बेहतर करेगा, जब तक कि T-4e की IC शर्त पूरी न हो — और मानक ब्रह्माण्डीय मान्यताओं के अंतर्गत यह पूरी होती है।

P-2 से बाध्यता। परिशिष्ट P-2 (क्वांटम त्रुटि-सुधार के माध्यम से हिल्बर्ट स्पेस एम्बेडिंग) यह स्थापित करता है कि स्थानीय शोर की स्थिति में, कोडेक को QECC संरचना संतुष्ट करनी होगी — उसका आंतरिक निरूपण विशिष्ट पैरामीटरों (n, k, d) के साथ एक क्वांटम त्रुटि-सुधारक कोड का गठन करना चाहिए। इससे कोडेक पहचान समस्या संकुचित हो जाती है: K_\theta अब कोई मनमाना संगणनीय माप नहीं रह जाता, बल्कि ऐसा माप होता है जिसकी पूर्वानुमानिक अवस्थाएँ हिल्बर्ट स्पेस की त्रुटि-सुधारक ज्यामिति को वहन करती हैं। यह बाध्यता T-5 के स्थिरांक-पुनर्प्राप्ति कार्यक्रम से पूर्ववर्ती है और K_\theta को मानक मॉडल के साथ अभिज्ञात करने के लिए अतिरिक्त चयन मानदंड प्रदान कर सकती है।


§10. समापन सारांश

T-4 प्रदेय — पुष्ट रूप से समापनित (नॉर्मलाइज़ेशन एवं टिपिकलिटी शर्तों सहित)

  1. कोडिंग परंपराएँ स्थिर की गईं (§1)। द्वि-भागीय MDL, एक समावेशी स्थिर UTM के सापेक्ष प्रीफ़िक्स कोल्मोगोरोव जटिलता, जो डेटा डोमेन को फलनात्मक रूप से चेतन धारा y_{1:T} = z_{0:T} पर मैप करती है।

  2. बेंचमार्क वर्ग स्थिर किए गए (§2)। यह \mathcal{M}_1 (SM+GR) का मूल्यांकन \mathcal{M}_2 (विस्फोटक जनरेटिव स्कोप पैरामीटर चयन) और \mathcal{M}_3 (बोल्ट्ज़मान संभाव्यता-पतन) जैसी तुच्छ सीमाओं के विरुद्ध करता है।

  3. T-4a (मेटा-नियम जटिलता)। K(\xi, \text{Filter}) = K_0 \approx 36 बिट, जिसमें सापेक्ष UTM ऑफ़सेट सम्मिलित हैं।

  4. T-4b (सोलोमोनॉफ़ सीमाबद्ध)। L_T(\text{OPT}) \leq L_T(\nu) + K_0 + \log(1/\xi(\mathcal{O}))। यह एल्गोरिद्मिक नॉर्मलाइज़ेशन दंड पैरामीटर को स्पष्ट रूप से परिभाषित करता है।

  5. अनुमान T-4c (IC संपीड़न ह्यूरिस्टिक सीमा)। संरचनात्मक प्रारंभिक-शर्त पुनरावृत्ति संपीड़न का अनुमानित इंजन है: \Delta_{\text{IC}} = K(\text{IC}\mid\text{SP}) - K(\text{IC}\mid\text{OPT}) \geq 0, यद्यपि मैपिंग की अद्वितीयता सशर्त है। यह एक ह्यूरिस्टिक सीमा के रूप में कार्य करता है, न कि औपचारिक रूप से सिद्ध प्रमेय के रूप में।

  6. T-4d (स्थिर-बिट मॉडल लाभ)। यह सीमा-व्यवहार को सशर्त रूप से सीमाबद्ध करता है: उन संगणनीय बेंचमार्कों के लिए जिनका \nu-टिपिकल वर्ग \mathcal{O} के साथ गैर-तुच्छ रूप से अतिव्यापित होता है, OPT एक स्थायी संख्यात्मक जटिलता-लाभ (\sim -1714 बिट) सुरक्षित करता है, यद्यपि इसकी अनंत प्रति-बिट घनत्व शून्य की ओर स्केल होती है।

  7. T-4e (सीमित-T लाभ — सशर्त)। OPT सीमित T पर \mathcal{M}_1 को संख्यात्मक रूप से ठीक उसी स्थिति में पराजित करता है जब अनुभवजन्य बिंदु-वार हानियाँ मूल K(\text{IC}\mid\text{SP}) > K_0 संरचनात्मक सीमा (300 > 36) को उलट नहीं देतीं। यह संवेदनशीलता को सीधे एल्गोरिद्मिक बिंदु-वार प्रभुत्व संबंधी मान्यताओं पर केंद्रित करता है।

MDL दावे के लिए खंडन-शर्तें

अनुवर्ती निर्भरताएँ


यह परिशिष्ट OPT परियोजना रिपॉज़िटरी के भाग के रूप में theoretical_roadmap.pdf के साथ संधारित किया जाता है। संदर्भ: Rissanen (1978) [12], Li & Vitányi (2008) [27], Solomonoff (1964) [11], Penrose (2004).