مرتب پیچ نظریہ (OPT)

ضمیمہ T-4: MDL / کفایت شعاری تقابل

Anders Jarevåg

v2.0.0 — April 2, 2026 | DOI: 10.5281/zenodo.19300777

اصل کام T-4: MDL / کفایتِ توضیحی کا تقابلی موازنہ مسئلہ: جاری پری پرنٹ یہ دعویٰ کرتا ہے کہ طبیعی قوانین کو میکروسکوپک کمپریشن الگورتھمز کے طور پر برتتے ہوئے وہ معیاری طبیعیات کے مقابلے میں زیادہ کفایتِ توضیحی رکھتا ہے، لیکن یہ کوئی رسمی MDL موازنہ فراہم نہیں کرتا۔ فراہمی: واضح کوڈنگ کنونشنز کے تحت OPT بمقابلہ معیاری تقابلی طبیعیاتی ماڈل کلاسوں کا تقابلی MDL تجزیہ۔

اختتامی حیثیت: CLOSED (معمولیت اور IC نارملائزیشن کی شرط پر). یہ ضمیمہ T-4 کے لیے مطلوب رسمی MDL جانچ فراہم کرتا ہے۔ تین معیاری ماڈل کلاسیں واضح کوڈنگ کنونشنز کے ساتھ متعین کی گئی ہیں۔ چار قضیے اور ایک قیاس قائم کیے گئے ہیں: (T-4a) OPT کے selector rule کی توضیحی طوالت \mathcal{O}(1) ہے؛ (T-4b) سولومونوف غلبہ OPT کے log-loss کے لیے بالائی حد فراہم کرتا ہے؛ (Conjecture T-4c) OPT کی ساختی برتری کے مفروضہ ماخذ کو ابتدائی شرائط کے کمپریشن میں رکھا گیا ہے؛ (T-4d) OPT ہر قابلِ حساب معیاری ماڈل کے مقابلے میں ماڈل پیچیدگی میں مستقل constant-bit برتری حاصل کرتا ہے؛ (T-4e) محدود-T برتری کو شرطی طور پر مقداری صورت میں متعین کیا گیا ہے۔ یہ اختتام تین بوجھ بردار شرائط پر قائم ہے: مشاہد کے سلسلۂ مشاہدہ کی معمولیت، سولومونوف نارملائزیشن جرمانے \log(1/\xi(\mathcal{O})) کا جذب ہو جانا، اور K(\text{IC} \mid \text{SP}) > K_0 کی حالت۔

§1. MDL coding conventions کا تعین

واضح اور ثابت coding conventions کے بغیر MDL تقابلات بے معنی ہیں۔ preprint کی §5.1 اس ضرورت کا ذکر کرتی ہے مگر اسے مؤخر کرتی ہے۔ ہم یہاں Rissanen (1978) [12] اور Li & Vitányi (2008) [27] کے two-part MDL framework کی پیروی کرتے ہوئے ان conventions کا تعین کرتے ہیں۔

1.1 دو-جزوی کوڈ کی لمبائی

فرضیاتی طبقہ \mathcal{M} اور مشاہداتی سلسلہ y_{1:T} \in \{0,1\}^* کے لیے، دو-جزوی MDL کوڈ کی لمبائی یہ ہے:

L_T(\mathcal{M}) = K(\mathcal{M}) + L(y_{1:T} \mid \mathcal{M}) \tag{preprint §5.1, Eq. 13}

جہاں K(\mathcal{M}) مفروضے کی سابقہ-کولموگوروف پیچیدگی ہے — یعنی ایک مقرر آفاقی ٹیورنگ مشین (UTM) پر سب سے مختصر خود-حدبند پروگرام کی لمبائی، جو \mathcal{M} کی مکمل توصیف پیدا کرے — اور L(y_{1:T} \mid \mathcal{M})، \mathcal{M} کے بہترین پیش گوئی ماڈل کے تحت، ڈیٹا کی منفی لاگ-امکانیت ہے:

L(y_{1:T} \mid \mathcal{M}) = -\log_2 P_\mathcal{M}(y_{1:T})

متعین نظریات کے لیے (جہاں قوانین + IC مشاہدات کو منفرد طور پر متعین کرتے ہیں)، اگر y نظریے کے ساتھ سازگار ہو تو L(y_{1:T} \mid \mathcal{M}) = 0، اور بصورتِ دیگر L = \infty۔ تمام لاگارتھم اساس 2 پر ہیں؛ تمام کوڈ لمبائیاں بٹس میں ہیں۔

1.2 آفاقی مشین

ہم پورے متن میں ایک ہی بہترین UTM \mathcal{U} کو مقرر رکھتے ہیں۔ تمام کولموگوروف پیچیدگیاں \mathcal{U} کے لحاظ سے ہیں؛ UTM کے مختلف انتخاب کے تحت نتائج زیادہ سے زیادہ \mathcal{O}(1) بٹس تک بدلتے ہیں۔ سولومونوف پیمائش \xi کی تعریف بھی \mathcal{U} کے لحاظ سے کی جاتی ہے (پری پرنٹ مساوات 1)۔ اس سے بعد کی تمام تقابلات کے لیے رواج متعین ہو جاتا ہے۔

1.3 y_{1:T} کا دائرۂ کار

ہم ماڈلز کا تقابل اس دائرے میں کرتے ہیں جس کی پیش گوئی کے لیے ہر ایک کو وضع کیا گیا تھا: مشاہد کی شعوری رو y_{1:T} = z_{0:T} (کمپریس شدہ مخفی حالتوں کی ترتیب، C_{\max} بٹس فی سیکنڈ، T سیکنڈز تک)۔ معیاری طبیعیات کو اسی دائرے میں اس کی پیش گوئیوں کو coarse-graining کے ذریعے مشاہد-مطابق رو تک گھٹا کر جانچا جاتا ہے۔ دونوں نظریات سے بالکل ایک ہی مشاہدات کی توضیح طلب کی جاتی ہے۔


§2. معیاری تقابلی ماڈل طبقات

تین معیاری طبقات متعین کیے گئے ہیں۔ ہر ایک کو ہماری UTM convention کے تحت ایک صریح K(\mathcal{M}) تخمینہ دیا گیا ہے۔ دقیق عددی اقدار درجہ-مقدار کے تخمینے ہیں؛ §§3–7 کے ساختی نتائج صرف ترتیب پر منحصر ہیں، دقیق اقدار پر نہیں۔

2.1 \mathcal{M}_1 — معیاری ماڈل + عمومی اضافیت

اس وقت دستیاب طبیعیات کا سب سے زیادہ پیش گوئی کے اعتبار سے درست نظریہ۔ اس کی توصیف کے لیے تین اجزاء درکار ہیں:

K(\mathcal{M}_1) = K_{\text{struct}} + K_{\text{param}} \approx 1750 \text{ bits}

K(\text{IC} \mid \mathcal{M}_1) \approx 300 \text{ bits (inflationary)}

2.2 \mathcal{M}_2 — عمومی رینارملائزایبل QFT

\leq 4 زمانی-مکانی ابعاد میں تمام رینارملائزایبل کوانٹم فیلڈ تھیوریز کی جماعت۔ اس جماعت میں \mathcal{M}_1 ایک رکن کے طور پر شامل ہے۔ چونکہ گیج گروپ اور ذرّاتی محتوا کی بھی تعیین لازم ہے:

K(\mathcal{M}_2) \gg K(\mathcal{M}_1) \gg 1750 \text{ bits}

\mathcal{M}_2 کو OPT کے اس دعوے کے بالمقابل ایک تقابلی مثال کے طور پر شامل کیا گیا ہے کہ قوانین کی فہرست سازی نہیں کی جاتی بلکہ ان کا انتخاب ہوتا ہے۔ اگرچہ \mathcal{M}_2 کے ساتھ MDL کا تقابل کسی بھی متناہی ذیلی جماعت (بشمول \mathcal{M}_1) کے حق میں بدیہی طور پر جیت لیا جاتا ہے، کیونکہ K(\mathcal{M}_2) غیر محدود ہے، تاہم اس کی شمولیت رسمی طور پر اس امر کو ظاہر کرنے کے لیے ہے کہ پیرامیٹر انتخاب کا مسئلہ کس قدر لامتناہی پیمانے رکھتا ہے—ایک ایسا مسئلہ جسے استحکام فلٹر اپنی فطری ساخت میں سکیڑ کر منہدم کر دیتا ہے۔

2.3 \mathcal{M}_3 — بولٹزمین برین / حرارتی اتار چڑھاؤ

معیاری طبیعیات، جس میں ابتدائی شرائط زیادہ سے زیادہ سادہ ہوں: پلانک پیمانے پر ایک حرارتی (زیادہ سے زیادہ اینٹروپی والی) حالت۔ قوانین \mathcal{M}_1 سے یکساں ہیں؛ ابتدائی شرائط بدیہی طور پر نہایت سادہ ہیں:

K(\mathcal{M}_3) \approx K(\mathcal{M}_1) \approx 1750 \text{ bits}, \qquad K(\text{IC} \mid \mathcal{M}_3) \approx 10 \text{ bits}

تاہم، \mathcal{M}_3 کے تحت ایک منظم شعوری سلسلے y_{1:T} کے مشاہدے کی لاگ-امکانیت فلکیاتی حد تک کم ہے: L(y_{1:T} \mid \mathcal{M}_3) \approx K(y_{1:T}) \gg T \cdot C_{\max}. اس طرح \mathcal{M}_3 میں IC کی لاگت تو نہ ہونے کے برابر ہے، مگر امکانیت کی لاگت تباہ کن ہے، اور اسے یہ دکھانے کے لیے شامل کیا گیا ہے کہ OPT کی MDL برتری اسی چال سے حاصل نہیں ہوتی۔

§3. OPT کی کوڈ لمبائی — قضیہ T-4a

OPT کے لیے MDL کوڈ لمبائی یوں تحلیل ہوتی ہے:

L_T(\text{OPT}) = K(\xi, \text{Filter}) + L(y_{1:T} \mid \xi, \text{Filter}) = K_0 + \left(-\log \xi^{\text{Filter}}(y_{1:T})\right)

جہاں \xi^{\text{Filter}} سولومونوف پیمائش \xi ہے جسے مشاہد-مطابق طبقے \mathcal{O} پر مشروط کیا گیا ہے (وہ سلسلے جو R_{\text{req}} \leq B_{\max} کو پورا کرتے ہیں)، اور K_0 = K(\xi, \text{Filter}) انتخابی قاعدے کی توصیفی لمبائی ہے۔

قضیہ T-4a (مابعد-قاعدہ پیچیدگی حد). K(\xi, \text{Filter}) = K_0 = \mathcal{O}(1) بٹس۔ بالخصوص:

K_0 \leq K(\mathcal{U}) + K(C_{\max}) + K(\Delta t) + c

جہاں K(\mathcal{U}) UTM کی پیچیدگی ہے، K(C_{\max}) = \mathcal{O}(\log C_{\max}) بٹس تجرباتی دقت تک بینڈوڈتھ کی بالائی حد کو انکوڈ کرتے ہیں، K(\Delta t) = \mathcal{O}(\log \Delta t) اپڈیٹ ونڈو کو انکوڈ کرتا ہے، اور c ایک چھوٹا آفاقی مستقل ہے۔

ثبوت۔ سولومونوف پیمائش \xi مقرر UTM \mathcal{U} سے منفرد طور پر متعین ہوتی ہے، لہٰذا K(\xi \mid \mathcal{U}) = \mathcal{O}(1)۔ استحکام فلٹر کو دو پیرامیٹر درکار ہیں: C_{\max} اور \Delta t، جن میں سے ہر ایک کو \sim 4 معنی خیز ہندسوں تک ناپا جاتا ہے، لہٰذا K(C_{\max}, \Delta t) \leq 2 \times (4 \times \log_2 10) \approx 26 بٹس۔ شرط R_{\text{req}} \leq B_{\max} مقرر نوٹیشن میں ایک واحد نامساوات ہے: \sim 10 بٹس۔ کل: K_0 \leq K(\mathcal{U}) + 36 بٹس۔

K(\mathcal{U}) کو منصفانہ طور پر جذب کرنے کے لیے ہمیں ایک “معرفتاً غیر جانب دار” UTM فرض کرنا ہوگا — یعنی ایسی حوالہ مشین جس کا اندرساختہ ہدایتی مجموعہ کسی طبیعی نظریے کو ترجیحی طور پر انکوڈ نہ کرتا ہو (یعنی ایک بنیادی کومبینیٹر یا Brainfuck-ہم ارز جیومیٹری، جو طبیعیات کے اعتبار سے مکمل طور پر غیر جانب دار ہو)۔ ایسی غیر متعصب مشین کے تحت، K(\xi, \text{Filter}) \approx 36 بٹس کو برقرار رکھتے ہوئے K(\mathcal{M}_1) \approx 1750 بٹس کو معیار بند کرنا درست ہے۔ ہم صراحتاً تسلیم کرتے ہیں کہ اگر UTM بدلی جائے تو اس سے مطلق بٹ-شمار \mathcal{O}(1) مستقل اسکیلنگ کے لیے حساس رہتی ہے، یعنی 36 بمقابلہ 1750 کا حساب بنیادی طور پر نسبتی ہے۔ یہاں ساختی طور پر دیانت دار ریاضیاتی بیان درجہ بندی ہے (K_0 \ll K(\mathcal{M}_1))، جو عین عددی مستقل سے آزاد ایک مضبوط ساختی برتری کو ظاہر کرتی ہے۔ \blacksquare

موازنہ: مشترک UTM اوورہیڈ کو خارج کرنے پر، K_0 \approx 36 بٹس بمقابلہ K(\mathcal{M}_1) \approx 1750 بٹس۔ OPT کا انتخابی قاعدہ معیاری ماڈل کی توصیف سے K(\mathcal{M}_1) - K_0 \approx 1714 بٹس کم ہے۔ یہی وہ ساختی کفایت ہے جس کا دعویٰ پری پرنٹ کے §5 میں کیا گیا تھا — اب ایک صریح بٹ-شمار کے ساتھ۔


§4. سولومونوف غلبہ حد — قضیہ T-4b

قضیہ T-4b (سولومونوف غلبہ حد). کسی بھی قابلِ حساب طبیعیاتی پیمائش \nu (بشمول \mathcal{M}_1, \mathcal{M}_2, \mathcal{M}_3) کے لیے، جس کے لیے K(\nu) < \infty ہو، اور کسی بھی ڈیٹا سلسلے y_{1:T} کے لیے:

L_T(\text{OPT}) \leq L_T(\nu) + K'_0

جہاں K'_0 = K_0 + \log(1/\xi(\mathcal{O}))۔ یہ بنیادی قاعدے کی پیچیدگی کے ساتھ اس ضروری الگورتھمی معمول بندی جرمانے کی نمائندگی کرتا ہے جو آفاقی پیمائش کو مشاہد کی جماعت \mathcal{O} پر مشروط کرنے سے عائد ہوتا ہے۔

ثبوت۔ سولومونوف پیمائش کی تعریف (پری پرنٹ مساوات 1) سے، جہاں w_\nu \asymp 2^{-K(\nu)}:

\xi(y_{1:T}) \geq w_\nu \cdot \nu(y_{1:T}) \geq 2^{-K(\nu)} \cdot \nu(y_{1:T})

منفی لوگارتھم لینے پر:

-\log \xi(y_{1:T}) \leq -\log \nu(y_{1:T}) + K(\nu)

جب ہم آفاقی پیمائش \xi سے محدود فلٹر \xi^{\text{Filter}} کی طرف منتقل ہوتے ہیں، تو ہمیں معمول بندی لاگت ادا کرنی پڑتی ہے: -\log \xi^{\text{Filter}}(y) = -\log \xi(y) + \log(1/\xi(\mathcal{O}))۔ اسے L_T(\text{OPT}) میں قائم مقام کرنے پر:

L_T(\text{OPT}) = K_0 - \log \xi^{\text{Filter}}(y_{1:T}) \leq K_0 + \log(1/\xi(\mathcal{O})) + K(\nu) - \log \nu(y_{1:T}) = K'_0 + L_T(\nu) \qquad \blacksquare

اہم تنبیہ۔ قضیہ T-4b یہ نہیں دکھاتا کہ OPT، SP سے بہتر کارکردگی دکھاتا ہے۔ یہ دکھاتا ہے کہ OPT کسی بھی معیاری تقابلی معیار سے K'_0 بٹس سے زیادہ بدتر نہیں ہو سکتا۔ آئندہ ہم \log(1/\xi(\mathcal{O})) کو K_0 میں جذب کر لیتے ہیں، اس مفروضے کے تحت کہ مشاہد سلسلوں کی جماعت ساختی UTM مستقلات کے مقابلے میں صاف طور پر حدبند ہوتی ہے؛ تاہم، اس معمول بندی خلا کو ایک رسمی کمزوری کے طور پر نوٹ رکھا جاتا ہے۔


§5. ابتدائی شرائط کا کمپریشن — قضیہ T-4c

OPT کی MDL برتری کا ساختی منبع ابتدائی شرائط کا کمپریشن ہے۔ معیاری طبیعیات میں قوانین اور ابتدائی شرائط الگ الگ اشیا ہیں جن دونوں کی توصیف ضروری ہوتی ہے۔ OPT میں ابتدائی شرائط prior میں جذب ہو جاتی ہیں: سولومونوف پیمائش پہلے ہی سادہ ترین observer-compatible streams کو سب سے زیادہ وزن دیتی ہے، جس سے الگ IC specification زائد ہو جاتی ہے۔

5.1 IC کی زائدیت کی دلیل

معیاری طبیعیات (\mathcal{M}_1) کے تحت، ایک تعیّنی نظریے کے لیے مکمل MDL کوڈ یہ ہے:

L_T(\text{SP}) = K_{\text{laws}} + K(\text{IC} \mid \text{laws}) + 0 \qquad \text{[deterministic: } -\log P = 0 \text{ if consistent]}

اصطلاح K(\text{IC} \mid \text{laws}) ان مخصوص ابتدائی شرائط کی توصیفی طوالت ہے جو قوانین کو دیے جانے کی صورت میں بیان کی جاتی ہے — یہ خود قوانین سے اخذ نہیں کی جا سکتی۔ یہی fine-tuning کا مقام ہے۔

OPT کے تحت، دو-حصہ کوڈ یہ ہے:

L_T(\text{OPT}) = K_0 + \left(-\log \xi^{\text{Filter}}(y_{1:T})\right)

اصطلاح -\log \xi^{\text{Filter}}(y_{1:T}) میٹا-قاعدے کو دیے جانے کی صورت میں مخصوص سلسلے کو انکوڈ کرتی ہے۔ سولومونوف آفاقی نیم پیمائش پہلے ہی طبیعیات کے ایک آفاقی ماڈل کو شامل کرتی ہے: -\log \xi(y) \approx K(y). OPT انکوڈنگ کو کبھی بھی IC کے لیے الگ سے قیمت ادا کرنے کی ضرورت نہیں پڑتی۔

تخمینہ T-4c (IC کمپریشن کے لیے ہیورسٹک حد). IC کمپریشن برتری کی تعریف یوں کریں:

\Delta_{\text{IC}} = K(\text{IC} \mid \text{SP laws}) - K(\text{IC} \mid \text{OPT})

ہم درج ذیل ہیورسٹک حد کے حق میں استدلال کرتے ہیں:

\boxed{L_T(\text{OPT}) \leq L_T(\text{SP}) - \Delta_{\text{IC}} + K_0 + \mathcal{O}(1)}

جہاں K(\text{IC} \mid \text{OPT}) := K(\text{IC} \mid \xi, \text{Filter}, \text{codec}) سے مراد OPT کے مکمل ماڈل کو دیے جانے کی صورت میں ابتدائی شرائط کی باقی ماندہ توصیفی طوالت ہے۔ \Delta_{\text{IC}} \geq 0، اور مساوات اسی وقت ہوگی جب استحکام فلٹر IC کی ایسی کوئی اضافی کمپریشن فراہم نہ کرے جو قوانین پہلے ہی فراہم کر رہے ہوں۔

استدلال۔ SP کے مکمل دو-حصہ کوڈ سے آغاز کرتے ہوئے، اور Solomonoff dominance کا اطلاق کرتے ہوئے (normalisation constants کو \mathcal{O}(1) UTM bounding term میں جذب کرتے ہوئے):

L_T(\text{OPT}) \leq K_0 + K(\text{laws}) + K(\text{IC} \mid \text{laws}) - \log P_{\text{SP}}(y) + \mathcal{O}(1)

ازسرِ ترتیب لکھنے اور L_T(\text{SP}) = K_{\text{laws}} + K(\text{IC} \mid \text{laws}) (تعیّنی نظریہ) کو قائم مقام رکھنے سے:

L_T(\text{OPT}) \leq L_T(\text{SP}) + K_0 + \mathcal{O}(1)

OPT کے اندر، -\log \xi^{\text{Filter}}(y_{1:T}) کو لازماً IC کو انفرادی طور پر انکوڈ کرنے کی ضرورت نہیں: فلٹر سولومونوف prior میں سے انتخاب کرتا ہے، جو طوالتی وزن بندیوں کے ذریعے IC کو فطری طور پر کمپریس کرتا ہے۔ AIT کی subadditivity اس کی ضمانت دیتی ہے کہ K(\text{IC} \mid x, f(x)) \leq K(\text{IC} \mid x) + \mathcal{O}(1). اگر ہم یہ مفروضہ قائم کریں کہ OPT کا انتخابی قاعدہ محض خام قوانین کے اعلان کے مقابلے میں زیادہ سخت توصیفی سٹرنگ کے طور پر حدبندی کرتا ہے (اور یہی اس فریم ورک کی بنیادی شرط ہے، نہ کہ کوئی ریاضیاتی مشتق ثبوت)، تو انکوڈ شدہ باقی ماندہ K(\text{IC} \mid \text{OPT})، K(\text{IC} \mid \text{laws}) سے معنی خیز طور پر زیادہ نہیں ہو سکتا۔ اس طرح ہیورسٹک طور پر \Delta_{\text{IC}} \geq 0 حاصل ہوتا ہے۔

قائم مقامی کے ذریعے: L_T(\text{OPT}) \leq L_T(\text{SP}) - \Delta_{\text{IC}} + K_0 + \mathcal{O}(1). \blacksquare

نوٹ۔ ہم یہ مفروضہ پیش کرتے ہیں کہ anthropic compression، یعنی K(\text{IC} \mid \text{OPT}) \approx 0، اس حد میں کارفرما ہوتی ہے جہاں استحکام فلٹر نہایت سخت پابند ہو اور ریاضیاتی طور پر منفرد طور پر مشاہد-مطابق حالتوں کی نقشہ بندی کرے۔ یہ ایک محرَّک طبیعی مفروضہ ہے، نہ کہ الگورتھمی طور پر ثابت شدہ یکتائی کی حد۔


§6. مستقل-بِٹ ماڈل پیچیدگی برتری — قضیہ T-4d

قضیہ T-4d (مستقل مستقل-بِٹ MDL برتری — معمولیت کی شرط کے تحت). ہر ایسے ثابت، غیر معمولی computable طبیعیاتی ماڈل \nu کے لیے جس کے لیے K_0 < K(\nu) < \infty ہو، مرتب پیچ نظریہ (OPT) کی صورت بندی بالخصوص ہر ایسے y_{1:T} \in \mathcal{O} کے لیے ایک ثابت، مستقل ماڈل پیچیدگی برتری حاصل کرتی ہے جو ساتھ ہی \nu-معمولی بھی ہو۔ جب سلسلے کی لمبائی T \to \infty ہو، تو کل کوڈ لمبائی کا فرق ساختی طور پر محدود رہتا ہے:

L_T(\text{OPT}) - L_T(\nu) \to K_0 - K(\nu)

ثبوت۔ T-4b سے، L_T(\text{OPT}) \leq K'_0 - \log \xi^{\text{Filter}}(y_{1:T})۔ ہر computable \nu کے لیے، سولومونوف کا قضیہ اس بات کی ضمانت دیتا ہے کہ \xi عین انہی سلسلوں پر \nu کی طرف تقارب کرتا ہے جو \nu-معمولی ہوں: پیمائشی معنی میں، یعنی \nu-تقریباً-تمام y_{1:\infty}۔ یہاں ایک گہرا رسمی تناؤ قابلِ توجہ ہے: استحکام فلٹر ان سلسلوں کو الگ کرتا ہے جو سخت معنی میں کم-اینٹروپی اور ساخت یافتہ ہوں، اور یوں انہیں معیاری غیر مقید زیادہ سے زیادہ اینٹروپی \nu-پیمائش کے سلسلوں کے مقابلے میں ساختی طور پر غیر معمولی بناتا ہے۔ جب تک فلٹر شدہ مشاہد طبقہ \mathcal{O} اور \nu-معمولی طبقہ قابلِ اثبات، غیر معمولی ریاضیاتی اشتراک نہ رکھتے ہوں، سولومونوفی تقارب کی حد کو براہِ راست بروئے کار نہیں لایا جا سکتا۔ لہٰذا یہ قضیہ مشروط طور پر صرف اور صرف اسی صورت میں لاگو ہوتا ہے جب مخصوص فلٹر شدہ مشاہد سلسلہ مخصوص معیاری قوانین کے تحت \nu-معمولی برقرار رہے (اور ایسے نظری طور پر مطابق، باہم متقاطع سلسلوں کے مجموعے کو رسمی طور پر غیر مشخص چھوڑا جاتا ہے):

-\frac{1}{T} \log \xi(y_{1:T}) \to H(\nu) \quad \text{as } T \to \infty

جہاں H(\nu)، \nu کی اینٹروپی شرح ہے۔ اسی طرح، -\frac{1}{T} \log \nu(y_{1:T}) \to H(\nu)۔ اسیمپٹوٹک طور پر، فی-بِٹ log-loss log-likelihood کی اصطلاحات تقارب کرتی ہیں اور برابر ہو جاتی ہیں، جس کا مطلب یہ ہے کہ کل کوڈ لمبائی میں باقی رہ جانے والی برتری خالصتاً ماڈل کی توصیفی لمبائی تک محدود ہو جاتی ہے:

\left[L_T(\text{OPT}) - L_T(\nu)\right] \to K_0 - K(\nu) < 0 \qquad \text{[since } K_0 \approx 36 \text{ vs } K(\nu) \sim 1750 \text{]}

نوٹ: اگرچہ کل کوڈ لمبائی اس مستقل ثابت-بِٹ برتری کو برقرار رکھتی ہے، فی-بِٹ برتری (\frac{K_0 - K(\nu)}{T}) بتدریج صفر کی طرف سکڑتی جاتی ہے۔ یہ اعداد و شمار کے انباشت کے ذریعے اسیمپٹوٹک طور پر مسلسل بڑھتی ہوئی برتری کی نمائندگی نہیں کرتا، بلکہ ایک مستقل، سخت ساختی آفسیٹ کو ظاہر کرتا ہے۔ \blacksquare

\mathcal{M}_1 کے لیے عددی تخمینہ: K(\mathcal{M}_1) - K_0 \approx 1714 بِٹس۔ جب کافی \nu-معمولی مشاہداتی وقفوں پر log-loss likelihoods تقارب کر جائیں، تو OPT تقریباً 1714 بِٹس کی مستقل ریاضیاتی کل-encoding برتری برقرار رکھتا ہے۔


§7. محدود-T مشروط برتری — قضیہ T-4e

محدود طوالت کی سلسلہ ہائے رواں کے لیے، MDL تقابل اس امر کا تقاضا کرتا ہے کہ T-4c کی IC کمپریشن برتری K_0 اوورہیڈ سے زیادہ ہو۔

قضیہ T-4e (محدود-T مشروط MDL برتری). مرتب پیچ نظریہ (OPT) \mathcal{M}_1 پر ایک سخت محدود-T MDL برتری حاصل کرتا ہے — یعنی، L_T(\text{OPT}) < L_T(\mathcal{M}_1) — اگر اور صرف اگر درج ذیل شرط برقرار ہو:

\boxed{K(\text{IC} \mid \text{SP laws}) > K_0 + \log\left(\frac{1}{\xi(\mathcal{O})}\right) + \left[-\log \xi^{\text{Filter}}(y_{1:T}) - \left(-\log P_{\text{SP}}(y_{1:T})\right)\right]}

RHS میں موجود قوسین مخصوص سلسلہ y_{1:T} پر SP کے مقابلے میں OPT کے لاگ-امکان نقص کو ظاہر کرتے ہیں۔ یہ شرط اس وقت پوری ہوتی ہے جب IC کی توصیفی لاگت میٹا-قاعدے کے مجموعی اوورہیڈ اور اس سلسلے پر OPT کے پیش گوئی نقص، دونوں سے بڑھ جائے۔

ثبوت۔ دو-حصہ کوڈ طوالتوں کی براہِ راست ہیرا پھیری:

L_T(\text{OPT}) < L_T(\text{SP}) \iff \quad K_0 + \log\left(\frac{1}{\xi(\mathcal{O})}\right) - \log \xi^{\text{Filter}}(y) < K_{\text{laws}} + K(\text{IC} \mid \text{laws}) - \log P_{\text{SP}}(y) \iff \quad K(\text{IC} \mid \text{laws}) - K_0 > \log\left(\frac{1}{\xi(\mathcal{O})}\right) + \left[-\log \xi^{\text{Filter}}(y) - \left(-\log P_{\text{SP}}(y)\right)\right] + \left[K_{\text{laws}} - K_{\text{laws}}\right]

از سرِ نو ترتیب دینے سے (K_{\text{laws}} دونوں طرف منسوخ ہو جاتا ہے) مذکورہ شرط براہِ راست حاصل ہو جاتی ہے۔ \blacksquare

7.1 معیاری کونیات کے لیے شرط کا جائزہ

افراطی انکوڈنگ کے تحت (SP کے لیے سب سے زیادہ موافق صورت):

لہٰذا شرط گھٹ کر K(\text{IC} \mid \text{SP laws}) > K_0 رہ جاتی ہے، یعنی 300 > 36۔ یہ ایک نمایاں ساختی فرق کے ساتھ برقرار ہے۔ شرط صرف اسی صورت میں ناکام ہوتی ہے جب IC کی لاگت \sim 36 بٹس سے کم ہو — یعنی اگر ہماری کائنات کا مخصوص IC محض SP قوانین ہی سے ساختی طور پر اس طرح اخذ کیا جا سکے کہ 36 سے کم باقی ماندہ بٹس درکار ہوں۔ موجودہ کونیاتی ماڈلوں میں سے کوئی بھی اس معیار پر پورا نہیں اترتا۔


§8. تقابلی MDL جدول

ماڈل K(\mathcal{M}) (بٹس) K(\text{IC}\mid\mathcal{M}) (بٹس) -\log P(y\mid\mathcal{M}) کل L_T MDL درجہ بندی
\mathcal{M}_1 — SM + GR \sim 1750 \sim 300 (افراطی) \sim 0 (متعین) \sim 2050 2nd (افراطی)
\mathcal{M}_3 — Boltzmann \sim 1750 \sim 10 \gg 0 (نادر سلسلہ) \gg 1760 آخری (تباہ کن امکانیت)
\mathcal{M}_{\text{OPT}} — OPT \sim 36 \sim 0 (انتہائی مقید فلٹر کے ذریعے شرطی) \sim 0^* (متعین کوڈیک تقرب) \sim 36 (شرطی) پہلا (شرطی)

^* §9.2 میں کوڈیک کی صریح شناخت کے تحت، OPT کی فعال ڈیٹا اصطلاح -\log P_{K_\theta}(y) = -\log P_\text{SP}(y) = 0 تک سمٹ جاتی ہے، جب K_\theta کو SP کوڈیک کے ساتھ شناخت کر لیا جائے۔


§9. تقابل کی حدود

9.1 K(y \mid \text{Filter}) قابلِ حساب نہیں ہے

OPT کی کوڈ لمبائی K_0 + K(y \mid \text{Filter}) = K_0 - \log \xi^{\text{Filter}}(y) میں ایک ایسی اصطلاح شامل ہے جو ٹورنگ کے مفہوم میں قابلِ حساب نہیں ہے (ہالٹنگ مسئلہ \xi کو بالکل درست طور پر حساب کرنے سے روکتا ہے)۔ عملی طور پر، OPT کی پیش گوئیوں کو ایک محدود کوڈیک K_\theta کے ذریعے تقربی صورت میں ظاہر کرنا لازم ہے — اور یہی معیاری طبیعیات کا طریقِ کار ہے۔ اس کا مطلب یہ ہے کہ پیش گوئی کے مقاصد کے لیے OPT بالآخر دستیاب بہترین قابلِ حساب کوڈیک تک سمٹ آتا ہے۔ لہٰذا SP پر OPT کی MDL برتری نئی پیش گوئیاں پیدا کرنے میں عملیاتی برتری نہیں، بلکہ ساختی برتری ہے (یعنی انتخابی قاعدے کی توضیح میں)۔

یہ کوئی خامی نہیں — بلکہ یہی اس پری پرنٹ کے دعوے کا درست رسمی مفہوم ہے: “OPT توضیحی بوجھ کے ایک حصے کو قوانین کی فہرست سازی سے قوانین کے انتخاب کی طرف منتقل کرتا ہے۔” یہ انتقال حقیقی ہے اور رسمی طور پر مقداری بھی بنایا گیا ہے (\approx 1700 بٹس برائے انتخابی قاعدہ بمقابلہ \mathcal{M}_1)، لیکن یہ اس پیش گوئیاتی مواد سے بڑھ کر کوئی نیا مواد پیدا نہیں کرتا جو کوڈیک پہلے ہی فراہم کر رہا ہوتا ہے۔

9.2 کوڈیک کی شناخت کا مسئلہ

OPT کا کوڈیک K_\theta وہ معین قابلِ حساب پیمائش ہے جسے استحکام فلٹر منتخب کرتا ہے۔ T-4 یہ متعین نہیں کرتا کہ یہ کون سی پیمائش ہے — اس شناخت کے لیے T-5 (ثوابت کی بازیافت) اور مکمل طبیعی وحدت کے پروگرام کی ضرورت ہے۔ جب تک K_\theta کی صریح شناخت SM + GR کے ساتھ نہیں ہو جاتی، MDL کا تقابلی موازنہ اسی شناخت پر مشروط رہتا ہے۔ رسمی حد L_T(\text{OPT}) \leq L_T(\text{SP}) + K_0 یہ ضمانت دیتی ہے کہ مرتب پیچ نظریہ (OPT) SP سے بدتر کارکردگی نہیں دکھا سکتا، لیکن یہ اس بات کی ضمانت نہیں دیتی کہ محدود وقت میں یہ اس سے بہتر بھی کرے گا، الا یہ کہ T-4e کی IC شرط پوری ہو — اور معیاری کونیاتی مفروضات کے تحت یہ شرط پوری ہوتی ہے۔

P-2 سے ماخوذ قید۔ ضمیمہ P-2 (کوانٹم ایرر کریکشن کے ذریعے ہلبرٹ فضا میں امبیڈنگ) یہ قائم کرتا ہے کہ مقامی شور کے تحت، کوڈیک کو QECC ساخت پوری کرنی چاہیے — اس کی داخلی نمائندگی کو مخصوص پیرامیٹرز (n, k, d) کے ساتھ ایک کوانٹم ایرر-کریکٹنگ کوڈ تشکیل دینا چاہیے۔ اس سے کوڈیک کی شناخت کا مسئلہ مزید محدود ہو جاتا ہے: K_\theta اب محض کوئی من مانا قابلِ حساب پیمائش نہیں رہتا، بلکہ ایسی پیمائش بنتا ہے جس کی پیش گوئی حالتیں ہلبرٹ فضا کی ایرر-کریکٹنگ جیومیٹری کو اپنے اندر رکھتی ہوں۔ یہ قید T-5 کے ثوابت کی بازیافت کے پروگرام سے ماقبل ہے اور ممکن ہے کہ K_\theta کی معیاری ماڈل کے ساتھ شناخت کے لیے اضافی انتخابی معیارات فراہم کرے۔


§10. اختتامی خلاصہ

T-4 کی حوالہ جاتی تکمیلات — مصدقہ طور پر بند (نارملائزیشن اور ٹائپیکلیٹی شرائط کے ساتھ)

  1. کوڈنگ کے معیارات متعین کر دیے گئے (§1). دو حصوں پر مشتمل MDL، ایک جامع مقررہ UTM کے لحاظ سے prefix Kolmogorov complexity، اور ڈیٹا ڈومین کی فعلی نقشہ بندی شعوری سلسلے y_{1:T} = z_{0:T} پر۔

  2. بینچ مارک طبقات متعین کر دیے گئے (§2). \mathcal{M}_1 (SM+GR) کا تقابل معمولی حدود کے ساتھ کرتا ہے، جیسے \mathcal{M}_2 (پھیلتے ہوئے تولیدی دائرۂ کار کے پیرامیٹر انتخاب) اور \mathcal{M}_3 (Boltzmann امکانیت کا انہدام)۔

  3. T-4a (میٹا-قاعدے کی پیچیدگی). K(\xi, \text{Filter}) = K_0 \approx 36 بٹس، جس میں relative UTM offsets بھی شامل ہیں۔

  4. T-4b (سولومونوف محدود). L_T(\text{OPT}) \leq L_T(\nu) + K_0 + \log(1/\xi(\mathcal{O})). یہ الگورتھمی نارملائزیشن جرمانہ پیرامیٹر کو صراحت کے ساتھ متعین کرتا ہے۔

  5. مفروضہ T-4c (IC کمپریشن ہیورسٹک حد). ساختی ابتدائی-شرائطی زائدیت کو کمپریشن کا مفروضہ محرک قرار دیا گیا ہے: \Delta_{\text{IC}} = K(\text{IC}\mid\text{SP}) - K(\text{IC}\mid\text{OPT}) \geq 0، اگرچہ نقشہ بندی کی یکتائی مشروط ہے۔ یہ ایک ہیورسٹک حد کے طور پر کام کرتی ہے، نہ کہ باضابطہ طور پر ثابت شدہ قضیے کے طور پر۔

  6. T-4d (مستقل-بٹ ماڈل برتری). حدی رویّے کو مشروط طور پر محدود کرتا ہے: ایسے computable benchmarks کے لیے جن کی \nu-typical class کا \mathcal{O} کے ساتھ غیر معمولی نہیں بلکہ حقیقی اشتراک ہو، OPT ایک مستقل عددی پیچیدگی برتری حاصل کرتا ہے (\sim -1714 bits)، اگرچہ اس کی لامتناہی فی-بٹ کثافت صفر کی طرف پیمانہ بند ہوتی ہے۔

  7. T-4e (متناہی-T برتری — مشروط). OPT، \mathcal{M}_1 کو متناہی T پر عددی طور پر اسی صورت میں مات دیتا ہے جب تجربی point-wise losses بنیادی ساختی حد K(\text{IC}\mid\text{SP}) > K_0 (300 > 36) کو الٹ نہ دیں۔ یہ کمزوری کو براہِ راست الگورتھمی point-wise dominance کے مفروضات پر مرکوز کرتا ہے۔

MDL دعوے کے ابطال کی شرائط

بعد ازاں انحصارات


یہ ضمیمہ OPT منصوبے کے repository میں theoretical_roadmap.pdf کے ساتھ برقرار رکھا جاتا ہے۔ مراجع: Rissanen (1978) [12], Li & Vitányi (2008) [27], Solomonoff (1964) [11], Penrose (2004).