مرتب پیچ نظریہ (OPT)
ضمیمہ T-9: دورِ نگہداشت، MDL پروننگ، اور بحالی کی شرائط
11 مئی، 2026 | DOI: 10.5281/zenodo.19300777
اصل ٹاسک T-9: دورِ نگہداشت اور بازیابی کا سازوسامان مسئلہ: مرکزی مقالہ §3.6.3–§3.6.6 میں مساوات T9-1 سے T9-13 تک متعین کی گئی ہیں (دورِ نگہداشت آپریٹر \mathcal{M}_\tau، MDL پروننگ \Delta_{\mathrm{MDL}}، استحکامِ ادغام کا فائدہ \Delta K_{\text{compress}}، REM اہمیت-وزن دہی w(b))۔ ضمیمے T-12 (بیانیہ ڈرفٹ) اور T-13 (Action-Drift) اس سازوسامان کو بنیادی بوجھ اٹھانے والے جزو کے طور پر حوالہ دیتے ہیں۔ اس فریم ورک میں ایسا کوئی جامع ضمیمہ موجود نہیں جو (i) رسمی ابتدائیات کو صراحت کے ساتھ نام دے، (ii) پروننگ کی ان چار صورتوں میں امتیاز کرے جنہیں مرکزی مقالے کی \Delta_{\mathrm{MDL}} < 0 ضمنی طور پر چھوڑ دیتی ہے، (iii) بازیابی کی شرط کی تعریف کرے، اور (iv) ذیلی نتیجہ خیز ضمیموں کے حوالہ دینے کے لیے ایک مستحکم رسمی ہدف فراہم کرے۔ T-9 اسی خلا کو پُر کرتا ہے۔ فراہمی: T-2 / T-15 کے مساوی ادراکی درجے پر ایک جامع ضمیمہ (ساختی مطابقت، نہ کہ بند قضیہ)۔ مرکزی مقالے سے ماورا نیا مواد: پیش گوئی فائدے G_i(t,\tau) کی صریح تعریف، وسائل-گنجائش کو اوّلی حیثیت دینے کے ساتھ نگہداشتی لاگت کی تجزیاتی تقسیم، پروننگ کی چار صورتوں میں امتیاز، بازیابی کی شرط، اور ذیلی نتیجہ خیز سلسلہ۔
اختتامی حیثیت: ساختی مطابقت (T-2 / T-15 کے مساوی درجہ). یہ ضمیمہ بند قضیے کا ضمیمہ نہیں ہے۔ یہ preprint §3.6 میں پہلے سے کارفرما دورِ نگہداشت کے سازوسامان کو یکجا کرتا ہے اور رسمی مواد کے چار ایسے اجزا کا اضافہ کرتا ہے جو مرکزی مقالے میں موجود نہیں: صریح پیش گوئی فائدہ، وسائل-گنجائش لاگت کی صورت بندی، پروننگ کی چار صورتیں، اور بازیابی کی شرائط۔ §2 کے OpenAI-review caveats کی رعایت رکھی گئی ہے: (i) پروننگ کی حد کو اس صورت میں پیش کیا گیا ہے جو T-12 کی زیرِ التوا channel-independence reformulation (Phase 4) کے ساتھ ہم آہنگ ہو؛ (ii) مرکزی مقالے کی موجودہ مساوات T9-3 / T9-4 کو بحیثیتِ حوالہ جوں کا توں برقرار رکھا گیا ہے، اور T-9 وسائل-گنجائش کی تہذیب کو حوالہ دی گئی صورتوں میں خاموش تبدیلی کے بجائے ایک اضافی رسمی سطح کے طور پر متعارف کراتا ہے؛ (iii) وسائل-گنجائش لاگت اوّلی ہے، جبکہ K-complexity ساختی مطابقتی تقرب کے طور پر آتی ہے۔ کھلے کنارے (§9): وسائل-گنجائش بمقابلہ K-complexity کی حسابی درجہ بندی کو T-12 کی reformulation آ جانے کے بعد T-12 کے ساتھ مکمل طور پر ہم آہنگ کرنا ابھی باقی ہے۔
§1. ترتیب — فعال ماڈل اجزاء
کوڈیک K_\theta فعال ماڈل اجزاء کے ایک مجموعے \{\theta_i\}_{i \in I} پر مشتمل ہے، جہاں ہر \theta_i کوڈیک کی ایک قابلِ شناخت ساختی اکائی ہے — ایک تولیدی prior، ایک سیکھا ہوا feature detector، ایک recurrent stack، ایک long-range coupling، یا کوئی بھی دوسری ابتدائی ساخت جو وقت کے ساتھ کوڈیک کی پیش گوئیوں \pi_t اور update operator \mathcal{U} کی تشکیل میں حصہ لیتی ہو۔ مجموعہ \{\theta_i\} کسی بھی معین لمحے میں متناہی ہوتا ہے، لیکن اسے استحکام کے ذریعے وسیع کیا جا سکتا ہے (Pass II, preprint §3.6.4) یا pruning کے ذریعے سکیڑا جا سکتا ہے (Pass I, preprint §3.6.3)۔
T-9 کے مقاصد کے لیے، ان اجزاء کو بطورِ معین لیا گیا ہے: T-9 یہ اخذ نہیں کرتا کہ ایک \theta_i کو دوسرے کے مقابلے میں “فطری” جزو کیا چیز بناتی ہے، کیونکہ یہ نمائشی-تعلم کا ایک سوال ہے جو OPT کے دائرۂ کار سے باہر ہے۔ دورِ نگہداشت کا apparatus اس ہر decomposition پر عمل کرتا ہے جسے کوڈیک قبول کرتا ہو۔
دورِ نگہداشت operator \mathcal{M}_\tau (preprint Eq. T9-2) کم-بوجھ وقفوں کے دوران فینومینل حالت ٹینسر P_\theta(t) پر عمل کرتا ہے (R_{\text{req}}(t) \ll C_{\max})۔ T-9 ذیل کی §2–§6 میں تین passes (pruning، consolidation، پیش گوئی شدہ شاخوں کا مجموعہ sampling) کو صریح رسمی primitives میں کھولتا ہے؛ پھر §7 میں corollary chain انہی primitives کے ذریعے بیانیہ ڈرفٹ (T-12) اور Action-Drift (T-13) کا سراغ لگاتی ہے۔
§2. پیش گوئی برتری G_i(t, \tau)
لمبائی \tau کی ایک کھڑکی پر جزو \theta_i کی پیش گوئی برتری اس بات کی پیمائش کرتی ہے کہ وہ جزو ان پٹ سلسلے پر کوڈیک کی پیش گوئی کارکردگی میں کتنا حصہ ڈالتا ہے، اس حال میں کہ باقی اجزاء کو ثابت رکھا جائے:
G_i(t, \tau) \;:=\; I\!\left(\theta_i \,;\, X_{t+1:t+\tau} \mid \theta_{-i}\right) \tag{T9.2-1}
جہاں \theta_{-i} سے مراد \theta_i کے بغیر کوڈیک کا باقی حصہ ہے، اور I(\cdot ; \cdot \mid \cdot) شرطی باہمی معلومات ہے۔ شرطی صورت بنیادی اہمیت رکھتی ہے: یہ \theta_i کی حاشیائی پیش گوئیاتی شراکت کو الگ کرتی ہے، نہ کہ اس کی وہ مشترک شراکت جو باہم متداخل اجزاء کے ساتھ مل کر پیدا ہوتی ہے۔
مرکزی مقالے کی مساوات T9-3 سے تقابل۔ مرکزی مقالے میں MDL پروننگ کی مقدار یہ ہے:
\Delta_{\mathrm{MDL}}(\theta_i) \;=\; I\!\left(\theta_i\,;\,X_{t+1:t+\tau} \mid \theta_{-i}\right) - \lambda K(\theta_i) \tag{T9-3, preprint §3.6.3}
T-9 پہلی حد کو صراحت کے ساتھ G_i(t,\tau) کا نام دیتا ہے تاکہ پیش گوئی برتری کے اس ابتدائی تصور کا حوالہ حدی-صورت والی پروننگ شرط سے الگ طور پر دیا جا سکے۔ یہ محض علامتی تدوین ہے؛ عدم مساوات جوں کی توں برقرار رہتی ہے۔
کھڑکی کی لمبائی \tau۔ پیش گوئی برتری کھڑکی کی لمبائی پر منحصر ہے۔ مختصر \tau باریک زمانی پیمانے کی پیش گوئی کو گرفت میں لیتی ہے (حرکی کنٹرول، ورکنگ میموری)؛ طویل \tau ساختی پیش گوئی کو گرفت میں لیتی ہے (معنوی باقاعدگیاں، بیانیہ ہم آہنگی)۔ دورِ نگہداشت کے پاس I کی پروننگ اس طویل-\tau نظام میں جانچی جاتی ہے جہاں واقعی بے مصرف اجزاء کے لیے G_i \to 0 ہوتا ہے۔ اس کے برعکس، پاس II کی استحکام بخشی مختصر-\tau نظام پر بہترین سازی کرتی ہے، جہاں باہم متداخل اجزاء کے درمیان زائدیت نمایاں ہو جاتی ہے۔
§3. دورِ نگہداشت کی لاگت C_i — وسائل-صلاحیت بطورِ اوّلی
جزو \theta_i کی دورِ نگہداشت کی لاگت کی دو باہم سازگار صورتیں ہیں۔
صورت 3.1 — وسائل-صلاحیت (T-9 کے لیے اوّلی). جزو کی لاگت وہ وسائل-صلاحیت ہے جسے وہ کوڈیک کی عملیاتی بنیادی تہہ میں گھیرتا ہے:
C_i \;:=\; c_i^{\text{params}} + c_i^{\text{memory}} + c_i^{\text{compute}} + c_i^{\text{channel}} \tag{T9.3-1}
جہاں یہ چار بجٹ یہ ہیں: پیرا میٹر سلاٹس (وزنوں یا اتصالات کی تعداد)؛ حافظے کا حجم (ذخیرہ شدہ بِٹس میں)؛ کمپیوٹ لاگت (فی چکر عملیات میں)؛ اور چینل صلاحیت (بینڈوڈتھ کے وہ بِٹس جو جزو مارکوف بلینکٹ کی سرحد \partial_R A پر صرف کرتا ہے)۔ ہر c_i اصولی طور پر قابلِ مشاہدہ ہے — حیاتیاتی کوڈیکس کے لیے میٹابولک اور فعلیاتی پیمائش کے ذریعے، اور مصنوعی کوڈیکس کے لیے براہِ راست آلہ جاتی پیمائش کے ذریعے۔
صورت 3.2 — K-پیچیدگی کی تقربی صورت. اصل مقالے کی مساوات T9-3 میں \lambda K(\theta_i) استعمال ہوتی ہے، جہاں K(\theta_i) جزو کی prefix Kolmogorov complexity ہے:
C_i^{\text{K-approx}} \;:=\; \lambda \cdot K(\theta_i) \tag{T9.3-2}
یہ ایک ساختی-مطابقتی تقرب ہے: K-پیچیدگی upper-semicomputable ہے اور اجزا کے درمیان سختی سے جمعی نہیں ہوتی (کسی ایک جزو کو حذف کرنے سے ضروری نہیں کہ مختصر ترین توصیف کی لمبائی اس کے منفرد K(\theta_i) کے برابر کم ہو، کیونکہ اجزا ساختی اشتراک رکھ سکتے ہیں)۔ لہٰذا وسائل-صلاحیت کی صورت (T9.3-1) عملیاتی دعووں کے لیے اوّلی ہے؛ جبکہ K-پیچیدگی کی صورت ان نظری تجزیات کے لیے برقرار رکھی گئی ہے جہاں جمعی تقرب قابلِ قبول ہو۔
دو صورتیں کیوں۔ T-12 کے OpenAI جائزے (appendix-corrections memo §2.8) نے بجا طور پر نشان دہی کی کہ K-پیچیدگی اجزا کے درمیان جمعی نہیں ہوتی، اور عملیاتی دعووں کے لیے وسائل-صلاحیتی پیمانوں کی سفارش کی۔ T-9 وسائل-صلاحیت کو اوّلی حیثیت دیتا ہے، مگر K-پیچیدگی کی صورت کو بھی محفوظ رکھتا ہے کیونکہ موجودہ اصل مقالے کی مساوات T9-3 اور T-12 کے قضیے T-12 کے ثبوت، دونوں، K-پیچیدگی کی صورت کا حوالہ دیتے ہیں۔ وسائل-صلاحیتی تہذیب §3.6.3 / §3.6.4 / T-12 / T-13 کے لیے v3.7.0 یا اس کے بعد کے کسی صفائی مرحلے میں زیادہ صاف صورت بندی ہے؛ T-9 دونوں صورتیں اس لیے مہیا کرتا ہے تاکہ آئندہ صفائی ہم آہنگ طور پر انجام دی جا سکے، بجائے اس کے کہ تمام حوالہ دینے والے مقامات کی بیک وقت مرمت لازم ہو۔
\lambda کی tuning۔ صورت 3.2 میں، پیرا میٹر \lambda پیش گوئی فائدے اور پیچیدگی لاگت کے درمیان توازن قائم کرتا ہے۔ تجربی طور پر دیکھا گیا ہے کہ \lambda کی قدر affective state کے ساتھ بدلتی ہے — بلند |E(b)| (preprint Eq. T9-10) مؤثر طور پر جزوی سطح پر \lambda کو بڑھا دیتا ہے، جس سے affectively-marked اجزا pruning کے خلاف زیادہ مزاحم ہو جاتے ہیں۔ یہی جذباتی یادداشت کے استحکام کی رسمی توضیح ہے (preprint §3.6.5, Pass III).
§4. کٹائی کی شرط — حدی صورت
کٹائی کی شرط، مرکزی مقالے کی مساوات T9-4 کی سخت-مثبتیت صورت کے بجائے حدی صورت استعمال کرتی ہے۔ T-12 کے OpenAI جائزے (appendix-corrections memo §2.8 Correction 3) نے بجا طور پر نشان دہی کی کہ کٹائی کے لیے سخت I = 0 شرط حد سے زیادہ نازک ہے: حقیقی اجزاء، حتیٰ کہ اس وقت بھی جب ان کا بنیادی پیش گوئی کردار فلٹر شدہ اِن پٹ کے باعث خارج ہو چکا ہو، کمزور بالواسطہ پیش گوئیاتی حصہ رکھتے ہیں۔
حدی صورت میں کٹائی کی شرط:
\text{Prune } \theta_i \quad \text{if} \quad G_i(t, \tau) \;<\; C_i \;-\; \epsilon \tag{T9.4-1}
جہاں \epsilon > 0 ایک چھوٹا retention buffer ہے جو کوڈیک کی کٹائی کی جارحیت کو منضبط کرتا ہے۔ مساوی نامساواتی صورتیں:
G_i(t, \tau) - C_i \;<\; -\epsilon \quad \Longleftrightarrow \quad I\!\left(\theta_i; X_{t+1:t+\tau} \mid \theta_{-i}\right) \;<\; C_i - \epsilon \tag{T9.4-2}
مرکزی مقالے کی مساوات T9-4 سے تقابل۔ مرکزی مقالہ \Delta_{\mathrm{MDL}}(\theta_i) < 0 کو کٹائی کے محرک کے طور پر لکھتا ہے، جو \epsilon = 0 کے مطابق ہے — یعنی سخت نقطۂ توازن۔ T-9، retention buffer \epsilon متعارف کر کے تعمیم پیش کرتا ہے، جو حیاتیاتی کٹائی کی حرکیات کی زیادہ درست نمونہ سازی کرتا ہے (جہاں چھوٹے پیش گوئیاتی حصے عارضی شور کے مقابل محفوظ رہتے ہیں) اور مصنوعی-کوڈیک کٹائی کے hyperparameters کی بھی (جہاں threshold-based deletion معیاری طریقہ ہے)۔
سخت نقطۂ توازن کی صورت \epsilon \to 0 پر دوبارہ حاصل ہو جاتی ہے، لہٰذا T-9 کی یہ صورت T-12 اور T-13 میں موجود T9-4 حوالہ جات کو باطل نہیں کرتی؛ بلکہ ان کی تعمیم کرتی ہے۔
بیانیہ ڈرفٹ کے لیے مضمرہ (cross-reference T-12). فلٹر شدہ اِن پٹ X' = \mathcal{F}(X) کے تحت، خارج شدہ سگنل \mathcal{X}_{\text{excl}} کے ساتھ، وہ اجزاء \theta_i جن کا پیش گوئیاتی حصہ صرف \mathcal{X}_{\text{excl}} ہی کے لیے ہو، فلٹر شدہ سلسلے پر G_i(t, \tau) \to 0 کو پورا کرتے ہیں (کیونکہ ان کا ہدف مشاہدہ شدہ اِن پٹ میں موجود نہیں ہوتا)۔ اس کے بعد کٹائی کی شرط (T9.4-1) متحرک ہو جاتی ہے، کیونکہ کسی بھی مثبت لاگتی جزو کے لیے 0 < C_i - \epsilon برقرار رہتا ہے۔ T-12 کے قضیے T-12 کا عدمِ واپسی کا نتیجہ، اسی متحرک ہونے اور ذیل کے §5 میں چار-اسلوبی امتیاز، دونوں سے اخذ ہوتا ہے۔
§5. کٹائی کی چار صورتیں
کٹائی کا عمل (T9.4-1) کوڈیک میں چار الگ نفاذات کا متحمل ہے، جن کی واپسی پذیری کی خصوصیات مختلف ہیں۔ یہ امتیاز بحالی کی شرط (§6) کے لیے، اور T-12 Correction 1 (appendix-corrections memo §2.8) میں بیانیہ ڈرفٹ کی ناقابلِ واپسی کے دعوے کے لیے اہم ہے۔
صورت 5.1 — قابلِ واپسی دباؤ۔ جزو \theta_i کی آؤٹ پٹ وزن دہی کو صفر تک (یا شرکت کی کسی حدِ آستانہ سے نیچے) کم کر دیا جاتا ہے، مگر جزو کے پیرامیٹرز اور ساخت کوڈیک میں محفوظ رہتے ہیں۔ بحالی سیدھی ہے: دوبارہ وزن دہی جزو کو بحال کر دیتی ہے۔ یہی وہ عمل ہے جو conditioning میں رویّاتی extinction کی بنیاد بنتا ہے (conditioned response کمزور ہو جاتا ہے مگر اس کا نقش برقرار رہتا ہے) اور عصبی نیٹ ورکس میں dropout طرز کی regularisation میں بھی یہی کارفرما ہوتا ہے۔
صورت 5.2 — وزن کا انہدام۔ جزو کے پیرامیٹرز ایک regularisation دباؤ \propto \lambda کے تحت مسلسل ایک طے شدہ ابتدائی حالت کی طرف زوال پذیر ہوتے ہیں۔ جزو حذف نہیں ہوتا مگر اپنی وفاداری کھو دیتا ہے؛ اگر وہ ابتدائی حالت معلوماتی ہو تو جزوی بحالی ممکن ہے۔
صورت 5.3 — نمائندگیاتی فراموشی۔ استحکام کے دوران جزو کے پیرامیٹرز مسابقتی اجزا کے ذریعے overwrite ہو جاتے ہیں (Pass II, preprint §3.6.4)۔ ساختی خانہ برقرار رہتا ہے مگر مخصوص نمائندگی ضائع ہو جاتی ہے۔ بحالی کے لیے بعد کے کسی دورِ نگہداشت کے دوران متعلقہ ان پٹ سلسلے سے دوبارہ سامنا درکار ہوتا ہے، اور یہ بحالی جزوی ہوتی ہے (دوبارہ سیکھی گئی نمائندگی باریک تفصیلات میں اصل سے مختلف ہوتی ہے)۔
صورت 5.4 — معماریاتی کٹائی۔ جزو کے پیرامیٹرز اور اس کا ساختی خانہ دونوں حذف کر دیے جاتے ہیں؛ کوڈیک کی معماری کم ہو جاتی ہے۔ بحالی کوڈیک کی سطح پر ناممکن ہے — جزو کو ایک مکمل تعلّمی مرحلے کے ذریعے ازسرِنو اگانا پڑتا ہے۔ یہی ناقابلِ واپسی صورت ہے۔
فلٹر شدہ ان پٹ کے تحت صورتوں کی درجہ بندی۔ T-12 Theorem T-12 کا “ناقابلِ واپسی” ہونے کا دعویٰ (جیسا کہ موجودہ preprint میں بیان ہوا ہے) صورت 5.4 (معماریاتی کٹائی) کا تقاضا کرتا ہے اور صورتوں 5.1–5.3 کو خارج کرتا ہے۔ T-9 اس صورت-وابستگی کو صراحت کے ساتھ واضح کرتا ہے؛ v0.4 appendix-corrections memo §2.8 Correction 1 (“irreversible should be conditional on no protected archive / no replay buffer / no external teacher / no architectural reserve capacity / continued operation under the same filter / pruning is literal capacity deletion, not reversible suppression”) صورت 5.4 کی قرأت کے مطابق ہے۔
حقیقی حیاتیاتی اور مصنوعی کوڈیکس عموماً صورتوں کے ایک امتزاج کا اظہار کرتے ہیں، جہاں صورت 5.4 ان اجزا کے لیے مخصوص رہتی ہے جن کی بہت سے دورِ نگہداشت میں مسلسل کٹائی ہوتی رہے۔ مسلسل فلٹر شدہ ان پٹ کے تحت قابلِ واپسی کٹائی سے ناقابلِ واپسی کٹائی کی طرف انتقال ہی وہ ساختی میکانزم ہے جو مزمن بیانیہ ڈرفٹ (T-12) کی بنیاد بنتا ہے۔
§6. شرطِ بازیابی
کوئی تراشا گیا جزو \theta_i قابلِ بازیابی ہے اگر ایسا کوئی عمل موجود ہو جس کے ذریعے اسے کوڈیک میں فعال شرکت کے لیے دوبارہ بحال کیا جا سکے۔ بازیابی کی کھڑکی \tau_R کے دوران بازیابی کا احتمال یہ ہے:
P\big(\text{recover } \theta_i \mid \tau_R\big) \;=\; P\big(\text{Modality 5.1 or 5.2}\big) \cdot p_{\text{restore}}(\tau_R) \;+\; P\big(\text{Modality 5.3 or 5.4}\big) \cdot p_{\text{regrow}}(\tau_R) \tag{T9.6-1}
پہلا جزو قابلِ واپسی / جزوی طور پر قابلِ واپسی تراش خراش (دباؤ، وزن کا انہدام) کا احاطہ کرتا ہے؛ دوسرا جزو نمائندگیاتی فراموشی اور معماریاتی تراش خراش کا احاطہ کرتا ہے، جہاں بازیابی کے لیے خارجی اِن پٹ درکار ہوتا ہے۔
بازیابی صرف اسی صورت مثبت ہے جب تین میں سے کم از کم ایک شرط برقرار ہو:
محفوظ یادداشت۔ کوڈیک \theta_i کی ایک محفوظ شدہ نمائندگی کسی غیر تراشی گئی بنیادی تہہ میں برقرار رکھتا ہے (علیحدہ کیش، ورژن-کنٹرول شدہ بیک اپ، عصب-فعلیاتی طور پر محفوظ یادداشت جو کسی دوسرے خطے میں مستحکم کی گئی ہو)۔ اس شرط کے تحت Modality 5.1 اور 5.3 بازیاب ہو سکتی ہیں۔
خارجی معلّم / دوبارہ سامنا۔ کوڈیک ایسے اِن پٹ سلسلوں کے سامنے آتا ہے جن میں وہ سگنل \mathcal{X}_{\text{excl}} شامل ہو جسے تراشا گیا جزو اصل میں ٹریک کر رہا تھا۔ بعد کے دورِ نگہداشت کے Pass II کے دوران فعال ازسرِنو سیکھنا اس جزو کو دوبارہ تعمیر کرتا ہے (باریک سطح کی وفاداری سے متعلق احتیاطات کے ساتھ)۔ کافی وقت گزرنے پر اس شرط کے تحت چاروں modalities بازیاب ہو سکتی ہیں، اگرچہ Modality 5.4 کے لیے اصل حصول کے مماثل ایک مکمل تعلّمی مرحلہ درکار ہوتا ہے۔
معماریاتی ذخیرہ۔ کوڈیک کے پاس ایسے ساختی خانے موجود ہوں جو مخصوص اجزا کے لیے مختص نہ کیے گئے ہوں اور جنہیں دوبارہ اگائی گئی نمائندگی کی میزبانی کے لیے مختص کیا جا سکے۔ یہی وہ شرط ہے جس کے تحت Modality 5.4 کی بازیابی اصولاً میکانکی طور پر ممکن ہوتی ہے۔
اگر (1)، (2)، (3) میں سے کوئی بھی شرط برقرار نہ ہو، تو تمام \tau_R کے لیے P(\text{recover}\, \theta_i \mid \tau_R) = 0 ہوگا، اور یہ تراش خراش مستقل ہوگی۔
شرطِ وفاداریِ اساس۔ T-12 کی شرطِ وفاداریِ اساس (Theorem T-12b — مارکوف بلینکٹ کو عبور کرنے والی \delta-آزاد اِن پٹ چینلز کی فالتویت) دراصل (2) کی نسبی-نسلی پیمانے پر مماثل صورت ہے: یہ چینلز اس امر کو یقینی بناتے ہیں کہ اِن پٹ سلسلہ خارجی میکانزم \mathcal{F} کے ذریعے فلٹر ہونے کے باوجود بھی اساس سے متعلقہ سگنل پر مشتمل رہے۔ T-9 کی شرطِ بازیابی اس کا کوڈیک کے اندرونی دائرے میں نفاذ فراہم کرتی ہے: محفوظ اجزا، ری پلے بفرز، معماریاتی ذخیرہ۔
§7. نتائجِ لازمہ — بیانیہ ڈرفٹ اور عملی ڈرفٹ
T-9 کے بنیادی اجزاء دو ایسے سلسلہ ہائے نتائجِ لازمہ کی تائید کرتے ہیں جو ضمیمہ جات T-12 اور T-13 میں وضع کیے گئے ہیں۔
نتیجہِ لازمہ 7.1 — بیانیہ ڈرفٹ (T-12). مسلسل فلٹر شدہ اِن پٹ X' = \mathcal{F}(X) کے تحت، جو سگنل \mathcal{X}_{\text{excl}} کو خارج کرتا ہو: - وہ اجزاء \theta_i جن کا پیش گوئی نفع صرف \mathcal{X}_{\text{excl}} پر منحصر ہے، فلٹر شدہ سلسلہ پر G_i(t, \tau) \to 0 رکھتے ہیں۔ - pruning کی شرط (T9.4-1) ایسے تمام اجزاء میں متحرک ہو جاتی ہے۔ - اگر pruning موڈیلٹی 5.4 (معماریاتی) میں ہو — جو متعدد دورِ نگہداشت کے دوران مسلسل فلٹرنگ کی صورت میں غالب رہتی ہے — اور بازیافت کی شرائط میں سے کوئی بھی (§6، نکات 1–3) برقرار نہ ہو، تو \mathcal{X}_{\text{excl}} کو ماڈل کرنے کی صلاحیت مستقل طور پر ضائع ہو جاتی ہے۔ - کوڈیک اپنی ہی صلاحیت کے زیاں کو اندر سے شناخت نہیں کر سکتا (کیونکہ ضائع شدہ اجزاء اب پیش گوئی خطا کی تخلیق میں شریک نہیں رہتے)، اور یوں T-12a کے عدمِ شناخت پذیری کے دعوے کی بازتولید ہوتی ہے۔
مکمل رسمی بحث T-12 میں موجود ہے؛ T-9 “ناقابلِ واپسی” کی وہ موڈیلٹی-مخصوص تعبیر فراہم کرتا ہے جس کی T-12 Correction 1 کو ضرورت ہے۔
نتیجہِ لازمہ 7.2 — عملی ڈرفٹ (T-13). وہ اجزاء جو غیر استعمال شدہ شاخوں کے لیے رویہ جاتی-تقییمی صلاحیت کو رمز بند کرتے ہیں: - ان کا پیش گوئی نفع G_i(t, \tau) اِن پٹ سلسلے کے بالفعل متحقق شدہ شاخی نتائج کے مقابل ناپا جاتا ہے؛ اگر بعض شاخیں کبھی منتخب ہی نہ ہوں، تو ان تقییم کاروں کے پاس کوئی تربیتی سگنل نہیں ہوتا۔ - pruning کی شرط اس وقت متحرک ہوتی ہے جب غیر استعمال شدہ تقییم کار کا G_i، C_i - \epsilon سے نیچے گر جائے۔ - موڈیلٹی 5.4 کے تحت، تقییم کار مستقل طور پر prune ہو جاتا ہے؛ کوڈیک متعلقہ عملی میدان میں پُراعتماد مگر بے اثر ہو جاتا ہے۔
T-13 کی Proposition T-13.P1 (Action-Drift) اسی درون-کوڈیک میکانزم کی نسبی-پیمانے (رویہ جاتی ذخیرۂ اعمال) پر وارد مثال ہے۔
باہمی حوالہ: نسبی سطح کا دورِ نگہداشت۔ ضمیمہ T-15 §3، حیات کے اندر واقع دورِ نگہداشت اور فائیلوجینیاتی تہذیب کے مابین ساختی مطابقت کو واضح کرتا ہے۔ T-9 کی pruning کی چار موڈیلٹیاں بالترتیب ان سے مطابق ہیں: عارضی niche reduction (5.1)، نرم پڑی ہوئی انتخابی دباؤ کے تحت نسبی drift (5.2)، niche replacement (5.3)، اور نسبی انقراض (5.4)۔ بازیافت کی شرائط (§6) فائیلوجینیاتی فاضلیت سے مطابق ہیں: محفوظ پناہ گاہیں (1)، niche restoration کے تحت ماحولیاتی دوبارہ-تعرض (2)، اور ارتقائی reserve capacity (3)۔
§8. مرکزی مقالے کے §3.6 کی مساوات سے تعلق
T-9 اخراج نہیں بلکہ استحکام و یکجائی کا کام کرتا ہے۔ مرکزی مقالے کی مساوات T9-1 سے T9-13 تک (پری پرنٹ §3.6.1–§3.6.6) حوالہ دی گئی صورت میں برقرار ہیں؛ T-9 ان کی تکمیل کے لیے اضافی رسمی ابتدائیات اور تنقیحات متعارف کراتا ہے۔
| مرکزی مقالہ | T-9 |
|---|---|
| T9-1 (K(P_\theta(t)) \le C_{\text{ceil}}) — کل پیچیدگی کی بالائی حد | §1 ترتیب |
| T9-2 (\mathcal{M}_\tau : P_\theta(t) \to P_\theta(t + \tau)) — دورِ نگہداشت عامل | §1 ترتیب |
| T9-3 (\Delta_{\mathrm{MDL}}(\theta_i) = I(\theta_i; X \mid \theta_{-i}) - \lambda K(\theta_i)) — MDL چھانٹی مقدار | §2 پیش گوئی فائدہ G_i + §3 دورِ نگہداشت لاگت C_i (صورت 3.2 K-تقریب) |
| T9-4 (اگر \Delta_{\mathrm{MDL}} < 0 ہو تو چھانٹی کریں) — چھانٹی کی شرط | §4 حدی صورت (T9.4-1 مع \epsilon \to 0) |
| T9-5 (Landauer pruning cost) — حراریاتی کم از کم حد | §5 موڈیلٹی پر انحصار (ناقابلِ واپسی ہونا موڈیلٹی 5.4 پر لاگو ہوتا ہے) |
| T9-6 (\Delta K_{\text{prune}}) — چھانٹی کی گنجائش کی بازیافت | §3 + §5 (وسیلہ-گنجائش کی صورت حساب داری کو موڈیلٹیوں پر جمعی بناتی ہے) |
| T9-7 / T9-8 (\Delta K_{\text{compress}}) — استحکامِ ادغام کا فائدہ | §1 ترتیب (Pass II) — T-9 استحکامِ ادغام کو ازسرِنو مشتق نہیں کرتا |
| T9-9 / T9-10 (w(b), E(b)) — REM اہمیتی وزن دہی | §3 (\lambda کی تاثراتی ترتیب) — T-9 REM نمونہ گیری کو ازسرِنو مشتق نہیں کرتا |
| T9-11 — REM نمونہ گیری کی تقسیم | غیر متبدل — T-9 Pass III کو ازسرِنو مشتق نہیں کرتا |
| T9-12 / T9-13 — خالص پیچیدگی بجٹ | §1 ترتیب — T-9 کی وسیلہ-گنجائش صورت بجٹ کی حساب داری کو زیادہ دقیق بناتی ہے |
T-9 میں خالصتاً نیا مواد: پیش گوئی فائدہ G_i(t,\tau) کی صریح تعریف (§2)؛ بنیادی فریم کے طور پر وسیلہ-گنجائش لاگت کی صورت بندی (§3 صورت 3.1)؛ برقرار رکھنے کے بفر \epsilon کے ساتھ حدی صورتِ چھانٹی شرط (§4)؛ چھانٹی کی چار موڈیلٹیاں (§5)؛ بازیافت کی شرط (§6)؛ T-12 کے ناقابلِ واپسی ہونے کے دعوے کی موڈیلٹی-مخصوص قرأت (§7.1)۔
§9. کھلے کنارے
T-12 کی چینل-استقلال کی ازسرِ نو صورت بندی کے ساتھ ہم آہنگی (مرحلہ 4). T-12 ضمیمہ-تصحیحات کی قطار (v0.4 §2.8) میں شامل ہے تاکہ چینل-استقلال کی شرط کو ازسرِ نو یوں مرتب کیا جائے: فلٹرنگ میکانزموں کی استقلال، نہ کہ سگنلز کی۔ T-9 کی pruning condition (§4) اور recovery condition (§6) اسی ازسرِ نو صورت بندی کے ساتھ ہم آہنگی کے لیے لکھی گئی ہیں، لیکن جب چینل-استقلال کی نئی تعریف نافذ ہو جائے گی تو T-12 کے Theorem T-12 کے ثبوت کا دوبارہ جائزہ لینا ہوگا۔ بالخصوص: T-12 §3.1 میں irreversibility کا دعویٰ فی الحال T9-3 / T9-4 کا حوالہ دیتا ہے؛ v3.7.0 کی صفائی کے بعد اسے T-9 کی §4 threshold form + §5 modality classification + §6 recovery condition کا حوالہ دینا چاہیے، اور irreversibility کی تعبیر کو no-recovery-condition کی صورت میں Modality 5.4 تک محدود رہنا چاہیے۔ کھلا۔
وسیلہ-گنجائش بمقابلہ K-complexity bookkeeping کی تطبیقِ حساب. §3 دونوں صورتیں فراہم کرتا ہے لیکن ان کے مقداری باہمی تعلق کو اخذ نہیں کرتا۔ بعض جزوی اصناف کے لیے یہ دونوں قریبی طور پر مربوط ہیں (C_i^{\text{params}} \sim K(\theta_i) ایک مستقل عامل کے اندر، مثلاً memorised lookup tables کے لیے)؛ دوسروں کے لیے یہ شدید طور پر ایک دوسرے سے جدا ہو جاتی ہیں (اجزا کے درمیان مشترک compositional structure ایسی K-complexity بچتیں دیتی ہے جنہیں resource-capacity صورت گرفت میں شمار نہیں کیا جاتا)۔ v3.7.0 یا اس کے بعد کی کسی تطبیقِ حساب کی خواہش ہے۔ کھلا۔
virtual-reading neutrality (v3.6.21). مکمل طور پر virtual standing-state reading (main paper §8.6.1) دورِ نگہداشت کو ایک چلتی ہوئی مشین کے بجائے فلٹر سے گزرنے والی stream کی خصوصیات کے طور پر دوبارہ بیان کرتی ہے، لیکن نہیں Form 3.1 / Form 3.2 bookkeeping کی درجہ بندیِ نو کرتی: Form 3.1 (resource-capacity) تمام operational دعووں کے لیے بدستور بنیادی رہتی ہے، اور T-12 کا operative proof بھی اسی کو استعمال کرتا رہتا ہے۔ stream-native compressibility reading صرف اسی تفسیری سطح پر داخل ہوتی ہے جس کا ذکر T-12 §3.1 میں ہے۔ اوپر مذکور K-additivity reconciliation ہی وہ مقام ہے جہاں مستقبل میں Form کی کسی re-tiering کے حق میں استدلال کیا جائے گا — virtual reading نہیں۔ کھلا (اسے v3.7.0 cleanup کے ساتھ خلط ملط نہ کیا جائے)۔
\epsilon کی تجربی
calibration. (T9.4-1) میں retention buffer \epsilon ایک مؤثر pruning hyperparameter ہے۔
تجربی حیاتیاتی قدریں neural-pruning مطالعات (synaptic decay thresholds,
dendritic-spine retention rates) سے یا opt-ai-subject
prototype میں Δ_self^op asymptote experiment سے حاصل ہوں گی۔ T-9 کوئی
مخصوص قدر اخذ نہیں کرتا۔ کھلا۔
دورِ نگہداشت کی تجربی پیش گوئیوں کے ساتھ cross-link. preprint §3.6.7 دورِ نگہداشت (sleep / dream / consolidation) کے لیے تجربی پیش گوئیاں درج کرتا ہے۔ T-9 کی pruning کی چار modalities زیادہ باریک درجہ بندی والی پیش گوئیاں دیتی ہیں: یہ پیش گوئی کہ “REM dreams disproportionately sample high-importance branches” (preprint §3.6.5, Pass III) modality-specific پیش گوئیوں میں تحلیل ہو جاتی ہے کہ کس قسم کی representations کو Modality 5.1 (pruning کے مقابل importance-weighted retention) محفوظ رکھتی ہے بمقابلہ Modality 5.4 (جہاں waking experience میں high-importance branches کی عدم موجودگی متعلقہ evaluator کی معماریاتی حذف تک لے جاتی ہے)۔ کھلا۔
یہ ضمیمہ OPT منصوبے کے repository میں opt-theory.md کے ساتھ برقرار رکھا جاتا ہے۔ preprint §3.6 میں دورِ نگہداشت کے primitives کے حوالہ جات محفوظ رکھے گئے ہیں؛ T-9 ان کی تکمیل explicit predictive-gain G_i (§2)، resource-capacity cost (§3 Form 3.1)، retention buffer \epsilon کے ساتھ threshold-form pruning condition (§4)، pruning کی چار modalities (§5)، اور recovery conditions (§6) کے ذریعے کرتا ہے۔ Corollary references: T-12 (بیانیہ ڈرفٹ) §3.6.3؛ T-13 (Action-Drift) §6؛ T-15 (Phylogenetic Stability Filter) §3.