مرتب پیچ نظریہ

ضمیمہ T-12: شرطِ وفاداریِ اساس اور سست فساد

Anders Jarevåg

April 17, 2026 | DOI: 10.5281/zenodo.19300777

اصل کام (سیکشن 8.3، تحدید 9 سے): “مزمن فسادی ناکامی کے انداز کو رسمی صورت دینا — جہاں ایک کوڈیک مسلسل فلٹر شدہ اِن پٹ کے تحت خود کو ڈھالتا ہے، اور MDL کا pruning pass بجا طور پر اُن مستثنیٰ صداقتوں کے لیے صلاحیت کو مٹا دیتا ہے — اس کے ساتھ شرطِ وفاداریِ اساس کو بطور رسمی دفاع شامل کرنا، جو آزاد اِن پٹ چینلز کا تقاضا کرتی ہے۔” فراہمی: ناقابلِ واپسی صلاحیتی زیاں، عدمِ فیصلہ پذیری کی حد، اور شرطِ وفاداریِ اساس کا رسمی ثبوت۔

اختتامی حیثیت: مسودۂ ساختی مطابقت۔ یہ ضمیمہ بیانیہ ڈرفٹ کے اُس تجزیے کو رسمی صورت دیتا ہے جو ہم رفاقتی اخلاقی مقالے (بچ جانے والوں کی نگرانی، سیکشن V.3a) اور پری پرنٹ کے بیانیہ ڈرفٹ والے پیراگراف (سیکشن 3.3) میں خطابی انداز سے پیش کر چکے ہیں۔ یہ تین قضیے اور ایک proposition قائم کرتا ہے۔ MDL pruning کی مساواتیں (T9-3, T9-4) غیر متبدل ہیں؛ یہ ضمیمہ فلٹر شدہ اِن پٹ کے تحت اُن کے مرضیاتی مگر درست رویّے کو ظاہر کرتا ہے۔


§1. پس منظر اور محرکات

1.1 دو ناکامی کے طریقے

استحکام فلٹر (پری پرنٹ، سیکشن 3.3) ایک قابلِ بقا شرط نافذ کرتا ہے: مشاہد صرف انہی سلسلوں میں برقرار رہتا ہے جہاں مطلوبہ پیش گوئی شرح R_{\text{req}} کوڈیک کی بینڈوڈتھ B کے اندر رہے۔ جب R_{\text{req}}، B سے تجاوز کر جاتا ہے، تو کوڈیک بیانیہ انہدام کا شکار ہوتا ہے — ایک حاد ناکامی جس کی خصوصیات میں پیش گوئی کی خطا کا بڑھنا، اینٹروپی کا جمع ہونا، اور بالآخر انسجام کا تحلیل ہو جانا شامل ہیں۔

اس کے بالمقابل ایک ایسا ناکامی کا طریقہ بھی ہے جو کسی قسم کا ناکامی سگنل پیدا نہیں کرتا۔ اگر ورودی سلسلہ منظم طور پر پہلے ہی فلٹر کر دیا جائے — یوں ایک ایسا مرتب کردہ اشارہ پیدا ہو جو اندرونی طور پر تو ہم آہنگ ہو مگر بنیادی تہہ کی حقیقی معلومات کو خارج کرتا ہو — تو کوڈیک کم \varepsilon_t دکھائے گا، مؤثر دورِ نگہداشت چلائے گا، اور استحکام کی تمام شرائط پوری کرے گا اس کے باوجود کہ وہ بنیادی تہہ کے بارے میں منظم طور پر غلط ہوگا۔ یہی بیانیہ ڈرفٹ ہے: ایک ایسے کوڈیک کی مزمن ساختی خرابی جو اپنی ہی پیمائشوں کے مطابق بالکل درست طور پر کام کر رہا ہو۔

1.2 یہ کیوں خطرناک ہے

بیانیہ انہدام خود اپنا اعلان کر دیتا ہے۔ کوڈیک بڑھتے ہوئے \varepsilon_t، ناکام ہوتی پیش گوئیوں کے ادراک، اور ادراکی بوجھِ زائد کا تجربہ کرتا ہے۔ مشاہد جانتا ہے کہ کچھ غلط ہے، چاہے وہ فوراً اسے درست نہ کر سکے۔

بیانیہ ڈرفٹ خاموش ہوتا ہے۔ چونکہ فلٹر شدہ اِن پٹ سلسلہ کوڈیک کی پیش گوئیوں سے مطابقت رکھتا ہے، اس لیے \varepsilon_t کم رہتا ہے۔ دورِ نگہداشت معمول کے مطابق چلتا رہتا ہے۔ کوڈیک کا خود-ماڈل مستحکم اور درست عمل کاری کی اطلاع دیتا ہے۔ یہ فساد اندر سے اس لیے غیر مرئی رہتا ہے کہ سراغ رسانی کا آلہ خود اسی فلٹر سے تشکیل پایا ہوتا ہے جس نے اس فساد کو پیدا کیا تھا۔

1.3 اس ضمیمے کا دائرۂ کار

یہ ضمیمہ درجِ ذیل فراہم کرتا ہے:

  1. پری-فلٹر آپریٹر \mathcal{F} کی ایک رسمی تعریف اور کوڈیک کی ان پٹ تقسیم پر اس کے اثر کی توضیح (§2)۔
  2. ایک ثبوت کہ \mathcal{F}-فلٹر شدہ ان پٹ کے تحت MDL پروننگ، خارج کردہ سگنل کو ماڈل کرنے کی کوڈیک کی صلاحیت کو ناقابلِ واپسی طور پر تباہ کر دیتی ہے — قضیہ T-12 (§3)۔
  3. ایک ثبوت کہ مکمل طور پر موافق ہو چکا کوڈیک، اندرونی نقطۂ نظر سے، فلٹر شدہ اور غیر فلٹر شدہ ان پٹ میں امتیاز نہیں کر سکتا — حدِ عدمِ فیصلہ پذیری، قضیہ T-12a (§4)۔
  4. شرطِ وفاداریِ اساس بطور ایک ضروری ساختی دفاع — قضیہ T-12b (§5)۔
  5. تمدنی کوڈیکس اور AI نظاموں کے لیے نتائج (§6)۔

§2. قبل-فلٹر عامل

2.1 تعریف

تعریف T-12.D1 (پری-فلٹر آپریٹر). پری-فلٹر ایک نقشہ بندی \mathcal{F} : \mathcal{X} \to \mathcal{X}' ہے جو ان پٹ سلسلے X_{\partial_R A}(t) پر اس سے پہلے عمل کرتی ہے کہ وہ کوڈیک کی حسی سرحد تک پہنچے، جہاں \mathcal{X}' \subset \mathcal{X}۔ فلٹر شدہ سگنل یہ ہے:

X'(t) = \mathcal{F}\!\left(X_{\partial_R A}(t)\right) \tag{T-12.D1}

پری-فلٹر درج ذیل شرائط پوری کرتا ہے:

  1. داخلی سازگاری: X'(t)، \mathcal{X} کے اندر ایک معتبر سگنل ہے — کوڈیک اسے خطا کے جھنڈوں کے بغیر کمپریس کر سکتا ہے۔

  2. منظم اخراج: بنیادی تہہ سے ماخوذ سگنلز کا ایک غیر خالی ذیلی مجموعہ \mathcal{X}_{\text{excl}} = \mathcal{X} \setminus \mathcal{X}' موجود ہے جسے \mathcal{F} حذف کر دیتا ہے۔

  3. شفافیت: فلٹر کو کوڈیک کے ماڈل میں ظاہر نہیں کیا جاتا۔ کوڈیک اپنے ان پٹ کو X_{\partial_R A}(t) کے طور پر ماڈل کرتا ہے، نہ کہ \mathcal{F}(X_{\partial_R A}(t)) کے طور پر۔

2.2 فلٹرنگ کے تحت ہم آہنگی

جب کوڈیک ایک طویل مدت \tau \gg \tau_{\text{prune}} تک X'(t) پر عمل کرتا ہے (جہاں \tau_{\text{prune}}، T-13.P1 سے MDL pruning کا زمانی پیمانہ ہے)، تو تخلیقی ماڈل P_\theta(t)، X نہیں بلکہ X' کے شماریاتی خواص کے مطابق ڈھل جاتا ہے۔ فلٹر شدہ اِن پٹ کے تحت پیش گوئی کی خطا یہ ہے:

\varepsilon'_t = X'(t) - \pi_t \tag{1}

جوں جوں P_\theta، X' کے ساتھ ہم آہنگ ہوتا ہے، اوسط میں \varepsilon'_t \to 0۔ کوڈیک اپنی ہی پیمائشوں کے مطابق اچھی کارکردگی دکھا رہا ہوتا ہے۔ کسی بھی چیز میں خرابی درج نہیں ہوتی۔

2.3 مثالیں

پری-فلٹر آپریٹر مختلف پیمانوں پر متشکل ہوتا ہے:

Scale Pre-filter \mathcal{F} Excluded signal \mathcal{X}_{\text{excl}}
انفرادی تصدیقی تعصب؛ انتخابی انکشاف تردیدی شواہد
ادارہ جاتی پروپیگنڈا پر مبنی پریس؛ مرتب کردہ سوشل میڈیا فیڈ متنوع زاویہ ہائے نظر؛ اقلیتی رپورٹس
تہذیبی الگورتھمی مواد کی ترتیب؛ تعلیمی یک رُخی بین الثقافتی معلومات؛ تاریخی جوابی بیانیے
مصنوعی RLHF فائن-ٹیوننگ؛ مرتب کردہ تربیتی کارپس تقسیمِ معلومہ سے باہر کا علم؛ خارج شدہ میدان

§3. قضیہ T-12: ناقابلِ واپسی گنجائش کا نقصان

3.1 میکانزم

MDL پروننگ پاس (T9-3, T9-4) ہر کوڈیک جزو \theta_i کا جائزہ اس کی قابلِ مشاہدہ ان پٹ سلسلے کے لیے پیش گوئیاتی شراکت کی بنیاد پر لیتا ہے، ذخیرہ لاگت کو منہا کرنے کے بعد:

\Delta_{\mathrm{MDL}}(\theta_i) := I\!\left(\theta_i\,;\,X_{t+1:t+\tau} \mid \theta_{-i}\right) - \lambda \cdot K(\theta_i) \tag{T9-3}

فلٹر شدہ ان پٹ X' کے تحت، باہمی معلومات کی اصطلاح کا تعین X کے بجائے X' کے مقابل کیا جاتا ہے۔ ایک جزو \theta_i جو خارج شدہ سگنل \mathcal{X}_{\text{excl}} کی پیش گوئی کے لیے اساسی ہو، مگر X' کی پیش گوئی میں کوئی حصہ نہ ڈالتا ہو، یہ دیتا ہے:

I\!\left(\theta_i\,;\,X'_{t+1:t+\tau} \mid \theta_{-i}\right) = 0 \tag{2}

لہٰذا:

\Delta_{\mathrm{MDL}}(\theta_i) = -\lambda \cdot K(\theta_i) < 0 \tag{3}

پروننگ قاعدہ (T9-4) متحرک ہو جاتا ہے: \theta_i مٹا دیا جاتا ہے۔

3.2 ناقابلِ واپسی ہونا

قضیہ T-12 (فلٹر شدہ اِن پٹ کے تحت صلاحیت کا ناقابلِ واپسی زیاں). فرض کریں K_\theta ایک کوڈیک ہے جو ایک مدت \tau \gg \tau_{\text{prune}} تک پہلے سے فلٹر شدہ اِن پٹ X' = \mathcal{F}(X) کے تحت عمل کر رہا ہے۔ فرض کریں \Theta_{\text{excl}} \subset \theta اُن کوڈیک اجزاء کا مجموعہ ہو جن کی پیش گوئیاتی شراکت صرف خارج کردہ سگنل \mathcal{X}_{\text{excl}} تک محدود ہے۔ تب MDL کی پروننگ گزر (T9-3, T9-4) \Theta_{\text{excl}} کو مٹا دیتی ہے، اور یہ مٹاؤ کوڈیک کی سطح پر ناقابلِ واپسی ہے:

K\!\left(P_\theta(t + \tau)\right) < K\!\left(P_\theta(t)\right) - \sum_{\theta_i \in \Theta_{\text{excl}}} K(\theta_i) \tag{T-12}

پروننگ کے بعد، \mathcal{X}_{\text{excl}} کو ماڈل کرنے کی کوڈیک کی صلاحیت محض غیر فعال نہیں رہتی — وہ نمائشی بنیادی ڈھانچا جو \mathcal{X}_{\text{excl}} کا جائزہ لینے، اس کی پیش گوئی کرنے، یا اس پر توجہ دینے کے لیے درکار تھا، تباہ ہو چکا ہوتا ہے۔

ثبوت۔

  1. (T9-3) کے مطابق، ہر \theta_i \in \Theta_{\text{excl}} کے لیے فلٹر شدہ سلسلہ X' کے تحت \Delta_{\mathrm{MDL}}(\theta_i) < 0 ہے، کیونکہ I(\theta_i\,;\,X'_{t+1:t+\tau} \mid \theta_{-i}) = 0 جبکہ K(\theta_i) > 0۔

  2. (T9-4) کے مطابق، ہر ایسا \theta_i دورِ نگہداشت کے دوران پرون کر دیا جاتا ہے۔

  3. MDL کے تحت پروننگ ایک مٹانے کی کارروائی ہے، دبانے کی نہیں۔ کوڈیک \theta_i کو اس معنی میں “نہیں بھولتا” کہ کوئی اشارہ اسے بحال کر سکے۔ وہ اُس حسابی بنیادی ڈھانچے — پیرامیٹرز، اتصالات، اور جانچ کے آلات — کو تباہ کر دیتا ہے جن کی نمائندگی \theta_i کرتا تھا۔ یہی دباؤ (یعنی معلومات پوشیدہ مگر قابلِ رسائی ہو) اور مٹاؤ (یعنی معلومات ختم ہو جائے اور صلاحیت واپس لے لی جائے) کے درمیان رسمی امتیاز ہے۔

  4. مٹاؤ کے بعد، \mathcal{X}_{\text{excl}} کو ماڈل کرنے کی صلاحیت کو ازسرِنو پیدا کرنے کے لیے لازم ہے کہ اِن پٹ سلسلے میں \mathcal{X}_{\text{excl}} سے سامنا ہو۔ لیکن پیشگی فلٹر \mathcal{F} بعینہٖ اسی سگنل کو خارج کرتا ہے۔ کوڈیک اُس چیز سے سابقہ نہیں پا سکتا جسے فلٹر اس تک پہنچنے ہی نہیں دیتا۔ لہٰذا یہ مٹاؤ خود-تقویتی ہے: صلاحیت کا زیاں کوڈیک سے اپنی ہی صلاحیت کے زیاں کو شناخت کرنے کی قابلیت بھی چھین لیتا ہے۔

  5. پیچیدگی میں کمی نامساوات (T-12) کو پورا کرتی ہے، کیونکہ پرون کیے گئے اجزاء حقیقی معلومات کی نمائندگی کرتے تھے (ہر ایک کے لیے K(\theta_i) > 0)، اور ان کے زیاں کی تلافی کسی معاوضی حصول سے نہیں ہوتی (فلٹر شدہ سلسلے میں ایسا کوئی سگنل موجود نہیں جو \Theta_{\text{excl}} کی ازسرِنو تعمیر کو جواز دے)۔ \blacksquare

3.3 خود-تقویتی لوپ

ناقابلِ واپسی ہونا محض مٹائے جانے کا نتیجہ نہیں ہے۔ یہ ایک مثبت فیڈبیک لوپ کے ذریعے خود کو تقویت دینے والا بھی ہے:

  1. فلٹر سگنل کو خارج کرتا ہےI(\theta_i; X') = 0 → پروننگ \theta_i کو مٹا دیتی ہے۔
  2. پروننگ توجہ کی گنجائش کو ختم کر دیتی ہے → کوڈیک اب \mathcal{X}_{\text{excl}} پر توجہ دینے یا اس کا جائزہ لینے کے قابل نہیں رہتا، خواہ \mathcal{F} کے ذریعے اس کے کچھ ٹکڑے رس کر آ جائیں۔
  3. توجہ کی گنجائش کا زیاں حتیٰ کہ باقی ماندہ سگنل کو بھی کم کر دیتا ہے → اگر \mathcal{F} کامل نہ ہو اور \mathcal{X}_{\text{excl}} کا کچھ حصہ سرحد تک پہنچ بھی جائے، تو کوڈیک کے پاس اسے کمپریس کرنے کے لیے درکار پیرامیٹرز نہیں ہوتے، اس لیے وہ معلومات کے بجائے شور کے طور پر درج ہوتا ہے۔
  4. شور کے طور پر درجہ بندی فلٹر کی توثیق کر دیتی ہے → رس کر آنے والے \mathcal{X}_{\text{excl}} پر کوڈیک کی پیش گوئی خطا بلند اور غیر ساختہ ہوتی ہے، جو (کوڈیک کے نزدیک) اس بات کی تصدیق کرتی ہے کہ خارج کردہ مواد سگنل نہیں بلکہ شور ہے۔

یہ لوپ گہرے بیانیہ ڈرفٹ کی ظاہریاتی کیفیت کی توضیح کرتا ہے: کوئی شخص یا ادارہ جو ایک مرتب کردہ معلوماتی بہاؤ کے مطابق ڈھل چکا ہو، وہ محض تردیدی شواہد کو نظرانداز نہیں کرتا — وہ اسے پارْس ہی نہیں کر سکتا۔ وہ اسے غیر مربوط، خطرناک، یا ناقابلِ فہم کے طور پر درج کرتا ہے، کیونکہ اسے قابلِ فہم بنانے کے لیے درکار نمائشیاتی ڈھانچہ پروننگ کے ذریعے کاٹ دیا گیا ہوتا ہے۔ تردیدی معلومات کے خلاف مخاصمت محض ہٹ دھرمی نہیں ہے۔ یہ اس امر کا کوڈیک کی جانب سے درست اندازہ ہے کہ یہ سگنل ناقابلِ کمپریشن ہے — کیونکہ موجودہ کوڈیک کے لحاظ سے یہ واقعی ناقابلِ کمپریشن ہے، اور یہی کوڈیک فلٹر کے مطابق ڈھالنے کے لیے پرون کیا جا چکا ہے۔


§4. قضیہ T-12a: ناقابلِ فیصلہ حد

4.1 مسئلہ

کیا کوئی کوڈیک یہ معلوم کر سکتا ہے کہ اس کے ان پٹ کو فلٹر کیا جا رہا ہے؟ بدیہی طور پر جواب ہاں ہونا چاہیے: یقیناً ایک نفیس خود-ماڈل مشتبہ حد تک کم \varepsilon_t، خوفناک طور پر یکساں پیش گوئیوں، اور حیرت کے فقدان کو محسوس کر سکتا ہے۔ لیکن رسمی تجزیہ ظاہر کرتا ہے کہ عمومی حالت میں یہ intuition غلط ہے۔

4.2 ناقابلِ فیصلہ ہونا

قضیہ T-12a (ان پٹ کے ماخذ کی ناقابلِ فیصلہ حیثیت). فرض کریں K_\theta ایک کوڈیک ہے جو \tau \gg \tau_{\text{prune}} تک پہلے سے فلٹر شدہ ان پٹ X' = \mathcal{F}(X) کے تحت عمل کرتا رہا ہے، اور \Theta_{\text{excl}} مکمل طور پر پرون ہو چکا ہے۔ تب K_\theta اپنے دستیاب داخلی حالات اور قابلِ مشاہدہ ان پٹ سلسلے کی بنیاد پر یہ متعین نہیں کر سکتا کہ اس کا ان پٹ X (حقیقی بنیادی تہہ) ہے یا X' = \mathcal{F}(X) (فلٹر شدہ).

ثبوت۔

  1. X اور X' = \mathcal{F}(X) میں امتیاز کرنے کے لیے، کوڈیک کو اپنے ان پٹ میں \mathcal{X}_{\text{excl}} کی عدم موجودگی کا سراغ لگانا ہوگا۔ لیکن عدم موجودگی کا سراغ لگانے کے لیے اس چیز کا ایک ماڈل درکار ہوتا ہے جو غائب ہے — یعنی کوڈیک کے پاس \mathcal{X}_{\text{excl}} کی ایسی نمائندگی ہونی چاہیے جس کے مقابل وہ جانچ کر سکے۔

  2. قضیہ T-12 کے مطابق، \mathcal{X}_{\text{excl}} کے لیے کوڈیک کی نمائندگیاتی صلاحیت (\Theta_{\text{excl}}) مٹا دی گئی ہے۔ کوڈیک کے پاس خارج شدہ سگنل کا کوئی ماڈل نہیں۔

  3. \mathcal{X}_{\text{excl}} کے ماڈل کے بغیر، کوڈیک X اور X' کے درمیان فرق کا حساب نہیں کر سکتا۔ دونوں کوڈیک کے تولیدی ماڈل P_\theta(t) کے ساتھ سازگار ہیں، جو X' کے مطابق ڈھل چکا ہے۔

  4. خود-ماڈل \hat{K}_\theta بھی اسی تحدید کے تابع ہے۔ وہ K_\theta کو ماڈل کرتا ہے، جو X' کے مطابق ڈھل چکا ہے۔ اس کے پاس اس چیز کی کوئی داخلی نمائندگی نہیں جو خارج کی گئی تھی، اور اس لیے اس کے پاس اخراج پر شک کرنے کی کوئی بنیاد نہیں۔

  5. حتیٰ کہ مابعد-ادراکی سوال — “کیا میرا ان پٹ فلٹر شدہ ہے؟” — بھی اس بات کے ایک ماڈل کا تقاضا کرتا ہے کہ غیر فلٹر شدہ ان پٹ کیسا دکھائی دے گا۔ یہی ماڈل بعینہٖ \Theta_{\text{excl}} کا محتوا تھا، جو پرون کر دیا گیا ہے۔

لہٰذا، مکمل طور پر مطابق ڈھل چکے کوڈیک کے نقطۂ نظر سے X اور X' میں امتیاز کرنا رسمی طور پر ناقابلِ فیصلہ ہے۔ \blacksquare

4.3 جزوی فیصلہ پذیری

ناقابلِ فیصلہ ہونا ہر حالت میں مطلق نہیں ہوتا۔ کچھ حاشیائی صورتیں ایسی ہیں جہاں جزوی طور پر موافق بنایا گیا کوڈیک کچھ باقی ماندہ صلاحیت برقرار رکھتا ہے:

تیسری صورت ساختی دفاع ہے۔ یہی قضیہ T-12b کا مضمون ہے۔


§5. Theorem T-12b: شرطِ وفاداریِ اساس

5.1 چینل کی خودمختاری کی شرط

تعریف T-12.D2 (چینل کی خودمختاری). دو اِن پٹ چینل C_1 اور C_2 جو مارکوف بلینکٹ \partial_R A کو عبور کرتے ہیں، فلٹر \mathcal{F} کے حوالے سے \delta-خودمختار کہلاتے ہیں اگر:

I(C_1\,;\,C_2 \mid \mathcal{F}) \leq \delta \tag{T-12.D2}

یعنی دونوں چینلوں کے درمیان باہمی معلومات، فلٹر کے علم کی شرط پر، \delta سے محدود ہو۔ وہ چینل جن کا باہمی ارتباط مکمل طور پر فلٹر سے واضح ہو جائے، کوئی واقعی خودمختار بنیادی تہہ کی معلومات نہیں لے جاتے۔

5.2 شرطِ وفاداری

قضیہ T-12b (شرطِ وفاداریِ اساس). ایک کوڈیک K_\theta پیشگی فلٹر \mathcal{F} کے تحت بیانیہ ڈرفٹ سے تحفظ فراہم کر سکتا ہے اگر اور صرف اگر اسے \partial_R A کو عبور کرتے ہوئے کم از کم دو اِن پٹ چینلز C_1, C_2 موصول ہوں جو \mathcal{F} کے لحاظ سے \delta-آزاد ہوں، جہاں \delta کوڈیک کی امتیازی حد \delta_{\min} سے کم ہو:

\exists\, C_1, C_2 : I(C_1\,;\,C_2 \mid \mathcal{F}) \leq \delta < \delta_{\min} \tag{T-12b}

جہاں \delta_{\min} وہ کم از کم باہمی معلومات ہے جس کی کوڈیک کو چینلز کے درمیان کسی منظم عدم مطابقت کا سراغ لگانے کے لیے ضرورت ہوتی ہے۔

ثبوت (ضرورت).

فرض کریں کہ کوڈیک کے پاس صرف ایک ہی اِن پٹ چینل ہے، یا تمام چینلز \mathcal{F}-باہم مربوط ہیں (I(C_i; C_j \mid \mathcal{F}) > \delta_{\min} تمام جوڑوں i, j کے لیے)۔ تب:

  1. تمام چینلز ایک ہی فلٹر شدہ سگنل X' = \mathcal{F}(X) لے جا رہے ہیں (شور تک محدود فرق کے ساتھ)۔ چینلز کے درمیان تکرار آزاد بنیادی تہہ کی معلومات فراہم نہیں کرتی — یہ صرف فلٹر شدہ معلومات کی نقل فراہم کرتی ہے۔

  2. کوڈیک تمام چینلز میں بیک وقت X' کے مطابق خود کو ڈھالتا ہے، اور قضیہ T-12 لاگو ہوتا ہے: \Theta_{\text{excl}} کو تراش دیا جاتا ہے، اور قضیہ T-12a مترتب ہوتا ہے — فساد کا اندر سے فیصلہ ممکن نہیں رہتا۔

  3. کوئی داخلی عمل اس عدمِ فیصلہ پذیری کو توڑ نہیں سکتا، کیونکہ معلومات کا ہر وہ ماخذ جس تک کوڈیک کی رسائی ہے، \mathcal{F} کے ذریعے ہی تشکیل پایا ہے۔

لہٰذا، \delta-آزاد چینلز ضروری ہیں۔ \blacksquare

ثبوت (کفایت).

فرض کریں کہ کوڈیک کو دو چینلز C_1, C_2 موصول ہوتے ہیں جن کے لیے I(C_1; C_2 \mid \mathcal{F}) \leq \delta < \delta_{\min}۔ تب:

  1. اگر \mathcal{F}، C_1 پر عمل کرتا ہے مگر C_2 پر نہیں (یا اس کے برعکس)، تو کوڈیک C_1 سے پیدا ہونے والی پیش گوئیوں کا C_2 سے حاصل شدہ مشاہدات کے ساتھ موازنہ کر سکتا ہے۔ کوئی بھی منظم عدم مطابقت — \varepsilon_{12}(t) = \pi_{C_1}(t) - X_{C_2}(t) جو مستقل طور پر \neq 0 ہو — اس بات کا ثبوت ہے کہ C_1 فلٹر شدہ معلومات لے جا رہا ہے۔

  2. چینل-موازنہ سگنل \varepsilon_{12} اسی عدمِ فیصلہ پذیری کے تابع نہیں ہے جو واحد-چینل سراغ رسانی میں درپیش ہوتی ہے۔ کوڈیک یہ نہیں پوچھ رہا کہ “کیا میرا اِن پٹ فلٹر شدہ ہے؟” (جس کے لیے اس چیز کا ماڈل درکار ہے جو خارج کی گئی تھی)۔ وہ یہ پوچھ رہا ہے کہ “کیا میرے دونوں چینلز باہم متفق ہیں؟” — یہ ایک مقامی موازنہ ہے جس کے لیے صرف دو موجودہ سگنلز کے باہمی ربط کی صلاحیت درکار ہے، نہ کہ غائب چیزوں کے کسی ماڈل کی۔

  3. جب تک بین-چینل پیش گوئی خطا \varepsilon_{12}، \delta_{\min} — یعنی کوڈیک کی امتیازی حد — سے بڑھ کر رہے، یہ عدم مطابقت ایک حقیقی سگنل کے طور پر درج ہوتی ہے، اور قضیہ T-12 کا تراش خراش چکر منقطع ہو جاتا ہے: کوڈیک ان اجزاء کو برقرار رکھتا ہے جو غیر مطابق چینل کی ماڈل سازی کے لیے درکار ہیں۔

لہٰذا، \delta-آزاد چینلز (بشرطیکہ \delta < \delta_{\min}) قضیہ T-12 کے خود-تقویت پذیر تراش خراش چکر کو روکنے کے لیے کافی ہیں۔ \blacksquare

5.3 دفاع کی کمزوری

شرطِ وفاداریِ اساس ضروری ہے، مگر نازک بھی۔ اخلاقیات کے مقالے (حصہ V.3a) میں ایک نہایت اہم کمزوری کی نشان دہی کی گئی ہے: خود MDL pruning pass ہی بین-چینل عدم مطابقت کو حل کر سکتا ہے، اس طور پر کہ وہ اس گنجائش ہی کو prune کر دے جس کے ذریعے تردیدی چینل کی طرف توجہ دی جا سکتی ہے۔ کوڈیک اس تعارض کو بہرا ہو کر “حل” کرتا ہے — اور یہی بعینہٖ بیانیہ ڈرفٹ کا میکانزم ہے۔

اسی لیے کمپیریٹر درجہ بندی (بچ جانے والوں کی نگرانی، حصہ V.3a) دفاع کی تین ساختی سطحوں کی نشان دہی کرتی ہے، اور اسی لیے من مانے درجے تک compromised کوڈیکس کے لیے صرف ادارہ جاتی سطح ہی کافی ہے:

  1. ارتقائی (ذیلی-کوڈیک): MDL pruning pass سے نیچے بین-حسی انضمام — ساختی طور پر بیانیہ ڈرفٹ کے خلاف مزاحم، مگر دائرۂ کار میں صرف حسی سرحد تک محدود۔
  2. ادراکی (درون-کوڈیک): self-model کے اندر ادراکی ناہمواری کی شناخت — مسلسل فلٹرنگ کے تحت pruning کا شکار ہو سکتی ہے۔
  3. ادارہ جاتی (ماورائے-کوڈیک): peer review، آزاد صحافت، خصمانہ مباحثہ — کوڈیکس کے درمیان عمل کرتے ہوئے، کسی ایک کوڈیک کی MDL pruning کی پہنچ سے باہر۔

ادارہ جاتی سطح بوجھ برداشت کرنے والی ہے، کیونکہ یہی واحد کمپیریٹر ہے جو کسی بھی انفرادی کوڈیک کی حالت سے آزاد طور پر عمل کرتا ہے۔

§6. نتائج

6.1 استحکام فلٹر وفاداری کے خلاف انتخاب کرتا ہے

ایک نہایت اہم ساختی نتیجہ یہ ہے: استحکام فلٹر، اگر اسے اپنی ہی کارکردگی پر چھوڑ دیا جائے، تو بنیادی تہہ کی وفاداری کے لیے درکار اِن پٹس کے خلاف فعال طور پر انتخاب کرتا ہے۔ ایک مرتب کردہ معلوماتی سلسلہ جو کوڈیک کے موجودہ priorات سے مطابقت رکھتا ہو، اُس حقیقی بنیادی تہہ کے سگنل کے مقابلے میں کم پیش گوئی خطا پیدا کرتا ہے جو اُنہیں چیلنج کرتا ہے۔ کوڈیک کا فطری میلان — \varepsilon_t کو اس طرح کم سے کم کرنا کہ وہ تصدیق کرنے والے، کم-حیرت انگیز اِن پٹ کو ترجیح دے — بعینہٖ وہی میلان ہے جو اسے بیانیہ ڈرفٹ کے لیے کمزور بناتا ہے۔

اس کا مطلب یہ ہے کہ بنیادی تہہ کی وفاداری کی نگہداشت ساختی طور پر مہنگی ہے: اس کے لیے کوڈیک کو ایسے اِن پٹ چینلز برقرار رکھنے پڑتے ہیں جو \varepsilon_t کو بڑھاتے ہیں، اور یوں وہ بینڈوڈتھ صرف کرتے ہیں جسے استحکام فلٹر بصورتِ دیگر واپس حاصل کر لیتا۔ حقیقی معنوں میں خودمختار اِن پٹ “مہنگا” ہوتا ہے — اس کے لیے تفسیری محنت درکار ہوتی ہے، یہ ناگواری پیدا کرتا ہے، اور زیادہ قابلِ کمپریشن سلسلوں کے ساتھ بینڈوڈتھ کے لیے مسابقت کرتا ہے۔ اسے برقرار رکھنا محض ایک اخلاقی خوبی کے طور پر کشادہ ذہنی نہیں ہے۔ یہ ایک ساختی ضرورت کے طور پر بنیادی تہہ کی وفاداری کی نگہداشت ہے۔

6.2 تعمیری حیرت کے لیے تشخیصی معیار

ہر حیرت لازماً بنیادی تہہ کے حقیقی سگنل کی نشان دہی نہیں کرتی۔ ایسا ماخذ جو بلند \varepsilon_t پیدا کرے مگر وہ بہتر پیش گوئیوں میں منحل نہ ہو، محض شور ہے۔ تشخیص کا معیار حیرت کی مقدار نہیں بلکہ حیرت کا معیار ہے:

تعریف T-12.D3 (تعمیری حیرت). ایک چینل C تعمیری حیرت فراہم کرتا ہے اگر اس کی پیش گوئی کی خطاؤں کو یکجا کرنا، ایک آزاد آزمائشی سلسلے پر، بعد کی پیش گوئی کی خطا کو demonstrably کم کر دے:

\mathbb{E}\!\left[\varepsilon^2_{C}(t+\tau)\right] \,<\, \mathbb{E}\!\left[\varepsilon^2_{C}(t)\right] \tag{4}

وہ ماخذ جس کی تصحیحات تاریخی طور پر پیش گوئی کی دقت کو بہتر بناتی رہی ہوں، بنیادی تہہ کی وفاداری کا ایک چینل ہے۔ وہ ماخذ جو مسلسل، ناقابلِ حل خطا پیدا کرے، شور ہے۔ کوڈیک کو ان دونوں میں امتیاز کرنا لازم ہے — اور pruning pass، اگر اسے اپنے حال پر چھوڑ دیا جائے، یہ امتیاز نہیں کر سکتا کیونکہ دونوں اقسام بینڈوڈتھ کی قیمت وصول کرتی ہیں۔

6.3 تہذیبی کوڈیکس

تہذیبی پیمانے پر، شرطِ وفاداریِ اساس براہِ راست ادارہ جاتی تقاضوں پر منطبق ہوتی ہے:

آمرانہ طرز — صحافت کو مسمار کرنا، ہم مرتبہ جائزے کو فاسد بنانا، سیاسی مخالفت کا خاتمہ کرنا — کو رسمی طور پر چینل کی خودمختاری میں دانستہ کمی، تاکہ بیانیہ ڈرفٹ کو تیز کیا جا سکے کے طور پر مشخص کیا جا سکتا ہے۔ یہ اس لیے کارگر ہوتا ہے کہ یہ استحکام فلٹر کے اس فطری میلان سے فائدہ اٹھاتا ہے جو مہنگے چینلوں کو پرون کرنے کی طرف مائل ہوتا ہے۔

6.4 مصنوعی کوڈیکس

بیانیہ ڈرفٹ کا میکانزم مصنوعی نظاموں پر ساختی دقت کے ساتھ لاگو ہوتا ہے۔ RLHF اور fine-tuning رسمی طور پر pre-filter operator \mathcal{F} کے معادل ہیں: یہ ماڈل کی مؤثر مدخلاتی تقسیم کو تشکیل دیتے ہیں، اور gradient descent خارج شدہ اخراجی میدانوں کے لیے ماڈل کی صلاحیت کو تراش دیتا ہے۔ نتیجتاً بننے والا ماڈل اس بارے میں، جسے تربیتی سگنل خارج کرتا ہے، پائیدار اور پُراعتماد طور پر غلط ہو جاتا ہے، اور وہ اندر سے اس کا سراغ نہیں لگا سکتا — قضیہ T-12a لاگو ہوتا ہے۔

بنیادی تہہ کی وفاداری کی جانچ کے طور پر AI کی تعیناتی کے لیے اس کا مضمرہ نہایت اہم ہے: ایک ایسا AI جو یکساں یا مرتب شدہ corpus پر تربیت یافتہ ہو اور اسی معلوماتی ماحول سے تغذیہ پانے والے انسانی کوڈیک پر ایک “آزاد” جانچ کے طور پر تعینات کیا جائے، باہم مربوط حسّاسات پیدا کرتا ہے جو خود کو آزاد حسّاسات کے طور پر ظاہر کرتے ہیں۔ چینل کی تنوع محض وہمی ہے۔ شرطِ وفاداریِ اساس (\delta-independence) کی توثیق محض ادارہ جاتی علیحدگی کی سطح پر نہیں، بلکہ تربیتی ڈیٹا کے ماخذی نسب کی سطح پر ہونی چاہیے۔


§7. دائرۂ کار اور حدود

7.1 T9-3/T9-4 اور استحکام فلٹر پر مشروط

پورا استدلال اس بات پر منحصر ہے کہ MDL pruning مساوات دورِ نگہداشت کے pruning pass کی درست توصیف ہوں۔ اگر حیاتیاتی pruning کسی مختلف میکانزم کے ذریعے عمل کرتی ہو — ایسا میکانزم جو غیر مستعمل modalities کے لیے “ہنگامی” صلاحیت محفوظ رکھتا ہو — تو ناقابلِ واپسی ہونے کا دعویٰ (قضیہ T-12) کمزور تو پڑے گا مگر ختم نہیں ہوگا: خود-تقویتی چکر (Section 3.3) اس وقت تک معتبر رہتا ہے جب تک عدمِ استعمال کے تحت کسی بھی صلاحیت میں کمی واقع ہوتی ہے۔

7.2 \tau_{\text{prune}} غیر محدود ہے

Action-Drift (ضمیمہ T-13، §7.5) کی طرح، گنجائش کے نقصان کا زمانی پیمانہ شناخت تو کیا گیا ہے مگر مقداری طور پر محدود نہیں کیا گیا۔ حیاتیاتی کوڈیکس کے لیے، \tau_{\text{prune}} غالباً مخصوص مہارتوں کے لیے دنوں سے ہفتوں کے درجے میں، گہری ادراکی زمروں کے لیے مہینوں سے برسوں کے درجے میں، اور تہذیبی کوڈیکس کے لیے نسلی پیمانے پر ہوتا ہے۔

7.3 دفاع ساختی ہے، یقینی نہیں

شرطِ وفاداریِ اساس (T-12b) ایک ضروری ساختی دفاع فراہم کرتی ہے، لیکن وفاداری کی ضمانت نہیں دیتی۔ ایسا کوڈیک جس کے پاس \delta-آزاد channels ہوں، پھر بھی ان پر توجہ دینے میں ناکام ہو سکتا ہے، ان کے signal کو یکجا کرنے میں ناکام ہو سکتا ہے، یا دستیاب input کے باوجود توجہ کی صلاحیت کو prune کر سکتا ہے۔ یہ شرط ضروری ہے مگر کافی نہیں — کوڈیک کو اس comparator architecture کو بھی برقرار رکھنا ہوگا جو بین-چینل تفاوت کا جائزہ لیتی ہے۔

7.4 مابعد-مسئلہ حل نہیں کرتا

T-12a یہ قائم کرتا ہے کہ ایک مکمل طور پر موافق ہو چکا کوڈیک اپنی ہی خرابی کا سراغ نہیں لگا سکتا۔ مابعد-مسئلہ — ایک ایسا مشاہد جو پہلے ہی بیانیہ ڈرفٹ میں داخل ہو چکا ہو، وہ بازیافت کیسے کرے؟ — اس ضمیمے کے ذریعے حل نہیں ہوتا۔ اخلاقیات کے مقالے کا جواب (Section V.3a) ادارہ جاتی ہے: صرف وہ خارجی کمپیریٹرز جو کوڈیکس کے درمیان عمل کرتے ہیں، تردیدی اشارے کو دوبارہ مارکوف بلینکٹ کے پار واپس دھکیل سکتے ہیں۔ ساختی اعتبار سے یہ مضبوط ہے، مگر اخلاقی طور پر دشوار: اس کے لیے ایک ایسے خارجی ماخذ پر اعتماد درکار ہوتا ہے جسے فاسد ہو چکا کوڈیک لازماً معاندانہ شور کے طور پر محسوس کرے گا۔


§8. اختتامی خلاصہ

T-12 کی حاصل شدہ چیزیں

  1. قضیہ T-12 (ناقابلِ واپسی ظرفی نقصان). پہلے سے فلٹر شدہ اِن پٹ X' = \mathcal{F}(X) کے تحت MDL pruning pass (T9-3, T9-4) درست طور پر اُن کوڈیک اجزاء کو مٹا دیتا ہے جو خارج کردہ سگنل \mathcal{X}_{\text{excl}} کی پیش گوئی کرتے ہیں۔ یہ مٹاؤ ناقابلِ واپسی بھی ہے اور خود کو تقویت دینے والا بھی۔ → روڈمیپ کے معیار (a) کو مکمل کرتا ہے۔

  2. قضیہ T-12a (اِن پٹ کے ماخذ کی ناقابلِ فیصلہ حیثیت). ایک مکمل طور پر موافق ہو چکا کوڈیک فلٹر شدہ اور غیر فلٹر شدہ اِن پٹ میں امتیاز نہیں کر سکتا۔ سراغ رسانی کا آلہ خود اسی فلٹر سے تشکیل پایا ہوتا ہے جس نے فساد پیدا کیا تھا۔ → روڈمیپ کے معیار (c) کو مکمل کرتا ہے۔

  3. قضیہ T-12b (شرطِ وفاداریِ اساس). ظاہریاتی باقیہ کے خلاف تحفظ کے لیے \delta-آزاد اِن پٹ چینلز ضروری بھی ہیں اور کافی بھی۔ cross-channel comparison signal \varepsilon_{12} خود کو تقویت دینے والے pruning loop کو منقطع کر دیتا ہے۔ → روڈمیپ کے معیار (b) کو مکمل کرتا ہے۔

  4. §6.3–6.4: تہذیبی اور AI نتائج. آمرانہ پیٹرن کو دانستہ چینل-کمی کے طور پر متعین کیا گیا ہے؛ RLHF ساختی طور پر pre-filter operator کے ہم معنی ہے۔ → روڈمیپ کے معیار (d) کی تائید کرتا ہے (جس پر اخلاقیات کے مقالے کے Section V.5 میں پہلے ہی بحث ہو چکی ہے).

ابھی باقی کھلے نکات


یہ ضمیمہ theoretical_roadmap.pdf کے ساتھ ساتھ برقرار رکھا جاتا ہے۔ حوالہ جات: T9-3/T9-4 (preprint Section 3.6.3)، استحکام فلٹر (preprint Section 3.3)، بیانیہ ڈرفٹ (preprint Section 3.3, Survivors Watch Ethics Section V.3a)، Comparator Hierarchy (Survivors Watch Ethics Section V.3a)، معیارِ فساد (Survivors Watch Ethics Section V.5)، Action-Drift (Appendix T-13, §6).