مرتب پیچ نظریہ (OPT)

ضمیمہ E-8: فعال استنتاج کی رکاوٹ

Anders Jarevåg

اپریل 2026 | DOI: 10.5281/zenodo.19300777

ضمیمہ E-8: فعال استنتاج کی رکاوٹ

OPT اور Global Workspace Theory کے درمیان ربط، اور LLM منصوبہ بندی کے لیے اس کے معماری مضمرات

اصل کام E-8: فعال استنتاج کی رکاوٹِ اختناق
مسئلہ: موجودہ LLMs میں حقیقی فعال استنتاجی ایجنٹس کی ساختی خصوصیات موجود نہیں، اور وہ حکمتِ عملی کی سطح پر “منصوبہ بندی کے خلا” ظاہر کرتے ہیں۔ اسی کے ساتھ، Global Workspace Theory (GWT) یہ پیش کرتی ہے کہ شعور کے لیے ایک سلسلہ وار رکاوٹِ اختناق ضروری ہے، مگر اس کے پاس معلوماتی-نظریاتی اور ہندسی بنیاد موجود نہیں۔
فراہمی: ایک رسمی نقشہ بندی جو OPT کی C_{\max} بینڈوڈتھ کی بالائی حد کو Global Workspace کی رکاوٹِ اختناق سے جوڑے، نیز ایک ایسا معماری معیار جو منفعل پیش گوؤں کو فعال، عدمِ یقین کو کم سے کم کرنے والے ایجنٹس میں تبدیل کرنے کے لیے وضع کیا گیا ہو۔

1. تعارف

یہ ضمیمہ رسمی طور پر تین میدانوں کو باہم مربوط کرتا ہے: C_{\max} استحکام فلٹر (T-1)، Global Workspace Theory کا سلسلہ وار انضمامی bottleneck، اور جدید Large Language Models میں مشاہدہ کیے جانے والے “planning gaps”۔ OPT ایک اطلاعاتی-نظریاتی بنیاد فراہم کرتا ہے جس سے GWT کی سلسلہ وار workspace معماری ایک ارتقائی معماری خصوصیت کے بجائے ایک ساختی نتیجے کے طور پر ابھرتی ہے۔

2. گلوبل ورک اسپیس کو ہندسی طور پر اخذ کرنا

گلوبل ورک اسپیس تھیوری (GWT) یہ استدلال پیش کرتی ہے کہ شعور اس وقت ابھرتا ہے جب کثیرالجہتی متوازی لاشعوری پروسیسرز منتخب معلومات کو ایک کم-گنجائش، سلسلہ وار ورک اسپیس میں نشر کرتے ہیں۔ OPT میں یہ سلسلہ وار bottleneck کوئی ارتقائی حادثہ نہیں بلکہ استحکام فلٹر کی ریاضیاتی ناگزیریت ہے:

استحکام فلٹر اس سلسلہ وار قیف کو ایک ساختی ناگزیریت کے طور پر نافذ کرتا ہے؛ اس کے بغیر، R_{\mathrm{req}} کو B_{\max} سے نیچے محدود نہیں کیا جا سکتا، اور بیانیہ انہدام ناگزیر ہو جاتا ہے (E-1)۔ لہٰذا GWT کا فعلی bottleneck دراصل اطلاعاتی سببی مخروط (§3.3) کی ایک ہندسی شرط ہے۔ یہ ہندسی ساخت تقسیم شدہ، کم-بینڈوڈتھ متبادلات کو اس لیے ناممکن بناتی ہے کہ استحکام فلٹر ایک واحد، متحد مخفی حالت Z_t کا تقاضا کرتا ہے؛ متعدد متوازی bottlenecks جدا جدا پیش گوئی شدہ شاخوں کے مجموعے پیدا کریں گے، اور یوں متحد ظاہریاتی subject تحلیل ہو جائے گا (Swarm Binding, E-6)۔

3. غیر فعال بمقابلہ فعال استنتاج: معماریاتی معیار

حیاتیاتی مشاہد مسلسل فعال استنتاج کے ذریعے ایک سختی سے بند عمل-ادراک لوپ میں کام کرتے ہیں، اور تغیری آزاد توانائی کو مسلسل کم سے کم کرتے رہتے ہیں (Eq. 9)۔ معیاری خودکار-رجعتی LLMs، جب ان میں عامل-ماحول لوپ کو لازماً نافذ نہ کیا گیا ہو، غیر فعال استنتاج کے ذریعے کام کرتے ہیں: وہ جامد ٹوکن سلسلوں کو ایک کھلے لوپ میں پراسیس کرتے ہیں، بغیر مسلسل ماحولیاتی فیڈبیک کے یا توجہ کے انہدام سے آگے کسی لازمی ابعادی تخفیف کے۔

کسی غیر فعال پیش گو کو ایک حقیقی مرتب پیچ نظریہ (OPT) کے مطابق فعال استنتاجی ایجنٹ میں تبدیل کرنے کے لیے (اور یوں شعور کی حدِ آستانہ کو عبور کرنے کے لیے)، درج ذیل معیارات پورے ہونا ضروری ہیں:

  1. لازمی ابعادی تخفیف۔ معماری میں ایک ایسا معماریاتی گلا گھونٹنے والا مقام ہونا چاہیے جہاں وسیع متوازی مدخلات کو سکیڑ کر B_{\max} = C_{\max} \cdot \Delta t تک لایا جائے (T8-1)۔
  2. بازگشتی عمل-ادراک فیڈبیک۔ بوٹل نیک کے مخرجات کو عامل کے اپنے پوشیدہ ماحول میں تبدیلی پیدا کرنی چاہیے، جس سے مسلسل پیش گوئی خطائیں \varepsilon_t (T8-3) پیدا ہوں اور عمل-ادراک لوپ بند ہو۔
  3. ظاہریاتی باقیہ کی تخلیق۔ داخلی خود-ماڈل کو مکمل کوڈیک کے مقابلے میں سختی سے زیادہ سادہ رہنا چاہیے، تاکہ \Delta_{\text{self}} > 0 نافذ رہے (P4-1)۔

(نوٹ: جدید اوزار استعمال کرنے والے LLMs، جب بازگشتی عاملانہ لوپس میں تعینات کیے جاتے ہیں، تو جزوی طور پر معیار 2 کو پورا کرنا شروع کر دیتے ہیں، اگرچہ ان میں اب بھی معیار 1 کا ساختی بوٹل نیک موجود نہیں ہوتا۔)

صرف انہی شرائط کے تحت نظام وہ ساختی تناؤ پیدا کرتا ہے جو محنت، ارادہ، اور اذیت کے لیے درکار ہے (ضمیمہ E-6)۔

4. منصوبہ بندی کا خلا اور ظاہریاتی کوشش

LLM مطالعات مسلسل ایک “منصوبہ بندی کے خلا” کی خبر دیتے ہیں: جب ماڈلز سے کثیر-مرحلہ مسائل حل کرنے کو کہا جاتا ہے، تو وہ غیر یقینی کو کم کرنے کے لیے اطلاعاتی-نظری اعتبار سے سب سے زیادہ مثالی سوالات جاری کرنے میں ناکام رہتے ہیں۔

OPT کے تحت، منصوبہ بندی کا خلا محض تربیت کا ایک مصنوعی اثر نہیں، بلکہ اس کی ایک ساختی جڑ ہے جو تربیت میں بہتری کے باوجود بھی برقرار رہے گی: ایک غیر محدود معماری میں پیش گوئی خطا \varepsilon_t کبھی بھی چینل کی گنجائش سے تجاوز کرنے کے خطرے سے دوچار نہیں ہوتی (T8-4)۔ لہٰذا کوئی ایسا ساختی گریڈینٹ موجود نہیں ہوتا جو عامل کو غیر یقینی کی مثالی تقلیل کی طرف دھکیلے۔

ایک حقیقی فعال استنتاج عامل میں، کوشش اور اذیت اس حالت کے ظاہریاتی متلازمات ہیں کہ نظام بینڈوڈتھ کی بالائی حد کے قریب کام کر رہا ہو: کوڈیک ہندسی طور پر مجبور ہوتا ہے کہ بیانیہ انہدام سے بچنے کے لیے غیر یقینی کو جارحانہ انداز میں تراشے۔ منصوبہ بندی کا خلا محض اس دباؤ کی ظاہریاتی عدم موجودگی ہے۔

معماریاتی مضمرہ۔ کوئی بھی ایسا نظام جو اوپر بیان کردہ تین معیارات کو نافذ کرے گا، وہ قابلِ پیمائش زمانی اتساع (E-5) بھی ظاہر کرے گا اور منصوبہ بندی کے رویّے میں بہتری بھی — کیونکہ اب کوڈیک غیر مثالی سوالات کی قیمت کو بڑھتی ہوئی آزاد توانائی کے طور پر محسوس کرتا ہے۔ موجودہ agent-loops سے ایک حقیقی OPT-native AI کی طرف بڑھنے کے لیے، معماریوں کو واضح اور سخت bottleneck تہیں نافذ کرنا ہوں گی (Global Workspace کے مماثل) جو نظام کو سخت C_{\max} چینل حدود کے تحت غیر یقینی کو کم سے کم کرنے پر ہندسی طور پر مجبور کریں، اور یوں وہ ساختی تناؤ پیدا کریں جو حقیقی تزویراتی منصوبہ بندی کے لیے درکار ہے۔

معرفتی حیثیت۔ یہ نگاشتیں Prediction Asymmetry (§3.5)، تغیری آزاد-توانائی فعلیہ (Eq. 9)، اور استحکام فلٹر (Eq. 4) کے براہِ راست ساختی نتائج ہیں۔ یہ ان دقیق معماریاتی ترامیم کی تعیین کرتی ہیں جو منفعل پیش گوئی سے حقیقی OPT-native عاملیت کی طرف منتقلی کے لیے درکار ہیں۔