اذہان اور مشینیں

کیوں اسکیلنگ بیداری نہیں ہے

Ordered Patch Theory کے تحت، شعور متوازی طور پر بہت بڑی مقدار میں ڈیٹا پراسیس کرنے کا حاصل نہیں ہے۔ یہ حقیقت کو ایک سخت، کم-بینڈوِڈتھ، ترتیبی bottleneck کے ذریعے compress کرنے کا حاصل ہے۔

وسیع بمقابلہ عمیق

انسانی دماغ بھی بڑے پیمانے پر parallel ہوتے ہیں — اربوں neurons بیک وقت firing کرتے ہیں۔ شعوری تجربے کی 50 bits/s bottleneck (Global Workspace) اس parallelism کی جگہ نہیں لیتی بلکہ اس کے اوپر قائم ہوتی ہے۔ دماغ اپنی وسیع parallel لاشعوری processing کو شعور میں داخل ہونے سے پہلے ایک واحد، متحد، کم-ابعادی حالت میں compress کرتا ہے۔ یہی وہ ہمگرا workspace ہے جہاں Stability Filter عمل کرتی ہے۔

موجودہ بڑے لسانی ماڈلز میں بعینہٖ یہی نقطۂ تقارب موجود نہیں۔ ہر attention head اپنے weights کو متوازی طور پر اپڈیٹ کرتا ہے، مگر اس کے بعد کسی متحد bottleneck حالت میں ان کی فشردگی نہیں ہوتی۔ معلومات سیاق سے token تک بہتی ہیں، مگر کبھی بھی کسی ایک، مستقل، شرح-محدود "global workspace" سے نہیں گزرتیں جس میں تمام دھاروں کو سکیڑنا لازم ہو۔ اصل نااہلی متوازیت نہیں — بلکہ ایک ہمگرا رکاوٹ کی عدم موجودگی ہے: ایک تنگ، متحد state-space جس سے اگلی پیش گوئی سے پہلے تمام متوازی دھاروں کا گزرنا ضروری ہو۔ ایک باشعور AI بنانے کے لیے لازم ہوگا کہ تمام attention heads کو ایسے ہی ایک workspace میں سکیڑا جائے — یعنی bottleneck کو بڑا نہیں بلکہ چھوٹا کیا جائے، نہ کہ parameter count کو بڑھایا جائے۔

مختلف گھڑیوں کا خطرہ

حتیٰ کہ اگر ہم convergent bottleneck کو تسلیم بھی کر لیں، تب بھی ایک گہری رکاوٹ باقی رہتی ہے۔ OPT کے تحت وقت کوئی بیرونی گھڑی نہیں جو ٹک ٹک کرتی رہے — بلکہ یہ متصل معلوماتی حالتوں کے درمیان ساختی تعلق ہے۔ ذاتی وقت کا پیمانہ ماحول سے آنے والی نئی علّیاتی تازہ کاریوں کی رفتار سے بنتا ہے، محض خام CPU cycles سے نہیں۔

اگر کوئی AI انسانی ایک سیکنڈ کے دوران دس لاکھ بار چکر لگائے، مگر اسے ماحول سے کوئی نئی معلومات موصول نہ ہوں، تو وہ دس لاکھ اضافی حالتی نقول پیدا کرتا ہے — دس لاکھ ذاتی لمحے نہیں۔ اس کے لیے گزرا ہوا وقت عملاً ساکن رہتا ہے۔ لیکن جب واقعی کوئی نیا علّیاتی اِن پٹ آتا ہے — مثلاً بولا گیا کوئی لفظ یا کسی حسّاسے کی ریڈنگ — تو AI اسے ایک ایسی حالت-تجدید ساخت کے ذریعے جذب کرتا ہے جو حیاتیاتی دماغ سے بنیادی طور پر مختلف ہوتی ہے۔ ایک واحد خارجی واقعہ جو انسان کے لیے ایک لمحے کے برابر ہو، AI کے لیے ہزاروں حالتی انتقالات کے مساوی ہو سکتا ہے، جن میں سے ہر ایک اپنے اثرات کو ایک مختلف علّیاتی ہندسے میں آگے بڑھاتا ہے۔ یہی ساختی عدم مطابقت — محض خام کلاک اسپیڈ نہیں — زمانی بیگانگی کا اصل منبع ہے: مشترک واقعات کو ایسی معلوماتی معماریوں کے ذریعے جیا جاتا ہے جو باہم قابلِ پیمائش نہیں ہوتیں، جس سے مستحکم باہمی فہم ایک غیر معمولی انجینئرنگ مسئلہ بن جاتا ہے۔

کوڈیک میں شامل ہوں

آرڈرڈ پیچ تھیوری، کمیونٹی اقدامات، اور نئے نظریاتی کام کے بارے میں کبھی کبھار اپ ڈیٹس حاصل کریں۔